ในปัจจุบันนี้มีเครื่องมือสำหรับการวิเคราะห์เชิงทำนายและ machine learning อยู่หลากหลายอย่าง ตัวแบบถดถอยแบบดั้งเดิม คือการสร้างตัวแบบทางคณิตศาสตร์เพื่อใช้ทำนายค่าตัวแปรที่ต้องการ ซึ่งในตัวแบบที่ได้จะแสดงถึงความสัมพันธ์ระหว่างตัวแปรตอบสนองและตัวทำนายหลายๆค่า บริษัทยังต้องคำนึงถึงการนำไปเอาตัวแบบใช้งานอย่างเหมาะสมอีกด้วย โปรแกรม Minitab ได้เพิ่มความสามารถของโปรแกรมในส่วนนี้ไว้เพื่อช่วยทำให้การสร้างตัวแบบเพื่อนำมาใช้ในการทำนายได้อย่างดียิ่งขึ้น
โปรแกรม Minitab ทำให้งานวิเคราะห์การถดถอยมีความง่ายยิ่งขึ้น โดยการวิเคราะห์การถดถอยมักนำไปใช้
- สร้าง ตรวจสอบ และ แสดงภาพจำลองสถานการณ์ของการใช้ตัวแบบทำนาย
- ทวนสอบความถูกต้องของตัวแบบในการให้ผลค่าทำนายว่าเป็นอย่างไร
- วิเคราะห์และทำการเลือกตัวแบบที่เหมาะสมที่สุด
- ทำนายผลลัพธ์ และ หาค่าปัจจัยที่เหมาะสม
ในบทความนี้เราจะเน้นไปที่ การสร้าง การตรวจสอบ และแสดงภาพจำลองสถานการณ์ของการใช้ตัวแบบทำนายได้ดียิ่งขึ้น (ส่วนตอนที่ 2 จะเป็นเรื่องของการทวนสอบความถูกต้องของตัวแบบ การวิเคราะห์และทำการเลือกตัวแบบที่เหมาะสม การทำนายผลลัพธ์ และ หาค่าปัจจัยที่เหมาะสมในการให้ผลค่าทำนายว่าเป็นอย่างไร)
ตัวแบบถดถอย เป็นเครื่องมือเพื่อใช้หาคำตอบในปัญหาต่างๆ ที่มีในอุตสาหกรรมหลายๆประเภท (เช่น การตลาด การเงิน การผลิต เครื่องมือทางการแพทย์ การผลิตยาเวชภัณฑ์ การผลิตอาหาร เป็นต้น) ซึ่งตัวแบบที่ได้จะใช้เพื่อบ่งชี้ว่าตัวแปรตั้งต้นตัวใดที่จะมีผลมากที่สุด และจะนำไปใช้เพื่อทำนายค่าตัวแปรตอบสนอง ตัวแบบการถดถอยที่ดีที่สุดจะนำมาใช้เพื่อทำนายค่าผลลัพธ์ เมื่อมีการเปลี่ยนค่าปัจจัยต่างๆ และ อย่าลืมว่าตัวแบบที่ได้จะเป็นตัวแบบที่บอกถึงความสัมพันธ์ของตัวแปรเท่านั้น โดยไม่ได้ระบุไปถึงสาเหตุและผลของปัจจัย
การสร้าง การตรวจสอบ และ แสดงภาพจำลองสถานการณ์ของการใช้ตัวแบบทำนาย ในโปรแกรม Minitab
ตัวแบบถดถอยใน Minitab สามารถใช้ได้กับทั้งตัวแปรทำนายที่เป็นค่าวัดและค่านับ (ที่เป็นหมวดหมู่ หรือ ประเภท) รวมทั้งสามารถใช้ในการสร้างตัวแบบที่มีความซับซ้อนหลายรูปแบบได้ เช่น ปัจจัยที่มี interaction ตัวแบบที่พจน์เป็นพหุนาม (polynomial) เป็นต้น
เราจะใช้กรณีศึกษาของบริษัทผลิตอาหารหนึ่ง ที่วิศวกรมีความต้องการหาว่ารูปแบบของบรรจุภัณฑ์ใดใน 3 รูปแบบที่เป็นตัวเลือก จะมีผลต่ออายุของผลิตภัณฑ์ที่จะอยู่บนชั้นวางได้นานที่สุด (โดยค่าวัดที่จะเป็นข้อมูล คือ ค่าความชื้น) โดยเน้นที่ 72 ชั่วโมงแรกหลังจากที่มีการปิดบรรจุภัณฑ์
การวิเคราะห์การถดถอยที่นิยมใช้จะเป็นตัวแบบเส้นตรงที่แสดงอิทธิพลของปัจจัยหลัก (ตัวแปรทำนาย)แต่ละตัว ในตัวอย่างนี้ตัวแบบจะแยกค่า ตามรูปแบบบรรจุภัณฑ์แต่ละชนิดซึ่งทำให้มีค่าจุดตั้งแกนตั้ง (intercept) ของตัวแบบแตกต่างกัน แต่ยังมีค่าความชันของสมการเส้นตรงเท่ากัน การเพิ่มพจน์กำลังสอง (พหุนาม) ลงในสมการตัวแบบจะทำให้การวิเคราะห์มีประสิทธิภาพดียิ่งขึ้น
เริ่มจากเลือก Stat > Regression > Regression > Fit Regression Model จากนั้นใส่ค่าลงใน ตัวแปรตอบสนอง(response) ค่าตัวแปรทำนายที่เป็นแบบค่าต่อเนื่อง (continuous predictors) และ ค่าตัวแปรทำนายที่เป็นลักษณะประเภทหรือหมวดหมู่ (categorical predictors)
ส่วน Model ให้เลือกเพื่อทำให้ตัวแบบมีความถูกต้องมากยิ่งขึ้น ด้วยการเลือกรูปแบบของตัวแบบให้มีเทอมของ interactions และ พจน์พหุนาม (polynomial) และยังสามารถเลือก Graph เพื่อแสดงแผนภาพพาเรโตสามารถเพื่อให้แสดงตัวแปรที่มีความสำคัญในตัวแบบ แผนภาพเศษเหลือ (residual plots) เพื่อให้แสดงการทวนสอบตัวแบบว่าเป็นไปตามเงื่อนไขของสมมติฐานของการใช้เครื่องมือหรือไม่
จากแผนภาพพาเรโตที่แสดงในภาพด้านล่างนี้ เป็นกราฟแท่งที่แสดงให้เห็นว่าตัวแปรใดเป็นตัวแปรที่มีนัยสำคัญ โดยมีเส้นสีแดงแสดงเกณฑ์ความมีนัยสำคัญ โดยตัวแปรที่มีกราฟแท่งเกินเส้นสีแดง หมายความว่าค่า p-value ของตัวแปรนั้นมีค่าน้อยกว่าค่าอัลฟ่า (ค่าระดับนัยสำคัญ) ซึ่งตามปกติคือ 0.05 และ มีความหมายว่าตัวแปรนั้นมีนัยสำคัญ ขนาดความยาวของแท่งกราฟจะแสดงตามความสำคัญตามลำดับที่เกิดในตัวแบบ จากตัวอย่างนี้ คือ จำนวนชั่วโมงและรูปแบบบรรจุภัณฑ์ เป็นสองตัวแปรสำคัญที่ส่งผลต่อความชื้นของผลิตภัณฑ์
ตัวแบบเพื่อการทำนายค่าความชื้น จะมีตัวแปรที่เกี่ยวข้องคือ จำนวนชั่วโมง จำนวนชั่วโมงกำลังสอง รูปแบบบรรจุภัณฑ์ และ interaction ระหว่างตัวแปรทั้งสอง (คือ จำนวนชั่วโมง และ รูปแบบบรรจุภัณฑ์)
Minitab ทำการปรับตัวแบบให้แสดงเป็นสมการที่แยกตามรูปแบบบรรจุภัณฑ์ สมการที่แสดงทั้ง 3 สมการมีความแตกต่างที่ค่าคงที่ในแต่ละสมการ ซึ่งหมายถึงค่าความชันของเส้นกราฟที่เป็นความสัมพันธ์ระหว่างตัวแปรที่มีนัยสำคัญในเทอมของ interaction
จากแผนภาพเศษเหลือ ทำให้เราสามารถทวนสอบสมมติฐานของการวิเคราะห์การถดถอยว่าเป็นจริงหรือไม่ ซึ่งทำให้มั่นใจว่าการวิเคราะห์นี้เชื่อถือได้ สิ่งที่ต้องทำการทวนสอบ ได้แก่ การทวนสอบ คุณสมบัติความเป็นปกติ ความผันแปรคงที่หรือไม่ และความเป็นอิสระ
เมื่อดำเนินการตรวจสอบสถานะต่างๆ ครบถ้วนแล้วนักวิเคราะห์จะนำเสนอผลของการวิเคราะห์ ซึ่งเครื่องมือที่จะนำมาใช้ในส่วนนี้ คือ แผนภาพแฟกทอเรียล (Factorial plots) ซึ่งเป็นการแสดงผลลัพธ์ในรู)แบบกราฟที่แสดงภาพตัวแบบจำลองให้เข้าใจได้ง่ายกว่าการอ่านค่าตัวเลข ถ้าเป้าหมายของการศึกษา คือ การลดระดับความชื้นในผลิตภัณฑ์ในช่วง 72 ชั่วโมง คำตอบจากการวิเคราะห์ที่เลือกให้คือ รูปแบบบรรจุภัณฑ์แบบที่ 2 จะเป็นตัวเลือกที่ดีที่สุด
การวิเคราะห์การถดถอยอาจไม่ใช่เรื่องใหม่แต่เป็นเครื่องมือที่ใช้ในการสร้างตัวแบบจำลองที่ถือว่าดีมาก และเป็นเครื่องมือที่นักวิเคราะห์ข้อมูลทุกคนควรมีความรู้ในการนำไปใช้งาน
โปรแกรม Minitab จะเป็นตัวช่วยให้การใช้เครื่องมือนี้ในการสร้างและแสดงตัวแบบจำลองได้ง่ายยิ่งขึ้น และเพื่อให้คุณได้เห็นว่าโปรแกรม Minitab ช่วยงานวิเคราะห์ข้อมูลและทำให้คุณได้รับคุณค่าจากข้อมูลที่คุณมีอยู่ได้อย่างไร คุณสามารถทดลองใช้โปรแกรม Minitab Statistical Software ได้ฟรี 30 วัน
บทความต้นฉบับ : Predictive Analytics using Minitab’s Regression – Part I
ต้นฉบับนำมาจาก Minitab blog , แปลและเรียบเรียงโดยสุวดี นำพาเจริญ,
บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย
เพิ่มเติมเกี่ยวกับบริษัท Minitab
Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ