การวิเคราะห์เชิงทำนายด้วยการใช้ตัวแบบถดถอยใน Minitab ตอนที่ 1

ในปัจจุบันนี้มีเครื่องมือสำหรับการวิเคราะห์เชิงทำนายและ machine learning อยู่หลากหลายอย่าง ตัวแบบถดถอยแบบดั้งเดิม คือการสร้างตัวแบบทางคณิตศาสตร์เพื่อใช้ทำนายค่าตัวแปรที่ต้องการ ซึ่งในตัวแบบที่ได้จะแสดงถึงความสัมพันธ์ระหว่างตัวแปรตอบสนองและตัวทำนายหลายๆค่า บริษัทยังต้องคำนึงถึงการนำไปเอาตัวแบบใช้งานอย่างเหมาะสมอีกด้วย   โปรแกรม Minitab ได้เพิ่มความสามารถของโปรแกรมในส่วนนี้ไว้เพื่อช่วยทำให้การสร้างตัวแบบเพื่อนำมาใช้ในการทำนายได้อย่างดียิ่งขึ้น


โปรแกรม Minitab ทำให้งานวิเคราะห์การถดถอยมีความง่ายยิ่งขึ้น โดยการวิเคราะห์การถดถอยมักนำไปใช้

  • สร้าง ตรวจสอบ และ แสดงภาพจำลองสถานการณ์ของการใช้ตัวแบบทำนาย
  • ทวนสอบความถูกต้องของตัวแบบในการให้ผลค่าทำนายว่าเป็นอย่างไร
  • วิเคราะห์และทำการเลือกตัวแบบที่เหมาะสมที่สุด
  • ทำนายผลลัพธ์ และ หาค่าปัจจัยที่เหมาะสม

ในบทความนี้เราจะเน้นไปที่ การสร้าง การตรวจสอบ และแสดงภาพจำลองสถานการณ์ของการใช้ตัวแบบทำนายได้ดียิ่งขึ้น (ส่วนตอนที่ 2 จะเป็นเรื่องของการทวนสอบความถูกต้องของตัวแบบ การวิเคราะห์และทำการเลือกตัวแบบที่เหมาะสม การทำนายผลลัพธ์ และ หาค่าปัจจัยที่เหมาะสมในการให้ผลค่าทำนายว่าเป็นอย่างไร)

ตัวแบบถดถอย เป็นเครื่องมือเพื่อใช้หาคำตอบในปัญหาต่างๆ ที่มีในอุตสาหกรรมหลายๆประเภท (เช่น การตลาด การเงิน การผลิต เครื่องมือทางการแพทย์ การผลิตยาเวชภัณฑ์ การผลิตอาหาร เป็นต้น) ซึ่งตัวแบบที่ได้จะใช้เพื่อบ่งชี้ว่าตัวแปรตั้งต้นตัวใดที่จะมีผลมากที่สุด และจะนำไปใช้เพื่อทำนายค่าตัวแปรตอบสนอง ตัวแบบการถดถอยที่ดีที่สุดจะนำมาใช้เพื่อทำนายค่าผลลัพธ์ เมื่อมีการเปลี่ยนค่าปัจจัยต่างๆ  และ อย่าลืมว่าตัวแบบที่ได้จะเป็นตัวแบบที่บอกถึงความสัมพันธ์ของตัวแปรเท่านั้น โดยไม่ได้ระบุไปถึงสาเหตุและผลของปัจจัย

การสร้าง การตรวจสอบ และ แสดงภาพจำลองสถานการณ์ของการใช้ตัวแบบทำนาย ในโปรแกรม Minitab

ตัวแบบถดถอยใน Minitab สามารถใช้ได้กับทั้งตัวแปรทำนายที่เป็นค่าวัดและค่านับ (ที่เป็นหมวดหมู่ หรือ ประเภท) รวมทั้งสามารถใช้ในการสร้างตัวแบบที่มีความซับซ้อนหลายรูปแบบได้ เช่น ปัจจัยที่มี interaction  ตัวแบบที่พจน์เป็นพหุนาม (polynomial) เป็นต้น

เราจะใช้กรณีศึกษาของบริษัทผลิตอาหารหนึ่ง ที่วิศวกรมีความต้องการหาว่ารูปแบบของบรรจุภัณฑ์ใดใน 3 รูปแบบที่เป็นตัวเลือก จะมีผลต่ออายุของผลิตภัณฑ์ที่จะอยู่บนชั้นวางได้นานที่สุด (โดยค่าวัดที่จะเป็นข้อมูล คือ ค่าความชื้น) โดยเน้นที่ 72 ชั่วโมงแรกหลังจากที่มีการปิดบรรจุภัณฑ์

การวิเคราะห์การถดถอยที่นิยมใช้จะเป็นตัวแบบเส้นตรงที่แสดงอิทธิพลของปัจจัยหลัก (ตัวแปรทำนาย)แต่ละตัว ในตัวอย่างนี้ตัวแบบจะแยกค่า ตามรูปแบบบรรจุภัณฑ์แต่ละชนิดซึ่งทำให้มีค่าจุดตั้งแกนตั้ง (intercept) ของตัวแบบแตกต่างกัน แต่ยังมีค่าความชันของสมการเส้นตรงเท่ากัน การเพิ่มพจน์กำลังสอง (พหุนาม) ลงในสมการตัวแบบจะทำให้การวิเคราะห์มีประสิทธิภาพดียิ่งขึ้น

เริ่มจากเลือก Stat > Regression > Regression > Fit Regression Model จากนั้นใส่ค่าลงใน ตัวแปรตอบสนอง(response) ค่าตัวแปรทำนายที่เป็นแบบค่าต่อเนื่อง (continuous predictors) และ ค่าตัวแปรทำนายที่เป็นลักษณะประเภทหรือหมวดหมู่ (categorical predictors)

ส่วน Model ให้เลือกเพื่อทำให้ตัวแบบมีความถูกต้องมากยิ่งขึ้น ด้วยการเลือกรูปแบบของตัวแบบให้มีเทอมของ interactions และ พจน์พหุนาม (polynomial)  และยังสามารถเลือก Graph เพื่อแสดงแผนภาพพาเรโตสามารถเพื่อให้แสดงตัวแปรที่มีความสำคัญในตัวแบบ  แผนภาพเศษเหลือ (residual plots) เพื่อให้แสดงการทวนสอบตัวแบบว่าเป็นไปตามเงื่อนไขของสมมติฐานของการใช้เครื่องมือหรือไม่

Predictive Analytics Regression Pt 1 Pareto Dialogs
Predictive Analytics Regression Pt 1 Pareto Chart Standardized Effects

จากแผนภาพพาเรโตที่แสดงในภาพด้านล่างนี้ เป็นกราฟแท่งที่แสดงให้เห็นว่าตัวแปรใดเป็นตัวแปรที่มีนัยสำคัญ โดยมีเส้นสีแดงแสดงเกณฑ์ความมีนัยสำคัญ โดยตัวแปรที่มีกราฟแท่งเกินเส้นสีแดง หมายความว่าค่า p-value ของตัวแปรนั้นมีค่าน้อยกว่าค่าอัลฟ่า (ค่าระดับนัยสำคัญ) ซึ่งตามปกติคือ 0.05 และ มีความหมายว่าตัวแปรนั้นมีนัยสำคัญ ขนาดความยาวของแท่งกราฟจะแสดงตามความสำคัญตามลำดับที่เกิดในตัวแบบ จากตัวอย่างนี้ คือ จำนวนชั่วโมงและรูปแบบบรรจุภัณฑ์ เป็นสองตัวแปรสำคัญที่ส่งผลต่อความชื้นของผลิตภัณฑ์

ตัวแบบเพื่อการทำนายค่าความชื้น จะมีตัวแปรที่เกี่ยวข้องคือ จำนวนชั่วโมง จำนวนชั่วโมงกำลังสอง รูปแบบบรรจุภัณฑ์ และ interaction ระหว่างตัวแปรทั้งสอง (คือ จำนวนชั่วโมง และ รูปแบบบรรจุภัณฑ์)     

Predictive Analytics Regression Pt 1 Regression Equation Output

Minitab ทำการปรับตัวแบบให้แสดงเป็นสมการที่แยกตามรูปแบบบรรจุภัณฑ์ สมการที่แสดงทั้ง 3 สมการมีความแตกต่างที่ค่าคงที่ในแต่ละสมการ ซึ่งหมายถึงค่าความชันของเส้นกราฟที่เป็นความสัมพันธ์ระหว่างตัวแปรที่มีนัยสำคัญในเทอมของ interaction


จากแผนภาพเศษเหลือ ทำให้เราสามารถทวนสอบสมมติฐานของการวิเคราะห์การถดถอยว่าเป็นจริงหรือไม่ ซึ่งทำให้มั่นใจว่าการวิเคราะห์นี้เชื่อถือได้ สิ่งที่ต้องทำการทวนสอบ ได้แก่ การทวนสอบ คุณสมบัติความเป็นปกติ  ความผันแปรคงที่หรือไม่ และความเป็นอิสระ

Predictive Analytics Regression Pt 1 Residual Plots Moisture

เมื่อดำเนินการตรวจสอบสถานะต่างๆ ครบถ้วนแล้วนักวิเคราะห์จะนำเสนอผลของการวิเคราะห์ ซึ่งเครื่องมือที่จะนำมาใช้ในส่วนนี้ คือ  แผนภาพแฟกทอเรียล (Factorial plots) ซึ่งเป็นการแสดงผลลัพธ์ในรู)แบบกราฟที่แสดงภาพตัวแบบจำลองให้เข้าใจได้ง่ายกว่าการอ่านค่าตัวเลข ถ้าเป้าหมายของการศึกษา คือ การลดระดับความชื้นในผลิตภัณฑ์ในช่วง 72 ชั่วโมง คำตอบจากการวิเคราะห์ที่เลือกให้คือ รูปแบบบรรจุภัณฑ์แบบที่ 2 จะเป็นตัวเลือกที่ดีที่สุด

Predictive Analytics Regression Pt 1 Interaction Plot Moisture

การวิเคราะห์การถดถอยอาจไม่ใช่เรื่องใหม่แต่เป็นเครื่องมือที่ใช้ในการสร้างตัวแบบจำลองที่ถือว่าดีมาก และเป็นเครื่องมือที่นักวิเคราะห์ข้อมูลทุกคนควรมีความรู้ในการนำไปใช้งาน

โปรแกรม Minitab จะเป็นตัวช่วยให้การใช้เครื่องมือนี้ในการสร้างและแสดงตัวแบบจำลองได้ง่ายยิ่งขึ้น และเพื่อให้คุณได้เห็นว่าโปรแกรม Minitab ช่วยงานวิเคราะห์ข้อมูลและทำให้คุณได้รับคุณค่าจากข้อมูลที่คุณมีอยู่ได้อย่างไร คุณสามารถทดลองใช้โปรแกรม Minitab Statistical Software ได้ฟรี 30 วัน


บทความต้นฉบับ : Predictive Analytics using Minitab’s Regression – Part I

ต้นฉบับนำมาจาก Minitab blog , แปลและเรียบเรียงโดยสุวดี นำพาเจริญ,

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ