VIF คืออะไร

เมื่อคุณใช้ Minitab ในการวิเคราะห์การถดถอย (Regression Analysis) ถ้าเราเริ่มต้นการทำงานกับข้อมูลจำนวนมากและไม่รู้ว่าจะเริ่มต้นที่ตรงไหน  ในหลายๆครั้งเรามักจะมุ่งสนใจที่ค่า p-values เพียงอย่างเดียว โดยมองข้ามสิ่งอื่นๆในกระบวนการไป ในบทความนี้จะเป็นการแนะนำค่าสถิติอีกหนึ่งค่าที่ Minitab แสดงให้เห็นในผลการวิเคราะห์ คือ VIF (Variance Inflation Factor) 

ค่า VIF เป็นค่าที่จะสะท้อนให้เห็นถึงอิทธิพลร่วมของตัวแปรทำนาย (predictor) ในตัวแบบเส้นตรง   ภาวะร่วมของตัวแปรในตัวแบบเส้นตรง (multicollinearity) คือ การอธิบายว่าตัวแปรทำนายที่อยู่ในตัวแบบนั้นมีความสัมพันธ์กันอย่างไร

ค่า VIF เป็นตัววัดที่แสดงให้เห็นว่าถ้าตัวแปรทำนายนั้นมีความสัมพันธ์กันจะทำให้ความแปรปรวนของค่าสัมประสิทธิ์ของตัวแบบการถดถอยจะมีค่าเพิ่มขึ้น ซึ่งเมื่อความแปรปรวนเพิ่มขึ้นนั่นหมายถึงว่าไม่ดี เพราะเราต้องการความแม่นยำในการประมาณค่า และเมื่อความแปรปรวนของเพิ่มขึ้นแปลว่าความน่าเชื่อถือของตัวแบบคงลดลง

มาดูกันว่าค่า VIF คำนวณมาได้อย่างไร ดูที่ Minitab Help’s regression จากตัวอย่างเพื่อดูว่าค่า VIF คำนวณอย่างไร

ตัวแปรทำนายแต่ละตัวในตัวแบบจะมีค่า VIF จากตัวอย่าง ค่าตัวแปรตอบสนองคือค่าวัด total heat flux ที่มาจากเครื่องสร้างกำลังไฟฟ้าจากพลังงานแสงอาทิตย์ที่ใช้ตามบ้าน โดยมีตัวแปรทำนายคือตำแหน่งจุดโฟกัส (Focal points) ที่แตกต่างกัน 3 ทิศทางคือ ทิศตะวันออก ทิศใต้ และ ทิศเหนือ จากนั้นมีการใช้ Minitab ในการวิเคราะห์การถดถอยเพื่อดูผลลัพธ์ ซึ่งได้ดังนี้

regroutput

มาดูกันว่าค่า VIF แต่ละตัวคำนวณมาอย่างไร โดยเราจะเริ่มจากตัวแปรทำนายเพื่อดูว่าส่งผลต่อค่าตัวแปรตอบสนองอย่างไรในตัวแบบ  ถ้าเรามีข้อมูลเราจะใช้คำสั่งใน Minitab คือ Stat > Regression > Regression > Fit Regression Model เพื่อวิเคราะห์ผลลัพธ์

ในส่วนช่อง  Response เราจะใส่ค่าตัวแปรทำนายที่ต้องการจะวิเคราะห์ ซึ่งในตัวอย่างนี้เราจะเลือก ทิศใต้ (South)  ส่วนช่อง continuous predictors เราจะใส่ตัวแปรทำนายที่เหลือ ซึ่งในที่นี้คือ  ทิศตะวันออก (East) และ ทิศเหนือ (North) จากนั้นให้โปรแกรมทำการคำนวณค่าต่างๆ

ค่าที่สำคัญสำหรับผลลัพธ์ของเรา คือ ค่า R-Sq

capture 42

จากตัวอย่างนี้ได้ค่า R-sq เท่ากับ 0.1707 ซึ่งค่า R-sq มาจากสมการนี้

capture2

จากสมการเราได้ 1/(1-.1707) = 1.21

และรากที่สองของค่า VIF คือ standard error เป็นค่าที่บ่งบอกว่าตัวแปรทำนายนั้นจะไม่มีความสัมพันธ์กับตัวแปรทำนายอื่นๆ ในตัวแบบ

จากตัวอย่า ทิศใต้ มีค่า standard error เท่ากับ  ซึ่งหมายความว่า ตัวแปรทำนายทิศใต้มี standard error เป็น 1.1 เท่าซึ่งเท่ากับว่าตัวแปรทิศใต้นี้ไม่มีความสัมพันธ์ใดใดกับตัวแปรทำนายตัวอื่นๆในตัวแบบ ซึ่งแสดงถึงความไม่มีนัยสำคัญของการเปลี่ยนแปลงในตัวแบบ ค่า VIF ที่ดีจะมีค่าประมาณ 1

คำแนะนำเกี่ยวกับค่า VIF โดยทั่วไปค่าที่ยอมรับทั่วไป คือ ถ้า VIF > 10 หมายความว่ามีสหสัมพันธ์ของตัวแปรทำนายมาก หรือมีภาวะร่วมของตัวแปรในตัวแบบเส้นตรงสูง ในตัวอย่างนี้มีค่าประมาณ 1 ซึ่งถือว่าเป็นเรื่องดีและเราสามารถพิจารณาเรื่องอื่นๆของการวิเคราะห์ถดถอยต่อไปได้


บทความต้นฉบับ : What in the World Is a VIF?

ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยสุวดี นำพาเจริญ

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ