อะไรคือความแตกต่างระหว่าง Confidence Interval, Prediction Interval และ Tolerance Interval

สถิติก็เปรียบเสมือนชีวิต ความแน่นอนคือความไม่แน่นอน และนั่นก็เป็นเหตุผลที่นักสถิติ มักไม่สามารถให้ผลลัพธ์ที่เฉพาะเจาะจงตามที่เราต้องการ แต่จะให้ผลลัพธ์ของการวิเคราะห์เป็นลักษณะแบบช่วงแทน ซึ่งภายในผลลัพธ์นั้นจะแนะนำคำตอบที่แท้จริง

หลายๆท่านมักคุ้นเคยกับ ” ช่วงความเชื่อมั่น (confidence interval) ” แต่นั่นเป็นเพียงหนึ่งในการประมาณค่าแบบช่วงแบบหนึ่ง ซึ่งเราสามารถใช้เพื่อระบุลักษณะของผลลัพธ์ของการวิเคราะห์ บางครั้งช่วงความเชื่อมั่น (confidence interval) นั้นไม่ใช่ตัวเลือกที่ดีที่สุด ฉะนั้นมาดูลักษณะของการประมาณค่าแบบช่วงแต่ละประเภท และพิจารณาว่าควรใช้ในสถานการณ์ใด โดยเฉพาะช่วงความเชื่อมั่น (confidence interval), ช่วงการทำนาย (prediction interval) และช่วงค่าเผื่อ (tolerance interval)

ภาพรวมของช่วงความเชื่อมั่น (confidence interval)

ช่วงความเชื่อมั่น (confidence interval) หมายถึง ช่วงของค่าที่ครอบคลุมค่าพารามิเตอร์ของประชากรที่ไม่รู้ เช่น ค่าเฉลี่ยตามตัวอย่างของข้อมูลที่สุ่มจากประชากรนั้น

รวบรวมตัวอย่างอย่างสุ่ม ซึ่งกลุ่มตัวอย่างสองกลุ่มจากประชากรนั้น ช่วงความเชื่อมั่น (confidence interval) ที่ได้อาจจะไม่เหมือนกัน แต่ถ้าหากมีการสุ่มตัวอย่างจากประชากรซ้ำแล้วซ้ำอีก เปอร์เซ็นต์ของช่วงความเชื่อมั่น (confidence interval) เหล่านั้นจะครอบคลุมค่าพารามิเตอร์ของประชากรที่ไม่รู้ ซึ่งเปอร์เซ็นต์ของช่วงความเชื่อมั่น (confidence interval) ที่ครอบคลุมค่าพารามิเตอร์นี้ เรียกว่า ระดับความเชื่อมั่น (confidence level)

ช่วงความเชื่อมั่น (confidence interval) มักใช้เพื่อแสดงค่าเฉลี่ย หรือส่วนเบี่ยงเบนมาตรฐานของประชากร นอกจากนี้ยังสามารถคำนวณหาสัดส่วน (proportions) ค่าสัมประสิทธิ์การถดถอย (regression coefficients) อัตราการเกิดเหตุการณ์ (มีการแจกแจงแบบ Poisson) และสำหรับความแตกต่างระหว่างประชากรในการทดสอบสมมติฐาน

หากเราทำการวัดอายุการใช้งานของหลอดไฟที่เก็บตัวอย่างมาอย่างสุ่ม และโปรแกรม Minitab คำนวณ 95% confidence interval ได้ 1,230 – 1,265 ชั่วโมง นั่นหมายความว่า เรามั่นใจได้ 95% ว่าค่าเฉลี่ยประชากรของอายุการใช้งานหลอดไฟจะอยู่ระหว่าง 1,230 ถึง 1,265 ชั่วโมง

ประเด็นน่าสนใจที่เกี่ยวข้องกับค่าพารามิเตอร์ คือ ช่วงความเชื่อมั่น (confidence interval) จะประเมินเฉพาะข้อผิดพลาดในการสุ่มตัวอย่างเท่านั้น ซึ่งเป็นข้อผิดพลาดโดยธรรมชาติในการประมาณลักษณะของประชากรจากกลุ่มตัวอย่าง จำนวนตัวอย่างที่มากขึ้นจะลดข้อผิดพลาดในการสุ่มตัวอย่าง และส่งผลให้ช่วงความเชื่อมั่น (confidence interval) นั้นแคบลง และหากคุณสามารถสุ่มตัวอย่างได้ทั้งประชากร ช่วงความเชื่อมั่น (confidence interval) จะมีความกว้างเป็น 0 หมายความว่า จะไม่มีข้อผิดพลาดในการสุ่มตัวอย่าง เนื่องจากคุณได้ค่าพารามิเตอร์สำหรับประชากรทั้งหมดแล้ว!

นอกจากนี้ช่วงความเชื่อมั่น (confidence interval) จะให้ข้อมูลเกี่ยวกับค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน หรือค่าพารามิเตอร์ที่คุณสนใจเท่านั้น ซึ่งมันไม่ได้บอกคุณเกี่ยวกับการกระจายตัวของข้อมูล

มันหมายความว่าอย่างไรในทางปฏิบัติ? หมายความว่า ช่วงความเชื่อมั่น (confidence interval) มีข้อจำกัดบางอย่างที่เข้มงวด ในตัวอย่างนี้ เรามั่นใจได้ 95% ว่า ระยะเวลาเฉลี่ยของหลอดไฟจะอยู่ระหว่าง 1,230 ถึง 1,265 ชั่วโมง แต่ 95% confidence interval นั้นไม่ได้บอกว่า 95% ของอายุการใช้งานของหลอดไฟแต่ละหลอดจะตกอยู่ในช่วงนี้ หากต้องการสรุปเช่นนั้นต้องใช้การประมาณค่าแบบช่วงประเภทอื่น …

ภาพรวมของช่วงการทำนาย (prediction interval)

ช่วงการทำนาย (prediction interval) เป็นช่วงความเชื่อมั่นสำหรับค่าคาดการณ์(predictions)ที่มาจากตัวแบบการถดถอยเชิงเส้นและแบบไม่เชิงเส้น (linear and nonlinear regression models) ซึ่งช่วงการทำนาย (prediction interval) มีสองประเภท ดังนี้

ช่วงความเชื่อมั่น (confidence interval) ของค่าคาดการณ์

จากการตั้งค่าที่ระบุไว้ของตัวแปรทำนายในตัวแบบ ซึ่งช่วงความเชื่อมั่น (confidence interval)ของค่าคาดการณ์ คือ ช่วงที่ครอบคลุมค่าเฉลี่ยของตัวแปรตอบสนอง เช่นเดียวกับช่วงความเชื่อมั่น (confidence interval) ทั่ว ๆ ไป โดยช่วงความเชื่อมั่น (confidence interval) ของค่าคาดการณ์ จะแสดงถึงช่วงของค่าเฉลี่ย ไม่ใช่การกระจายของข้อมูลแต่ละจุด

จากตัวอย่างหลอดไฟ เราสามารถทดสอบได้ว่า เทคนิคการผลิตที่แตกต่างกัน (slow หรือ quick) และชนิดของไส้ของหลอดไฟ (A หรือ B) มีผลต่ออายุการใช้งานของหลอดไฟได้อย่างไร ซึ่งหลังจากทำการสร้างตัวแบบ เราสามารถใช้โปรแกรมสำเร็จรูปทางสถิติ (statistical software) เพื่อคาดการณ์อายุการใช้งานของหลอดไฟที่ผลิตโดยใช้ไส้ของหลอดไฟชนิด A ภายใต้วิธีการผลิตแบบ quick

หากช่วงความเชื่อมั่น (confidence interval) ของค่าคาดการณ์ คือ 1,400–1,450 ชั่วโมง นั่นคือ เราสามารถมั่นใจได้ 95% ว่าอายุการใช้งานเฉลี่ยของหลอดไฟที่ผลิตภายใต้เงื่อนไขเหล่านั้นจะตกอยู่ในช่วงดังกล่าว แต่อย่างไรก็ตามช่วงความเชื่อมั่น (confidence interval) นี้ไม่ได้บอกอะไรกับเราเกี่ยวกับวิธีการกระจายตัวของอายุการใช้งานของหลอดไฟแต่ละหลอด

ช่วงการทำนาย (prediction interval)

ช่วงการทำนาย (prediction interval) คือ ช่วงที่ครอบคลุมค่าสังเกตใหม่ของตัวแปรตอบสนองในแต่ละค่า ภายใต้การตั้งค่าที่ระบุไว้ในตัวแปรทำนายของคุณ

หากโปรแกรม Minitab คำนวณช่วงการทำนาย (prediction interval) ได้เท่ากับ 1,350–1,500 ชั่วโมง สำหรับหลอดไฟที่ผลิตภายใต้เงื่อนไขที่อธิบายไว้ข้างต้น นั่นคือ เรามั่นใจได้ 95% ว่า อายุการใช้งานของหลอดไฟใหม่ที่ผลิตด้วยการตั้งค่าเหล่านั้นจะตกอยู่ในช่วงดังกล่าว

คุณจะสังเกตว่าช่วงการทำนาย (prediction interval) นั้นกว้างกว่าช่วงความเชื่อมั่น (confidence interval) ของค่าคาดการณ์ ซึ่งสิ่งนี้เป็นจริงแน่นอน เพราะว่ามีความผันแปรอื่น ๆ เพิ่มเติมเข้ามา เมื่อเราทำการคาดการณ์ตัวแปรตอบสนองเพียงค่าเดียว แทนที่จะเป็นค่าเฉลี่ยของตัวแปรตอบสนอง

ภาพรวมของช่วงค่าเผื่อ (tolerance interval)

ช่วงค่าเผื่อ (tolerance interval) คือ ช่วงที่ครอบคลุมค่าสัดส่วนที่กำหนดของประชากร ในการคำนวณช่วงค่าเผื่อ (tolerance interval) คุณต้องกำหนดสัดส่วนของประชากร และระดับความเชื่อมั่น (confidence level) ที่ต้องการ ซึ่งก็คือ ความน่าจะเป็นที่สัดส่วนที่กำหนดจะถูกรวมอยู่ในช่วงนั้นจริงๆ ซึ่งสิ่งนี้จะเข้าใจได้ง่ายขึ้น เมื่อคุณดูตัวอย่างด้านล่าง

ตัวอย่างของช่วงค่าเผื่อ (tolerance interval)

ในการประเมินว่าหลอดไฟมีอายุการใช้งานยาวนานเพียงใด บริษัทผู้ผลิตหลอดไฟสุ่มตัวอย่าง 100 หลอด และบันทึกว่าหลอดไฟมีอายุการใช้งานยาวนานเพียงใดใน worksheet นี้

หากต้องการใช้ข้อมูลนี้ในการคำนวณช่วงค่าเผื่อ (tolerance interval) ให้ไปที่เมนู Stat > Quality Tools > Tolerance Intervals ในโปรแกรม Minitab (หากคุณยังไม่มีโปรแกรม สามารถดาวน์โหลดโปรแกรม Minitab ทดลองใช้ฟรี 30 วัน แล้วทำตามขั้นตอนนี้!) เมื่อเปิดไฟล์ ให้เลือกตัวอย่างที่อยู่ในคอลัมน์ นั่นคือ เลือกคอลัมน์ Hours ลงใน Dialog Box จากนั้นคลิก OK

Ti

การทดสอบการแจกแจงปกติของข้อมูล (normality test) แสดงให้เห็นว่า ข้อมูลเหล่านี้มีการแจกแจงปกติ ดังนั้นเราจึงสามารถใช้ Normal interval (มีค่าระหว่าง 1,060 และ 1,435) นั่นคือ บริษัทผู้ผลิตหลอดไฟสามารถมั่นใจได้ 95% ว่า จำนวนหลอดไฟทั้งหมด มีอย่างน้อย 95% ที่จะมีอายุการใช้งานอยู่ระหว่าง 1,060 ถึง 1,435 ชั่วโมง

เปรียบเทียบระหว่างช่วงค่าเผื่อ (tolerance interval) และช่วงความเชื่อมั่น (confidence interval)

ดังที่เราได้กล่าวไว้ก่อนหน้านี้ ความกว้างของช่วงความเชื่อมั่น (confidence interval) ขึ้นอยู่กับข้อผิดพลาดในการสุ่มตัวอย่างทั้งหมด ยิ่งกลุ่มตัวอย่างมีจำนวนใกล้เคียงประชากรทั้งหมดมากเท่าไหร่ ความกว้างของช่วงความเชื่อมั่น (confidence interval) ก็จะยิ่งเล็กลงจนกระทั่งเข้าใกล้ศูนย์

แต่ความกว้างของช่วงค่าเผื่อ (tolerance interval) ไม่เพียงขึ้นอยู่กับข้อผิดพลาดในการสุ่มตัวอย่างเท่านั้น แต่ยังรวมถึงความแปรปรวนในประชากร เมื่อจำนวนของกลุ่มตัวอย่างเข้าใกล้ประชากรทั้งหมด ซึ่งทำให้ข้อผิดพลาดในการสุ่มตัวอย่างนั้นลดน้อยลง และการประมาณค่าเปอร์เซ็นต์ไทล์จะเข้าใกล้ค่าเปอร์เซ็นไทล์ของประชากรที่แท้จริงอีกด้วย

โปรแกรม Minitab จะคำนวณค่าของข้อมูลที่สอดคล้องกับการประมาณค่าเปอร์เซ็นไทล์ที่ 2.5 และ 97.5 (97.5 – 2.5 = 95) เพื่อกำหนดช่วงที่ครอบคลุม 95% ของประชากร คุณสามารถดูรายละเอียดเพิ่มเติมเกี่ยวกับเปอร์เซ็นต์ไทล์และสัดส่วนของประชากรได้ที่นี่

และแน่นอน เนื่องจากเราใช้ข้อมูลจากกลุ่มตัวอย่าง การประมาณค่าเปอร์เซ็นไทล์จะมีข้อผิดพลาด เราจึงไม่สามารถพูดได้ว่าช่วงค่าเผื่อ (tolerance interval) มีสัดส่วนที่ระบุอย่างแท้จริงด้วยความมั่นใจ 100% ซึ่งช่วงค่าเผื่อ (tolerance interval) ก็มีระดับความเชื่อมั่นเช่นกัน

วิธีการใช้ช่วงค่าเผื่อ (tolerance interval)

ช่วงค่าเผื่อ (tolerance interval) มีประโยชน์อย่างมาก เมื่อคุณต้องการคาดการณ์ช่วงของผลลัพธ์ที่เป็นไปได้ตามข้อมูลตัวอย่าง

ในงานด้านการปรับปรุงคุณภาพ โดยทั่วไปผู้ปฏิบัติงานกำหนดให้ผลลัพธ์ของกระบวนการตกอยู่ในขอบเขตที่กำหนด (เช่น อายุการใช้งานของหลอดไฟ) ด้วยการเปรียบเทียบข้อกำหนดของลูกค้ากับขีดจำกัดของช่วงค่าเผื่อ (tolerance interval) ที่ครอบคลุมสัดส่วนที่ระบุไว้ของประชากร จะ สามารถตรวจพบความผันแปรที่มากเกินไปได้ ซึ่งช่วงค่าเผื่อ (tolerance interval) ที่กว้างกว่าข้อกำหนดของลูกค้า อาจบ่งชี้ว่า ผลิตภัณฑ์มีความผันแปรที่มากเกินไป

โปรแกรมสำเร็จรูปทางสถิติ Minitab สามารถสร้างการประมาณค่าแบบช่วงเหล่านี้ได้อย่างง่ายดาย ไม่ว่าคุณจะต้องการใช้การประมาณค่าแบบช่วงแบบใดก็ตามสำหรับข้อมูลของคุณ


บทความต้นฉบับ : What’s the Difference between Confidence, Prediction, and Tolerance Intervals?

ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยรัฐพงษ์ ยอดสีมา

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ