ถ้ามีทางเลือกให้เพิ่มขึ้น ยิ่งต้องทำให้ตัดสินใจมากขึ้น
การทดสอบความเท่ากัน (equivalence testing) คุณมีเครื่องมือทางสถิติในการทดสอบค่าเฉลี่ยสิ่งตัวอย่างกับค่าเป้าหมายหรือค่าเฉลี่ยสิ่งตัวอย่างตัวอื่นๆ การทดสอบความเท่ากัน (equivalence testing) มีการใช้งานอย่างแพร่หลายในงานวิทยาศาสตร์ชีวการแพทย์ (Biomedical) ผู้ผลิตในงานเภสัชกรรม (Pharmaceutical) มักจะต้องทำการทดสอบด้านชีววิทยา เรื่องของยาสามัญ (Generic drug) ว่ามีความเทียบเท่ากับยาที่มีตราผลิตภัณฑ์ (brand name) ซึ่งเป็นงานที่ต้องทำในขั้นตอนการขึ้นทะเบียนยาตามกฎหมาย
แต่ในงานด้านการปรับปรุงคุณภาพ เหตุใดคุณถึงจะต้องการการทดสอบความเท่ากัน(equivalent testing) แทนการทดสอบแบบที่ใช้กันอยู่
การแปลผลการทดสอบสมมติฐาน : หลุมพรางที่พบบ่อย
สมมติว่าผู้ผลิตพบว่าผู้ผลิตรายใหม่เสนอวัตถุดิบที่มีต้นทุนถูกกว่าและสามารถนำมาใช้ทดแทนในกระบวนการผลิตได้ วัตถุดิบใหม่นี้จะถูกนำมาทดแทนกับวัตถุดิบที่ใช้อยู่ในปัจจุบันซึ่งมีราคาแพงกว่า และถ้าวัตถุดิบตัวใหม่นี้มีคุณภาพเทียบเท่ากับวัตถุดิบเดิม มันไม่ควรจะทำให้การผลิตไม่ยืดหยุ่นเกินไป หรือ ไม่มีข้อจำกัดเกินไป
ในการทวนสอบเพื่อให้แน่ใจว่าการทดแทนวัตถุดิบนั้นจะไม่ส่งผลกระทบต่อคุณภาพ นักวิเคราะห์จะทำการเก็บสิ่งตัวอย่างจากกระบวนการที่ใช้วัตถุดิบทั้งสองชนิด (ซึ่งกระบวนการผลิตต้องเสถียร) : หนึ่งมาจากวัตถุดิบชนิดใหม่และอีกหนึ่งมาจากวัตถุดิบที่ใช้ในปัจจุบัน
นักวิเคราะห์จะใช้การทดสอบ 2-sample t-test (Stat > Basic Statistics > 2-Sample t ในโปรแกรม Minitab Statistical Software) เพื่อช่วยประเมินว่าค่าเฉลี่ยของผลิตภัณฑ์ที่ใช้วัตถุดิบทั้งสองชนิดนั้นมีค่าเหมือนกันหรือไม่
เนื่องจากว่าค่า P-Value มีค่ามากกว่าค่าระดับนัยสำคัญ (alpha level=0.05) นักวิเคราะห์จึงสรุปว่าค่าเฉลี่ยทั้งสองไม่แตกต่างกัน และจากผลการวิเคราะห์นี้ บริษัทจึงทำการเปลี่ยนวัตถุดิบ เพราะผลจากการวิเคราะห์ทางสถิติพบว่าบริษัทจะสามารถประหยัดต้นทุนได้ด้วยการใช้วัตถุดิบชนิดใหม่และคุณภาพผลิตภัณฑ์ไม่เปลี่ยนแปลง
ผลการการทดสอบทำให้ทุกคนมีความสุข และฉลองกับผลที่ทดสอบได้
แต่ยังมีปัญหาหนึ่งรออยู่ การวิเคราะห์ทางสถิติไม่ได้พิสูจน์ว่าค่าเฉลี่ยนั้นเหมือน (same) กันหรือไม่
ถ้า P-Value น้อยกว่าค่าระดับนัยสำคัญ คุณสามารถสรุปได้ว่ามีความแตกต่างอย่างมีนัยสำคัญ แต่ถ้า P-Value มีค่ามากกว่าระดับนัยสำคัญหมายความว่าค่าเฉลี่ยนั้นเท่ากัน และคุณยังไม่มีหลักฐานเพียงพอที่จะพิสูจน์ได้ว่าค่าเฉลี่ยทั้งสองไม่เท่ากัน
การไม่ปรากฏหลักฐานไม่ได้เป็นการพิสูจน์ข้อความที่ตรงกันข้ามกับสิ่งที่ปรากฏ ซึ่งนั่นหมายความว่าถ้าคุณมีหลักฐานไม่เพียงพอที่จะบอกว่า A เป็นจริง ซึ่งเท่ากับว่าคุณไม่ได้พิสูจน์ว่า A เป็นเท็จ
การทดสอบความเท่ากัน (Equivalence test) เป็นอีกประเด็นหนึ่งของข้อความนี้ ในการทดสอบความเท่าเทียมกันของสิ่งตัวอย่าง 2 กลุ่ม สมมติฐานหลัก จะเป็นสิ่งตรงกันข้ามกับการทดสอบ 2-sample t-test
ซึ่งทำให้ภาระการพิสูจน์ถูกสลับกันในการทดสอบ และยังทำให้การทำให้การตั้งสมมติฐานหลักในการทดสอบในรูปแบบต่างๆกลับทางกันอีกด้วย
กรณีศึกษา : สมมติฐานของความถูกต้อง (Innocence) และ ความผิด (Guilt)
แนวคิดในการเปรียบเทียบนี้อาจจะทำให้คุณสามารถนึกภาพตามได้ง่ายขึ้น
ในขั้นตอนของศาลการพิจารณาความตามกฎหมาย ภาระการพิสูจน์ คือ การพิสูจน์ว่ามีความผิดหรือไม่ ผู้ต้องสงสัยจะถูกเชื่อว่าเป็นผู้บริสุทธิ์ หรือ เป็นผู้ทำถูกต้อง (H0) จนกระทั่งพิสูจน์ได้ว่ามีความผิดจริง (H1) แต่ในงานข่าวสาร ภาระการพิสูจน์จะเป็นตรงกันข้าม คือ ผู้ต้องสงสัยจะถูกเชื่อว่าเป็นมีความผิด (H1)
จนกว่าจะพิสูจน์ได้ว่ามีความบริสุทธิ์ การเปลี่ยนภาระการพิสูจน์ ทำให้ผลการสรุปแตกต่างกัน นั้นจึงเป็นเหตุที่ทำไมในงานข่าวสารจึงมักจะแสดงถึงความโหดร้ายของผู้ต้องสงสัยที่ถูกกว่าหาว่ามีความผิด ได้รับการปล่อยตัวเพราะไม่มีหลักฐานเพียงพอที่จะพิสูจน์ได้ว่าผู้ต้องสงสัยกระทำผิดจริงในชั้นศาล และตราบใดที่งานข่าวสาร และ งานในการพิจาณาชั้นศาล ยังมีสมมติฐานหลักและสมมติฐานทางเลือกที่ตรงข้ามกัน ผลสรุปของทั้งสองฝ่ายก็จะแตกต่างกันต่อให้พิจารณาบนหลักฐานเดียวกันก็ตาม
ทำไมถึงมีการสร้างสมมติฐานแตกต่างกัน เพราะว่าความคิดที่ต่างกันในเรื่องการมองข้อผิดพลาดที่จะเกิดขึ้นอะไรจะส่งผลที่แย่กว่ากัน ในกระบวนการยุติธรรมความเชื่อเรื่องความผิดพลาดที่ส่งผลแย่กว่าคือการตัดสินกล่าวหาผู้บริสุทธิ์และดีกว่าคือปล่อยตัวผู้ทำผิดไป ส่วนงานข่าวสารมีความเชื่อในทางตรงกันข้าม (อาจเพราะว่าการว่าความผิดนั้นขายได้มากว่าการเชื่อว่าถูกต้อง)
เมื่อภาระการพิสูจน์เปลี่ยนไป คำสรุปอาจจะเปลี่ยนแปลงด้วย
จากตัวอย่างแรกในการวิเคราะห์คุณภาพ เพื่อหลีกเลี่ยงที่จะเสียลูกค้าไป บริษัทเลี่ยงที่จะสรุปว่าคุณภาพจะไม่เปลี่ยนแปลงต่อให้ใช้วัตถุดิบที่มีราคาถูกกว่า ทั้งที่จริงมันใช้ได้ และความผิดพลาดจะยังคงเหมือนเดิม เมื่อในที่จริงวัตถุดิบนั้นไม่สามารถใช้ทดแทนได้ เพื่อให้ผลในการแสดงให้เห็นว่าค่าเฉลี่ยมีความเหมือนกัน การวิเคราะห์จะใช้วิธี 2 sample equivalence test (Stat > Equivalence Tests > Two Sample)
ใช้ข้อมูลเดิมในการทดสอบความเท่าเทียมกัน ผลลัพธ์ที่ได้ชี้ให้เห็นว่าไม่มีหลักฐานเพียงพอที่จะบอกว่าค่าเฉลี่ยทั้งสองค่าเหมือนกัน ดังนั้นบริษัทจึงไม่มั่นใจว่าคุณภาพของผลิตภัณฑ์นั้นจะมีปัญหาหรือไม่ ซึ่งถ้าทำการเปลี่ยนวัตถุดิบเป็นตัวที่มีราคาถูกกว่า ในการทดสอบด้วยวิธีการทดสอบความเท่าเทียมกัน บริษัทพบว่ามีโอกาสที่ค่าเฉลี่ยกระบวนการจะมีการเปลี่ยนแปลงได้
หมายเหตุ ถ้าดูจากผลลัพธ์ด้านบน คุณจะเห็นว่าวิธีการทดสอบความเท่าเทียมกันนั้นแตกต่างจากการทดสอบ t-test การทดสอบ two one-sided t-test ใช้เพื่อทดสอบสมมติฐานหลัก และวิธีทดสอบใช้พื้นที่ของความเท่าเทียมกันในการบอกว่าขนาดความแตกต่างคือระหว่างค่าเฉลี่ยที่พิจารณาในทางปฏิบัตินั้นไม่มีนัยสำคัญ เราจะดูรายละเอียดเพิ่มเติมในโพสต์ถัดไป
บทสรุป
ในการเลือกระหว่างวิธีการทดสอบความเท่าเทียมกัน และ วิธี t ต้องพิจารณาสิ่งที่คุณต้องการจะพิสูจน์ สิ่งใดก็ตามที่คุณต้องการพิสูจน์ความจริงควรจะนำมาไว้ที่สมมติฐานทางเลือก (alternative hypothesis)เพื่อทดสอบและเป็นภาระที่ต้องการการพิสูจน์ (Burden of proof) และสิ่งใดก็ตามแต่ที่เป็นสิ่งที่ก่อให้เกิดความเสียหายที่น้อยกว่าถ้าไม่ถูกต้องตามที่ตั้งสมมติฐานไว้ ให้นำไปไว้ที่สมมติฐานหลัก (null hypothesis) ถ้าคุณต้องการที่จะพิสูจน์ว่าค่าเฉลี่ยทั้งสองนี้มีค่าเหมือนกัน หรือ ค่าเฉลี่ยนั้นมีค่าเท่ากับค่าเป้าหมายหรือไม่ คุณควรเลือกใช้วิธีการทดสอบความเท่าเทียมกัน (equivalence test) แทนการใช้วิธีการทดสอบ t – test
บทความต้นฉบับ : Equivalence Testing for Quality Analysis (Part I): What are You Trying to Prove?
ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยสุวดี นำพาเจริญ,
บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย
เพิ่มเติมเกี่ยวกับบริษัท Minitab
Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ