การทดสอบความเท่ากันในการวิเคราะห์คุณภาพ (ส่วนที่ 1) คุณกำลังพยายามจะพิสูจน์สิ่งใดอยู่

ถ้ามีทางเลือกให้เพิ่มขึ้น ยิ่งต้องทำให้ตัดสินใจมากขึ้น

การทดสอบความเท่ากัน (equivalence testing) คุณมีเครื่องมือทางสถิติในการทดสอบค่าเฉลี่ยสิ่งตัวอย่างกับค่าเป้าหมายหรือค่าเฉลี่ยสิ่งตัวอย่างตัวอื่นๆ การทดสอบความเท่ากัน (equivalence testing) มีการใช้งานอย่างแพร่หลายในงานวิทยาศาสตร์ชีวการแพทย์ (Biomedical) ผู้ผลิตในงานเภสัชกรรม (Pharmaceutical) มักจะต้องทำการทดสอบด้านชีววิทยา เรื่องของยาสามัญ (Generic drug) ว่ามีความเทียบเท่ากับยาที่มีตราผลิตภัณฑ์ (brand name) ซึ่งเป็นงานที่ต้องทำในขั้นตอนการขึ้นทะเบียนยาตามกฎหมาย 

แต่ในงานด้านการปรับปรุงคุณภาพ เหตุใดคุณถึงจะต้องการการทดสอบความเท่ากัน(equivalent testing) แทนการทดสอบแบบที่ใช้กันอยู่

การแปลผลการทดสอบสมมติฐาน : หลุมพรางที่พบบ่อย

สมมติว่าผู้ผลิตพบว่าผู้ผลิตรายใหม่เสนอวัตถุดิบที่มีต้นทุนถูกกว่าและสามารถนำมาใช้ทดแทนในกระบวนการผลิตได้ วัตถุดิบใหม่นี้จะถูกนำมาทดแทนกับวัตถุดิบที่ใช้อยู่ในปัจจุบันซึ่งมีราคาแพงกว่า และถ้าวัตถุดิบตัวใหม่นี้มีคุณภาพเทียบเท่ากับวัตถุดิบเดิม มันไม่ควรจะทำให้การผลิตไม่ยืดหยุ่นเกินไป หรือ ไม่มีข้อจำกัดเกินไป

ในการทวนสอบเพื่อให้แน่ใจว่าการทดแทนวัตถุดิบนั้นจะไม่ส่งผลกระทบต่อคุณภาพ นักวิเคราะห์จะทำการเก็บสิ่งตัวอย่างจากกระบวนการที่ใช้วัตถุดิบทั้งสองชนิด (ซึ่งกระบวนการผลิตต้องเสถียร) : หนึ่งมาจากวัตถุดิบชนิดใหม่และอีกหนึ่งมาจากวัตถุดิบที่ใช้ในปัจจุบัน

นักวิเคราะห์จะใช้การทดสอบ 2-sample t-test (Stat > Basic Statistics > 2-Sample t ในโปรแกรม Minitab Statistical Software) เพื่อช่วยประเมินว่าค่าเฉลี่ยของผลิตภัณฑ์ที่ใช้วัตถุดิบทั้งสองชนิดนั้นมีค่าเหมือนกันหรือไม่

2 Sample T

เนื่องจากว่าค่า P-Value มีค่ามากกว่าค่าระดับนัยสำคัญ (alpha level=0.05) นักวิเคราะห์จึงสรุปว่าค่าเฉลี่ยทั้งสองไม่แตกต่างกัน และจากผลการวิเคราะห์นี้ บริษัทจึงทำการเปลี่ยนวัตถุดิบ เพราะผลจากการวิเคราะห์ทางสถิติพบว่าบริษัทจะสามารถประหยัดต้นทุนได้ด้วยการใช้วัตถุดิบชนิดใหม่และคุณภาพผลิตภัณฑ์ไม่เปลี่ยนแปลง

ผลการการทดสอบทำให้ทุกคนมีความสุข และฉลองกับผลที่ทดสอบได้

แต่ยังมีปัญหาหนึ่งรออยู่ การวิเคราะห์ทางสถิติไม่ได้พิสูจน์ว่าค่าเฉลี่ยนั้นเหมือน (same) กันหรือไม่

2samplet W640

ถ้า P-Value น้อยกว่าค่าระดับนัยสำคัญ คุณสามารถสรุปได้ว่ามีความแตกต่างอย่างมีนัยสำคัญ แต่ถ้า P-Value มีค่ามากกว่าระดับนัยสำคัญหมายความว่าค่าเฉลี่ยนั้นเท่ากัน และคุณยังไม่มีหลักฐานเพียงพอที่จะพิสูจน์ได้ว่าค่าเฉลี่ยทั้งสองไม่เท่ากัน

การไม่ปรากฏหลักฐานไม่ได้เป็นการพิสูจน์ข้อความที่ตรงกันข้ามกับสิ่งที่ปรากฏ ซึ่งนั่นหมายความว่าถ้าคุณมีหลักฐานไม่เพียงพอที่จะบอกว่า A เป็นจริง ซึ่งเท่ากับว่าคุณไม่ได้พิสูจน์ว่า A เป็นเท็จ

การทดสอบความเท่ากัน (Equivalence test) เป็นอีกประเด็นหนึ่งของข้อความนี้ ในการทดสอบความเท่าเทียมกันของสิ่งตัวอย่าง 2 กลุ่ม สมมติฐานหลัก จะเป็นสิ่งตรงกันข้ามกับการทดสอบ 2-sample t-test

Eq

ซึ่งทำให้ภาระการพิสูจน์ถูกสลับกันในการทดสอบ และยังทำให้การทำให้การตั้งสมมติฐานหลักในการทดสอบในรูปแบบต่างๆกลับทางกันอีกด้วย

กรณีศึกษา : สมมติฐานของความถูกต้อง (Innocence) และ ความผิด (Guilt)

แนวคิดในการเปรียบเทียบนี้อาจจะทำให้คุณสามารถนึกภาพตามได้ง่ายขึ้น

ในขั้นตอนของศาลการพิจารณาความตามกฎหมาย ภาระการพิสูจน์ คือ การพิสูจน์ว่ามีความผิดหรือไม่ ผู้ต้องสงสัยจะถูกเชื่อว่าเป็นผู้บริสุทธิ์ หรือ เป็นผู้ทำถูกต้อง (H0) จนกระทั่งพิสูจน์ได้ว่ามีความผิดจริง (H1) แต่ในงานข่าวสาร ภาระการพิสูจน์จะเป็นตรงกันข้าม คือ ผู้ต้องสงสัยจะถูกเชื่อว่าเป็นมีความผิด (H1)

จนกว่าจะพิสูจน์ได้ว่ามีความบริสุทธิ์ การเปลี่ยนภาระการพิสูจน์ ทำให้ผลการสรุปแตกต่างกัน นั้นจึงเป็นเหตุที่ทำไมในงานข่าวสารจึงมักจะแสดงถึงความโหดร้ายของผู้ต้องสงสัยที่ถูกกว่าหาว่ามีความผิด ได้รับการปล่อยตัวเพราะไม่มีหลักฐานเพียงพอที่จะพิสูจน์ได้ว่าผู้ต้องสงสัยกระทำผิดจริงในชั้นศาล และตราบใดที่งานข่าวสาร และ งานในการพิจาณาชั้นศาล ยังมีสมมติฐานหลักและสมมติฐานทางเลือกที่ตรงข้ามกัน ผลสรุปของทั้งสองฝ่ายก็จะแตกต่างกันต่อให้พิจารณาบนหลักฐานเดียวกันก็ตาม

ทำไมถึงมีการสร้างสมมติฐานแตกต่างกัน เพราะว่าความคิดที่ต่างกันในเรื่องการมองข้อผิดพลาดที่จะเกิดขึ้นอะไรจะส่งผลที่แย่กว่ากัน ในกระบวนการยุติธรรมความเชื่อเรื่องความผิดพลาดที่ส่งผลแย่กว่าคือการตัดสินกล่าวหาผู้บริสุทธิ์และดีกว่าคือปล่อยตัวผู้ทำผิดไป ส่วนงานข่าวสารมีความเชื่อในทางตรงกันข้าม (อาจเพราะว่าการว่าความผิดนั้นขายได้มากว่าการเชื่อว่าถูกต้อง)

เมื่อภาระการพิสูจน์เปลี่ยนไป คำสรุปอาจจะเปลี่ยนแปลงด้วย

จากตัวอย่างแรกในการวิเคราะห์คุณภาพ เพื่อหลีกเลี่ยงที่จะเสียลูกค้าไป บริษัทเลี่ยงที่จะสรุปว่าคุณภาพจะไม่เปลี่ยนแปลงต่อให้ใช้วัตถุดิบที่มีราคาถูกกว่า ทั้งที่จริงมันใช้ได้ และความผิดพลาดจะยังคงเหมือนเดิม เมื่อในที่จริงวัตถุดิบนั้นไม่สามารถใช้ทดแทนได้ เพื่อให้ผลในการแสดงให้เห็นว่าค่าเฉลี่ยมีความเหมือนกัน การวิเคราะห์จะใช้วิธี 2 sample equivalence test (Stat > Equivalence Tests > Two Sample)

Equivalece

ใช้ข้อมูลเดิมในการทดสอบความเท่าเทียมกัน ผลลัพธ์ที่ได้ชี้ให้เห็นว่าไม่มีหลักฐานเพียงพอที่จะบอกว่าค่าเฉลี่ยทั้งสองค่าเหมือนกัน ดังนั้นบริษัทจึงไม่มั่นใจว่าคุณภาพของผลิตภัณฑ์นั้นจะมีปัญหาหรือไม่ ซึ่งถ้าทำการเปลี่ยนวัตถุดิบเป็นตัวที่มีราคาถูกกว่า ในการทดสอบด้วยวิธีการทดสอบความเท่าเทียมกัน บริษัทพบว่ามีโอกาสที่ค่าเฉลี่ยกระบวนการจะมีการเปลี่ยนแปลงได้

หมายเหตุ ถ้าดูจากผลลัพธ์ด้านบน คุณจะเห็นว่าวิธีการทดสอบความเท่าเทียมกันนั้นแตกต่างจากการทดสอบ t-test การทดสอบ two one-sided t-test ใช้เพื่อทดสอบสมมติฐานหลัก และวิธีทดสอบใช้พื้นที่ของความเท่าเทียมกันในการบอกว่าขนาดความแตกต่างคือระหว่างค่าเฉลี่ยที่พิจารณาในทางปฏิบัตินั้นไม่มีนัยสำคัญ เราจะดูรายละเอียดเพิ่มเติมในโพสต์ถัดไป

บทสรุป

ในการเลือกระหว่างวิธีการทดสอบความเท่าเทียมกัน และ วิธี t ต้องพิจารณาสิ่งที่คุณต้องการจะพิสูจน์ สิ่งใดก็ตามที่คุณต้องการพิสูจน์ความจริงควรจะนำมาไว้ที่สมมติฐานทางเลือก (alternative hypothesis)เพื่อทดสอบและเป็นภาระที่ต้องการการพิสูจน์ (Burden of proof) และสิ่งใดก็ตามแต่ที่เป็นสิ่งที่ก่อให้เกิดความเสียหายที่น้อยกว่าถ้าไม่ถูกต้องตามที่ตั้งสมมติฐานไว้ ให้นำไปไว้ที่สมมติฐานหลัก (null hypothesis) ถ้าคุณต้องการที่จะพิสูจน์ว่าค่าเฉลี่ยทั้งสองนี้มีค่าเหมือนกัน หรือ ค่าเฉลี่ยนั้นมีค่าเท่ากับค่าเป้าหมายหรือไม่ คุณควรเลือกใช้วิธีการทดสอบความเท่าเทียมกัน (equivalence test) แทนการใช้วิธีการทดสอบ t – test


บทความต้นฉบับ : Equivalence Testing for Quality Analysis (Part I): What are You Trying to Prove?

ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยสุวดี นำพาเจริญ,

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ