ค่า P-Value ถูกใช้ในสถิติทั่วทุกที่ ตั้งแต่การทดสอบ t-tests ไปจนถึงการวิเคราะห์การถดถอย (regression analysis) ทุกคนรู้ดีว่าค่า P-Value ใช้กำหนดนัยสำคัญทางสถิติในการทดสอบสมมติฐาน(hypothesis test) ในความเป็นจริง ค่า P-Value มักจะกำหนดว่างานวิจัยใดจะได้รับการตีพิมพ์และโครงการใดจะได้รับเงินทุน
แม้ว่าค่า P-Value จะมีความสำคัญมาก แต่ค่า P-Value ก็เป็นแนวคิดที่คลุมเครือและมักตีความไม่ถูกต้อง เราจะตีความค่า P-Value อย่างไร?
ในโพสต์นี้ ฉันจะช่วยให้คุณเข้าใจค่า P-Value ในรูปแบบที่ชัดเจนยิ่งขึ้น และหลีกเลี่ยงการตีความผิดซึ่งมักเกิดขึ้นบ่อยซึ่งอาจทำให้คุณเสียเงินและเสียความน่าเชื่อถือได้
สมมติฐานหลัก(Null Hypothesis)ในการทดสอบสมมติฐานคืออะไร?
เพื่อที่จะเข้าใจค่า P-Value เราต้องเข้าใจสมมติฐานหลัก(Null Hypothesis) ก่อน
ทุกการทดลอง นักวิจัยจะทดสอบผลกระทบหรือความแตกต่างกันที่มีระหว่างกลุ่มต่างๆ ซึ่งอาจจะเป็นประสิทธิภาพของยาใหม่ วัสดุก่อสร้าง หรือปัจจัยที่มีผลอื่นๆ ที่มีประโยชน์ แต่น่าเสียดายที่นักวิจัยมักไม่ประสบผลสำเร็จ ซึ่งหมายความว่าไม่มีความแตกต่างระหว่างกลุ่ม การไม่มีความแตกต่างนี้ถูกเรียกว่าสมมติฐานหลัก(Null hypothesis) ซึ่งโดยพื้นฐานแล้วเป็นแนวคิดที่ผู้สนับสนุนฝ่ายโต้แย้งจะใช้เมื่อประเมินผลการทดลอง
ลองจินตนาการถึงการทดลองยาที่เรารู้ว่ามันไม่มีประสิทธิภาพเลย เพื่อดูว่าทำไมสมมติฐานหลักถึงเป็นจริง: ไม่มีความแตกต่างระหว่างประชากรแต่ละกลุ่มในการทดลอง
แม้ว่าสมมติฐานหลักจะเป็นจริง แต่ก็เป็นไปได้อย่างยิ่งที่จะมีผลกระทบในข้อมูลตัวอย่างเนื่องจากข้อผิดพลาดในการสุ่มตัวอย่าง ในความเป็นจริง แทบจะเป็นไปไม่ได้เลยที่กลุ่มตัวอย่างจะเท่ากับสมมติฐานหลักพอดี ดังนั้น ตำแหน่งของผู้สนับสนุนฝ่ายโต้แย้งคือความแตกต่างที่สังเกตได้ในตัวอย่างไม่ได้สะท้อนถึงความแตกต่างที่แท้จริงระหว่างประชากร(sample does not reflect a true difference between populations)
ค่า P-Value คืออะไร?
ค่า P-Value ใช้เพื่อประเมินว่าข้อมูลตัวอย่างสนับสนุนข้อโต้แย้งของทนายความฝ่ายจำเลยที่ว่าสมมติฐานหลักเป็นจริงได้ดีเพียงใด โดยจะวัดว่าข้อมูลของคุณสนับสนุนสมมติฐานหลักมากเพียงใด หากสมมติฐานหลักเป็นจริง ผลที่สังเกตได้ในข้อมูลตัวอย่างของคุณมีโอกาสเกิดขึ้นมากเพียงใด
- ค่า P-Value สูง: ข้อมูลของคุณมีสมมติฐานหลักที่เป็นจริง
- ค่า P-Value ต่ำ: ข้อมูลของคุณไม่น่าจะเป็นไปได้ที่สมมติฐานหลักจะเป็นจริง
ค่า P-Value ที่ต่ำบ่งชี้ว่าตัวอย่างของคุณมีหลักฐานเพียงพอที่คุณสามารถปฏิเสธสมมติฐานหลักสำหรับประชากรทั้งหมดได้
คุณตีความค่า P-Value อย่างไร?
ในแง่ทางเทคนิค ค่า P-Value คือความน่าจะเป็นที่จะได้ผลลัพธ์อย่างน้อยที่สุดเท่ากับผลลัพธ์ในข้อมูลตัวอย่างของคุณ โดยถือว่าสมมติฐานหลักเป็นจริง
ตัวอย่างเช่น สมมติว่าการศึกษาประสิทธิภาพวัคซีนได้ค่า P-Value เท่ากับ 0.04 ค่า P-Value นี้บ่งชี้ว่าหากวัคซีนไม่มีผลใดๆ คุณจะได้รับค่าความแตกต่างที่สังเกตได้หรือมากกว่าจากการศึกษานั้นอยู่ 4% จากข้อผิดพลาดในการสุ่มตัวอย่าง
ค่า P-Value ตอบคำถามเพียงข้อเดียวเท่านั้น: ข้อมูลของคุณมีความน่าจะเป็นมากเพียงใด หากสมมติว่าสมมติฐานหลักเป็นจริง ค่า P-Value ไม่ได้วัดการสนับสนุนสมมติฐานทางเลือก(Alternative Hypothesis) ข้อจำกัดนี้พาเราไปสู่หัวข้อถัดไปเพื่อครอบคลุมการตีความค่า P-Value ที่ผิดพลาดซึ่งพบได้บ่อยมาก
ค่า P-Value ไม่ใช่ความน่าจะเป็นที่จะเกิดข้อผิดพลาด
การตีความค่า P-Value ที่ไม่ถูกต้องเกิดขึ้นบ่อยครั้ง ข้อผิดพลาดที่พบบ่อยที่สุดคือการตีความค่า P-Value ว่าเป็นความน่าจะเป็นที่จะเกิดข้อผิดพลาดโดยไปปฏิเสธสมมติฐานหลักที่เป็นจริง (Type I error)
มีหลายเหตุผลว่าทำไมค่า P-Value ไม่สามารถเป็นอัตราข้อผิดพลาดได้
ประการแรก ค่า P-Value จะถูกคำนวณโดยอิงตามสมมติฐานหลักที่ว่านั้นเป็นจริงสำหรับประชากร และความแตกต่างในตัวอย่างนั้นเกิดจากโอกาสสุ่มทั้งหมด ดังนั้น ค่า P-Value จึงไม่สามารถบอกคุณได้ว่าความน่าจะเป็นที่สมมติฐานหลักนั้นเป็นจริงหรือเท็จ เพราะสมมติฐานหลักนั้นเป็นจริง 100% จากมุมมองของการคำนวณ
ประการที่สอง แม้ว่าค่า P-Value ที่ต่ำจะบ่งชี้ว่าข้อมูลของคุณไม่น่าจะเป็นไปได้หากเป็นสมมติฐานหลักที่แท้จริง แต่ค่า P-Value ดังกล่าวไม่สามารถประเมินได้ว่ากรณีใดในสองกรณีที่แข่งขันกันนั้นมีโอกาสเกิดขึ้นมากกว่ากัน:
- สมมติฐานหลักนั้นเป็นจริง แต่ตัวอย่างของคุณนั้นผิดปกติ
- สมมติฐานหลักนั้นเป็นเท็จ
การพิจารณาว่ากรณีใดมีความน่าจะเป็นมากกว่าต้องอาศัยความรู้ด้านเทคนิคและการศึกษาซ้ำ
กลับมาที่การศึกษาวัคซีนและเปรียบเทียบวิธีที่ถูกต้องและไม่ถูกต้องในการตีความค่า P-Value ที่ 0.04:
- ถูกต้อง: หากสรุปว่าวัคซีนไม่มีผลใดๆ คุณจะเห็นความแตกต่างที่สังเกตได้หรือมากกว่านั้นใน 4% ของการศึกษาเนื่องมาจากข้อผิดพลาดในการสุ่มตัวอย่าง
- ไม่ถูกต้อง: หากคุณปฏิเสธสมมติฐานหลัก มีโอกาส 4% ที่คุณจะทำผิดพลาด
หากต้องการดูภาพกราฟิกที่แสดงถึงการทำงานของการทดสอบสมมติฐาน โปรดดูโพสต์ของฉัน: Understanding Hypothesis Tests: Significance Levels and P Values
อัตราข้อผิดพลาดที่แท้จริงคืออะไร?
คิดว่าความแตกต่างในการตีความนี้เป็นเพียงเรื่องของความหมายและสำคัญสำหรับนักสถิติที่พิถีพิถันเท่านั้นใช่หรือไม่ ลองคิดดูใหม่ มันสำคัญสำหรับคุณ
ถ้าค่า P-Value ไม่ใช่ค่าอัตราข้อผิดพลาด แล้วค่าอัตราข้อผิดพลาดจะเป็นอย่างไร (คุณเดาได้ไหมว่าตอนนี้ค่านี้กำลังมุ่งหน้าไปทางใด)
Sellke et al.* ได้ประมาณอัตราข้อผิดพลาดที่เกี่ยวข้องกับค่า P-Value ที่แตกต่างกัน แม้ว่าอัตราข้อผิดพลาดที่แม่นยำจะขึ้นอยู่กับสมมติฐานต่างๆ (ซึ่งฉันจะพูดถึงที่นี่) แต่ตารางได้สรุปไว้สำหรับสมมติฐานกลางๆ
อัตราข้อผิดพลาดที่สูงขึ้นในตารางนี้ทำให้คุณประหลาดใจหรือไม่? น่าเสียดายที่การตีความค่า P-Value ผิดๆ ทั่วไปว่าเป็นอัตราข้อผิดพลาดทำให้เกิดภาพลวงตาว่ามีหลักฐานที่ยืนยันสมมติฐานหลักมากกว่าที่ควรจะเป็นอย่างมาก ดังที่เห็นได้ว่า หากคุณใช้การศึกษาเพียงการศึกษาเดียวที่มีค่า P-Value ใกล้เคียงกับ 0.05 เป็นฐานในการตัดสินใจ ความแตกต่างที่สังเกตได้ในตัวอย่างอาจไม่มีอยู่จริงในระดับประชากร ซึ่งอาจมีค่าใช้จ่ายสูง!
ตอนนี้คุณทราบวิธีตีความค่า P-Value แล้ว อ่านคำแนะนำ 5 ข้อของฉันเกี่ยวกับวิธีใช้ค่า P-Value และหลีกเลี่ยงข้อผิดพลาด
คุณสามารถอ่าน”my rebuttal to an academic journal that actually banned P values!”
การศึกษาที่น่าสนใจเกี่ยวกับความสามารถในการทำซ้ำผลการทดลองได้รับการตีพิมพ์ในเดือนสิงหาคม 2558 การศึกษานี้เน้นย้ำถึงความสำคัญของการทำความเข้าใจอัตราข้อผิดพลาดที่แท้จริง หากต้องการข้อมูลเพิ่มเติม โปรดอ่านโพสต์บล็อกของฉัน: P Values and the Replication of Experiments.
The American Statistical Association speaks out on how to use p-values!
*Thomas SELLKE, M. J. BAYARRI, and James O. BERGER, Calibration of p Values for Testing Precise Null Hypotheses, The American Statistician, February 2001, Vol. 55, No. 1
บทความต้นฉบับ : How to Correctly Interpret P Values
ต้นฉบับนำมาจาก Minitab blog , แปลและเรียบเรียงโดยชลทิชา จํารัสพร
บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย
เพิ่มเติมเกี่ยวกับบริษัท Minitab
Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ