วิธีการตีความค่า P-Value อย่างถูกต้อง

ค่า P-Value ถูกใช้ในสถิติทั่วทุกที่ ตั้งแต่การทดสอบ  t-tests ไปจนถึงการวิเคราะห์การถดถอย (regression analysis) ทุกคนรู้ดีว่าค่า P-Value ใช้กำหนดนัยสำคัญทางสถิติในการทดสอบสมมติฐาน(hypothesis test) ในความเป็นจริง ค่า P-Value มักจะกำหนดว่างานวิจัยใดจะได้รับการตีพิมพ์และโครงการใดจะได้รับเงินทุน

แม้ว่าค่า P-Value จะมีความสำคัญมาก แต่ค่า P-Value ก็เป็นแนวคิดที่คลุมเครือและมักตีความไม่ถูกต้อง เราจะตีความค่า P-Value อย่างไร?

ในโพสต์นี้ ฉันจะช่วยให้คุณเข้าใจค่า P-Value ในรูปแบบที่ชัดเจนยิ่งขึ้น และหลีกเลี่ยงการตีความผิดซึ่งมักเกิดขึ้นบ่อยซึ่งอาจทำให้คุณเสียเงินและเสียความน่าเชื่อถือได้

สมมติฐานหลัก(Null Hypothesis)ในการทดสอบสมมติฐานคืออะไร?

เพื่อที่จะเข้าใจค่า P-Value เราต้องเข้าใจสมมติฐานหลัก(Null Hypothesis) ก่อน

ทุกการทดลอง นักวิจัยจะทดสอบผลกระทบหรือความแตกต่างกันที่มีระหว่างกลุ่มต่างๆ ซึ่งอาจจะเป็นประสิทธิภาพของยาใหม่ วัสดุก่อสร้าง หรือปัจจัยที่มีผลอื่นๆ ที่มีประโยชน์ แต่น่าเสียดายที่นักวิจัยมักไม่ประสบผลสำเร็จ ซึ่งหมายความว่าไม่มีความแตกต่างระหว่างกลุ่ม การไม่มีความแตกต่างนี้ถูกเรียกว่าสมมติฐานหลัก(Null hypothesis) ซึ่งโดยพื้นฐานแล้วเป็นแนวคิดที่ผู้สนับสนุนฝ่ายโต้แย้งจะใช้เมื่อประเมินผลการทดลอง

ลองจินตนาการถึงการทดลองยาที่เรารู้ว่ามันไม่มีประสิทธิภาพเลย เพื่อดูว่าทำไมสมมติฐานหลักถึงเป็นจริง: ไม่มีความแตกต่างระหว่างประชากรแต่ละกลุ่มในการทดลอง

แม้ว่าสมมติฐานหลักจะเป็นจริง แต่ก็เป็นไปได้อย่างยิ่งที่จะมีผลกระทบในข้อมูลตัวอย่างเนื่องจากข้อผิดพลาดในการสุ่มตัวอย่าง ในความเป็นจริง แทบจะเป็นไปไม่ได้เลยที่กลุ่มตัวอย่างจะเท่ากับสมมติฐานหลักพอดี ดังนั้น ตำแหน่งของผู้สนับสนุนฝ่ายโต้แย้งคือความแตกต่างที่สังเกตได้ในตัวอย่างไม่ได้สะท้อนถึงความแตกต่างที่แท้จริงระหว่างประชากร(sample does not reflect a true difference between populations)

lab

ค่า P-Value คืออะไร?

ค่า P-Value ใช้เพื่อประเมินว่าข้อมูลตัวอย่างสนับสนุนข้อโต้แย้งของทนายความฝ่ายจำเลยที่ว่าสมมติฐานหลักเป็นจริงได้ดีเพียงใด โดยจะวัดว่าข้อมูลของคุณสนับสนุนสมมติฐานหลักมากเพียงใด หากสมมติฐานหลักเป็นจริง ผลที่สังเกตได้ในข้อมูลตัวอย่างของคุณมีโอกาสเกิดขึ้นมากเพียงใด

  • ค่า P-Value สูง: ข้อมูลของคุณมีสมมติฐานหลักที่เป็นจริง
  • ค่า P-Value ต่ำ: ข้อมูลของคุณไม่น่าจะเป็นไปได้ที่สมมติฐานหลักจะเป็นจริง

ค่า P-Value ที่ต่ำบ่งชี้ว่าตัวอย่างของคุณมีหลักฐานเพียงพอที่คุณสามารถปฏิเสธสมมติฐานหลักสำหรับประชากรทั้งหมดได้

quote
ฉันไม่เชื่อว่าโรงเรียนยังคงสอนเด็กๆ เกี่ยวกับสมมติฐานหลักอยู
ฉันจำได้ว่าเคยอ่านงานวิจัยชิ้นใหญ่ที่พิสูจน์แล้วว่าไม่เป็นจริงเมื่อหลายปีก่อน

คุณตีความค่า P-Value อย่างไร?

ในแง่ทางเทคนิค ค่า P-Value คือความน่าจะเป็นที่จะได้ผลลัพธ์อย่างน้อยที่สุดเท่ากับผลลัพธ์ในข้อมูลตัวอย่างของคุณ โดยถือว่าสมมติฐานหลักเป็นจริง

ตัวอย่างเช่น สมมติว่าการศึกษาประสิทธิภาพวัคซีนได้ค่า P-Value เท่ากับ 0.04 ค่า P-Value นี้บ่งชี้ว่าหากวัคซีนไม่มีผลใดๆ คุณจะได้รับค่าความแตกต่างที่สังเกตได้หรือมากกว่าจากการศึกษานั้นอยู่ 4% จากข้อผิดพลาดในการสุ่มตัวอย่าง

ค่า P-Value ตอบคำถามเพียงข้อเดียวเท่านั้น: ข้อมูลของคุณมีความน่าจะเป็นมากเพียงใด หากสมมติว่าสมมติฐานหลักเป็นจริง ค่า P-Value ไม่ได้วัดการสนับสนุนสมมติฐานทางเลือก(Alternative Hypothesis) ข้อจำกัดนี้พาเราไปสู่หัวข้อถัดไปเพื่อครอบคลุมการตีความค่า P-Value ที่ผิดพลาดซึ่งพบได้บ่อยมาก

needle

ready talktominitab

ค่า P-Value ไม่ใช่ความน่าจะเป็นที่จะเกิดข้อผิดพลาด

การตีความค่า P-Value ที่ไม่ถูกต้องเกิดขึ้นบ่อยครั้ง ข้อผิดพลาดที่พบบ่อยที่สุดคือการตีความค่า P-Value ว่าเป็นความน่าจะเป็นที่จะเกิดข้อผิดพลาดโดยไปปฏิเสธสมมติฐานหลักที่เป็นจริง (Type I error)

มีหลายเหตุผลว่าทำไมค่า P-Value ไม่สามารถเป็นอัตราข้อผิดพลาดได้

ประการแรก ค่า P-Value จะถูกคำนวณโดยอิงตามสมมติฐานหลักที่ว่านั้นเป็นจริงสำหรับประชากร และความแตกต่างในตัวอย่างนั้นเกิดจากโอกาสสุ่มทั้งหมด ดังนั้น ค่า P-Value จึงไม่สามารถบอกคุณได้ว่าความน่าจะเป็นที่สมมติฐานหลักนั้นเป็นจริงหรือเท็จ เพราะสมมติฐานหลักนั้นเป็นจริง 100% จากมุมมองของการคำนวณ

ประการที่สอง แม้ว่าค่า P-Value ที่ต่ำจะบ่งชี้ว่าข้อมูลของคุณไม่น่าจะเป็นไปได้หากเป็นสมมติฐานหลักที่แท้จริง แต่ค่า P-Value ดังกล่าวไม่สามารถประเมินได้ว่ากรณีใดในสองกรณีที่แข่งขันกันนั้นมีโอกาสเกิดขึ้นมากกว่ากัน:

  • สมมติฐานหลักนั้นเป็นจริง แต่ตัวอย่างของคุณนั้นผิดปกติ
  • สมมติฐานหลักนั้นเป็นเท็จ

การพิจารณาว่ากรณีใดมีความน่าจะเป็นมากกว่าต้องอาศัยความรู้ด้านเทคนิคและการศึกษาซ้ำ

กลับมาที่การศึกษาวัคซีนและเปรียบเทียบวิธีที่ถูกต้องและไม่ถูกต้องในการตีความค่า P-Value ที่ 0.04:

  • ถูกต้อง: หากสรุปว่าวัคซีนไม่มีผลใดๆ คุณจะเห็นความแตกต่างที่สังเกตได้หรือมากกว่านั้นใน 4% ของการศึกษาเนื่องมาจากข้อผิดพลาดในการสุ่มตัวอย่าง 
  • ไม่ถูกต้อง: หากคุณปฏิเสธสมมติฐานหลัก มีโอกาส 4% ที่คุณจะทำผิดพลาด

หากต้องการดูภาพกราฟิกที่แสดงถึงการทำงานของการทดสอบสมมติฐาน โปรดดูโพสต์ของฉัน: Understanding Hypothesis Tests: Significance Levels and P Values

อัตราข้อผิดพลาดที่แท้จริงคืออะไร?

คิดว่าความแตกต่างในการตีความนี้เป็นเพียงเรื่องของความหมายและสำคัญสำหรับนักสถิติที่พิถีพิถันเท่านั้นใช่หรือไม่ ลองคิดดูใหม่ มันสำคัญสำหรับคุณ

ถ้าค่า P-Value ไม่ใช่ค่าอัตราข้อผิดพลาด แล้วค่าอัตราข้อผิดพลาดจะเป็นอย่างไร (คุณเดาได้ไหมว่าตอนนี้ค่านี้กำลังมุ่งหน้าไปทางใด)

Sellke et al.* ได้ประมาณอัตราข้อผิดพลาดที่เกี่ยวข้องกับค่า P-Value ที่แตกต่างกัน แม้ว่าอัตราข้อผิดพลาดที่แม่นยำจะขึ้นอยู่กับสมมติฐานต่างๆ (ซึ่งฉันจะพูดถึงที่นี่) แต่ตารางได้สรุปไว้สำหรับสมมติฐานกลางๆ

caution
table

อัตราข้อผิดพลาดที่สูงขึ้นในตารางนี้ทำให้คุณประหลาดใจหรือไม่? น่าเสียดายที่การตีความค่า P-Value ผิดๆ ทั่วไปว่าเป็นอัตราข้อผิดพลาดทำให้เกิดภาพลวงตาว่ามีหลักฐานที่ยืนยันสมมติฐานหลักมากกว่าที่ควรจะเป็นอย่างมาก ดังที่เห็นได้ว่า หากคุณใช้การศึกษาเพียงการศึกษาเดียวที่มีค่า P-Value ใกล้เคียงกับ 0.05 เป็นฐานในการตัดสินใจ ความแตกต่างที่สังเกตได้ในตัวอย่างอาจไม่มีอยู่จริงในระดับประชากร ซึ่งอาจมีค่าใช้จ่ายสูง!

ตอนนี้คุณทราบวิธีตีความค่า P-Value แล้ว อ่านคำแนะนำ 5 ข้อของฉันเกี่ยวกับวิธีใช้ค่า P-Value และหลีกเลี่ยงข้อผิดพลาด

คุณสามารถอ่าน”my rebuttal to an academic journal that actually banned P values!”

การศึกษาที่น่าสนใจเกี่ยวกับความสามารถในการทำซ้ำผลการทดลองได้รับการตีพิมพ์ในเดือนสิงหาคม 2558 การศึกษานี้เน้นย้ำถึงความสำคัญของการทำความเข้าใจอัตราข้อผิดพลาดที่แท้จริง หากต้องการข้อมูลเพิ่มเติม โปรดอ่านโพสต์บล็อกของฉัน: P Values and the Replication of Experiments.

The American Statistical Association speaks out on how to use p-values!

*Thomas SELLKE, M. J. BAYARRI, and James O. BERGER, Calibration of p Values for Testing Precise Null Hypotheses, The American Statistician, February 2001, Vol. 55, No. 1

followus

บทความต้นฉบับ : How to Correctly Interpret P Values

ต้นฉบับนำมาจาก Minitab blog , แปลและเรียบเรียงโดยชลทิชา จํารัสพร

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ