ทำไมวิศวกรเคมีควรทำความรู้จัก ANOVA

พูดกันโดยทั่วไป หากคุณเป็นวิศวกรเคมี คุณอาจจะกำลังพัฒนาและออกแบบกระบวนการผลิตที่เกี่ยวกับสารเคมี ซึ่งหมายความว่าคุณอาจต้องใช้หลักการเคมี ชีววิทยา ฟิสิกส์ และคณิตศาสตร์เพื่อแก้ปัญหาที่เกี่ยวข้องกับการผลิตหรือการใช้สารเคมี เชื้อเพลิง ยา อาหาร และผลิตภัณฑ์อื่นๆ มากมาย ซึ่งแตกต่างจากวิศวกรสาขาอื่นๆ ด้วยเวลาทั้งหมดที่ทุ่มเทให้กับด้านวิทยาศาสตร์ หากคุณไม่มีเวลาให้กับสถิติได้มากเท่าที่คุณต้องการ ไม่ต้องกลัว Minitab อยู่ที่นี่แล้ว ตอนนี้เรามาพูดถึงว่าทำไม การวิเคราะห์ความแปรปรวน (Analysis of Variance (ANOVA)) ถึงเป็นอาวุธลับของวิศวกรเคมี

ทำไมถึงควรทำความรู้จัก ANOVA

การประยุกต์ใช้ในอุตสาหกรรมมากมายเกี่ยวข้องกับการทดลองโดยมีเป้าหมายเพื่อทำความเข้าใจว่าแต่ละกลุ่มมีความแตกต่างกันหรือไม่ ในแง่สถิติ เราพิจารณาปัจจัยหนึ่ง – สมมติว่าเป็น ประเภทตัวเร่งปฏิกิริยา – และเราต้องการเข้าใจว่าระดับของปัจจัยนั้น – ให้เราบอกว่าตัวเร่งปฏิกิริยา 1, ตัวเร่งปฏิกิริยา 2, ตัวเร่งปฏิกิริยา 3 และตัวเร่งปฏิกิริยา 4 – มีความแตกต่างกันอย่างมีนัยสำคัญทางสถิติหรือไม่ เมื่อการวัดแต่ละกลุ่มเป็นข้อมูลวัด(continuous data) และเป็นไปตามสมมติฐาน(assumptions) เราใช้ ANOVA เพื่อเปรียบเทียบค่าเฉลี่ยของกลุ่ม ในแง่หนึ่ง ชื่อ “การวิเคราะห์ความแปรปรวน” เป็นการเรียกชื่อผิดเพราะเราสนใจที่จะเปรียบเทียบวิธีการของกลุ่ม อย่างไรก็ตาม โดยการวิเคราะห์ความแปรผันของข้อมูลภายใน(within)ระดับกลุ่มและระหว่าง(between)กลุ่ม ทำให้เราสามารถระบุได้ว่าค่าเฉลี่ยของกลุ่มมีความแตกต่างกันทางสถิติหรือไม่


เรียนรู้เกี่ยวกับการแสดงภาพ (Visualization) และกราฟ (Graph) ที่สามารถทำให้ข้อมูลเชิงลึกของคุณง่ายต่อการแบ่งปันและเข้าใจได้ง่ายขึ้น!

watch

ANOVA ทดสอบสมมติฐานหลัก(null hypothesis) ที่ว่าค่าเฉลี่ยประชากร (แทนด้วยสัญลักษณ์ µ ) เท่ากันทั้งหมด เราจะประเมินค่าเฉลี่ยประชากรโดยใช้ค่าเฉลี่ยตัวอย่าง หากสมมติฐานหลักนี้ถูกปฏิเสธ เราก็สรุปได้ว่าค่าเฉลี่ยประชากรไม่เท่ากันทั้งหมด

สมมติฐานหลัก(null hypothesis) :

Ho: µCatalyst 1 = µCatalyst 2 = µCatalyst 3 = µCatalyst 4

boxplot of product yield 003

ในภาษาธรรมดา เราถือว่าค่าเฉลี่ยเท่ากันทุกกลุ่ม และเรารวบรวมหลักฐานเพื่อพิสูจน์คำพูดนั้น ถ้าเราสังเกตเห็นว่าค่าเฉลี่ยระหว่างวิธีการต่างๆมีความแตกต่างกันมาก เรามักจะปฏิเสธความเชื่อนั้นและถือว่ามีความแตกต่างของแต่ละระดับภายในกลุ่ม

ตัวอย่าง ONE-WAY ANOVA

ลองนึกภาพว่าวิศวกรเคมีต้องการเปรียบเทียบประสิทธิผลของการใช้ตัวเร่งปฏิกิริยาที่แตกต่างกันสี่ตัว เธอทำให้ตัวเร่งปฏิกิริยาร้อนขึ้นด้วยผลิตภัณฑ์ทำให้เกิดปฏิกิริยา เมื่อใช้ ANOVA วิศวกรสามารถระบุได้ว่าประสิทธิผลของผลิตภัณฑ์โดยใช้ตัวเร่งปฏิกิริยาที่แตกต่างกันนั้นแตกต่างกันอย่างมีนัยสำคัญหรือไม่

อันดับแรก วิศวกรทำการรวบรวมข้อมูลของเธอ ดังที่คุณเห็นด้านล่าง

catalyst data

ต่อไปวิศวกรทำการวิเคราะห์ one-way ANOVA

ค่า p-value ของการวิเคราะห์ Product Yield ANOVA มีค่าน้อย ซึ่งบ่งชี้ว่ามีโอกาสน้อยมากว่าผลลัพธ์ที่เราสังเกตนั้น สมมติฐานหลัก(Null hypothesis) จะเป็นจริง สมมติฐานที่ว่าค่าเฉลี่ยประสิทธิผลจากตัวเร่งปฏิกิริยามีค่าเท่ากันทั้งหมด เนื่องจากค่า p-value มีค่าน้อยกว่าระดับนัยสำคัญ 5% (เรากำลังใช้ alpha = 0.05) เราจึงปฏิเสธสมมติฐานหลักและสรุปได้ว่า ประสิทธิผลของการใช้ตัวเร่งปฏิกิริยาแต่ละตัวมีค่าเฉลี่ยที่แตกต่างกัน

analysis of variance

วิศวกรทราบดีว่ามีบางกลุ่มที่แตกต่างออกไป คำถามเชิงตรรกะต่อไปคือแล้วมันคือกลุ่มใด?

การใช้วิธีการ TUKEY’S ในการวิเคราะห์เปรียบเทียบแต่ละกลุ่ม (Multiple Comparisons)

ในขณะที่ ANOVA บอกเราว่ามีบางกลุ่มที่แตกต่างออกไป วิศวกรต้องการการเปรียบเทียบในเชิงลึกมากขึ้นเพื่อทำความเข้าใจว่าค่าเฉลี่ยของกลุ่มใดแตกต่างกัน มี “การเปรียบเทียบ(Comparison)” ด้วยเหตุผลนี้เอง ในตัวอย่างของเรา วิศวกรเคมีใช้การเปรียบเทียบ Tukey เพื่อทดสอบความแตกต่างระหว่างคู่ของกลุ่มอย่างเป็นทางการ เพื่อทำความเข้าใจว่ากลุ่มใดมีความแตกต่างอย่างมีนัยสำคัญทางสถิติ

การทดสอบ Tukey’s multiple comparison เป็นการทดสอบดั้งเดิมที่นิยมที่สุดของการทดสอบหลายๆแบบที่สามารถใช้เพื่อกำหนดว่าค่าเฉลี่ยของกลุ่มใดแตกต่างจากระหว่างกลุ่มอื่นๆที่เหลือ วิธีการ Tukey’s ถูกเรียกใช้หลังจาก ANOVA (ซึ่งเป็นเหตุผลที่คุณอาจเคยได้ยินที่เรียกกันว่าเป็นการทดสอบแบบ post hoc) และสามารถใช้เพือสร้างช่วงความเชื่อมั่นสำหรับความแตกต่างของค่าเฉลี่ยระหว่างคู่ในแต่ละระดับของปัจจัย ในขณะที่ควบคุมอัตราความผิดพลาดของกลุ่ม (family error rate) ให้อยู่ในระดับที่คุณระบุ

tukey simultaneous 95 cis

ในตัวอย่างของเรา กราฟแสดงช่วงความเชื่อมั่น Tukey พร้อมกันเลยทีเดียว ที่ช่วงความเชื่อมั่นของความแตกต่างระหว่างค่าเฉลี่ยของตัวเร่งปฏิกิริยา Catalyst 2 และ 4 คือ 3.114 ถึง 15.886 ช่วงนี้ไม่มีค่าศูนย์ บ่งชี้ได้ว่าค่าเฉลี่ยระหว่างคู่นี้แตกต่างอย่างมีนัยสำคัญ วิศวกรสามารถใช้ค่าประมาณของความแตกต่างนี้เพื่อพิจารณาว่าความแตกต่างนั้นมีนัยสำคัญในทางปฏิบัติหรือไม่

ในทางกลับกัน ช่วงความเชื่อมั่นสำหรับคู่ค่าเฉลี่ยที่เหลือทั้งหมดมีค่าศูนย์รวมอยู่ด้วย ซึ่งบ่งชี้ว่าความแตกต่างไม่มีนัยสำคัญ

ทำไมไม่ทำการทดสอบ T-TEST เพื่อทดสอบความแตกต่าง?

เป็นคำถามที่ดีและเป็นคำถามที่เกิดขึ้นมากมาย! คำตอบคือมันเกี่ยวข้องกับความเสี่ยงของการตัดสินใจผิดพลาด โดยเฉพาะอย่างยิ่ง ความเสี่ยงในการสรุปอย่างไม่ถูกต้องว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติ ซึ่งเราเรียกว่าความเสี่ยง alpha เมื่อเราดำเนินการทดสอบหนึ่งครั้ง มีโอกาส 5% ที่เราจะบอกว่ามันความแตกต่างโดยที่ในความเป็นจริงไม่แตกต่าง สำหรับการทดสอบตัวเร่งปฏิกิริยาทั้ง 4 ตัวนี้ จะส่งผลให้ต้องมีการทดสอบ T-TEST ถึง 6 ครั้ง!

ความน่าจะเป็นจากการทำการทดสอบที่มีอย่างน้อยหนึ่งครั้งมีนัยสำคัญจะเป็นเท่าใด?

โอกาส(ผลลัพธ์ที่มีนัยสำคัญอย่างน้อยหนึ่งครั้ง) = 1 − โอกาส(ผลลัพธ์ไม่มีนัยสำคัญ/ไม่แตกต่าง)

= 1 − (1 − 0.05)6

≈ 0.264

ดังนั้น เมื่อพิจารณาการทดสอบ 6 ครั้ง เรามีโอกาส 26% ที่จะตรวจจับผลลัพธ์ที่มีนัยสำคัญอย่างน้อยหนึ่งครั้ง แม้ว่าการทดสอบทั้งหมดจะไม่มีนัยสำคัญก็ตาม การทดสอบ Post hoc หลังการทดสอบจะควบคุมอัตราความผิดพลาดของการทดลอง เพื่อให้เข้าใจง่ายขึ้น เราต้องการให้แน่ใจว่าโอกาสที่เราระบุคู่ที่แตกต่างของตัวเร่งปฏิกิริยาอย่างไม่ถูกต้องจะยังคงอยู่ที่ 5% นั่นคือสิ่งที่การทดสอบของ Tukey ทำเพื่อเรา!

คำตอบอยู่ใน ANOVA

การใช้ ANOVA ช่วยให้วิศวกรเคมีสามารถทดสอบสารผสมเพื่อดูว่าผลลัพธ์มีนัยสำคัญทางสถิติหรือไม่ ที่สำคัญเท่าเทียมกัน เธอยังสามารถระบุได้ว่าทั้งกลุ่มมีความแตกต่างกันหรืออาจเป็นเพียงส่วนย่อยของกลุ่มโดยใช้การทดสอบเปรียบเทียบ(Comparison) ในตัวอย่างของเรา มีเพียงตัวเร่งปฏิกิริยา 2 และตัวเร่งปฏิกิริยา 4 เท่านั้นที่แตกต่างกันอย่างมีนัยสำคัญทางสถิติเกี่ยวกับประสิทธิผล จากสารสนเทศที่ได้นี้ วิศวกรเคมีอาจเริ่มมองหาตัวเร่งปฏิกิริยาอื่นๆ เพื่อพิจารณาว่าตัวเร่งปฏิกิริยาตัวใดที่คุ้มค่าที่สุด มีอายุการเก็บรักษานานที่สุด หรือเข้าถึงได้ง่ายที่สุดโดยรู้ว่าจะให้ประสิทธิผลในปริมาณที่ใกล้เคียงกัน


ทดลองใช้คำสั่ง Comparison บางตัวและวิเคราะห์ด้วยตัวเอง ดาวน์โหลดซอฟต์แวร์ Minitab Statistical Software ทดลองใช้ได้ฟรี 30 วัน ได้แล้ววันนี้

try

บทความต้นฉบับ : Why Chemical Engineers Should Get to Know ANOVA

ต้นฉบับนำมาจาก Minitab blog , แปลและเรียบเรียงโดยชลทิชา จํารัสพร

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ