ด้วย Minitab ได้เพิ่มกราฟ correlogram ให้กับคลังกราฟของการทำ Visualizations ซึ่งเป็นส่วนหนึ่งของการเปิดตัวโปรแกรมสำเร็จรูปทางสถิติ Minitab เมื่อไม่นานมานี้ และฉันต้องการสำรวจว่าทำไมกราฟเหล่านี้ จึงเป็นเครื่องมือที่ได้รับความนิยมและมีประโยชน์สำหรับการวิเคราะห์ขั้นสูง
พูดง่าย ๆ สำหรับกราฟ correlogram (บางครั้งถูกเรียกว่า correlation plot หรือ correlation matrix) เป็นการแสดงภาพสำหรับค่าสถิติสหสัมพันธ์ ซึ่งใช้ในการประเมินลักษณะการสุ่ม และระบุรูปแบบในข้อมูลของคุณได้อย่างง่ายดาย โดยระบุตัวแปรที่มีความสัมพันธ์อย่างมากกับอีกตัวแปรหนึ่งได้อย่างรวดเร็ว สำหรับการวิเคราะห์ข้อมูล ขั้นตอนแรกที่สำคัญในกระบวนการวิเคราะห์เชิงคาดการณ์ (predictive analytics) คือ การตรวจสอบและการทำความเข้าใจโครงสร้างข้อมูลของคุณ รวมถึงการรู้ว่าตัวแปรต่าง ๆ มีความสัมพันธ์สูงกับอีกตัวแปรหรือไม่ ซึ่งเราจะบอกขั้นตอนการใช้งานต่อไป
และอย่างที่คุณเห็น กราฟ Correlogram เป็นเครื่องมือที่ใช้แสดงภาพที่ยอดเยี่ยม ซึ่งจะช่วยเหลือบนเส้นทางการวิเคราะห์เชิงคาดการณ์ของคุณ เพื่อดึงประสิทธิภาพออกมาได้ดียิ่งขึ้น
เรียนรู้เกี่ยวกับเวอร์ชั่นล่าสุดของ Minitab Statistical Software เพิ่มเติมในการสัมมนาผ่านเว็บที่กำลังจะมีขึ้น:
ใช้กราฟ CORRELOGRAM เพื่อระบุค่าสถิติสหสัมพันธ์ได้อย่างรวดเร็ว
คุณอาจกำลังคิดว่า “แต่ฉันใช้การวิเคราะห์สหสัมพันธ์ด้วยกราฟ matrix plot เพื่อประเมินความสัมพันธ์และลักษณะการสุ่ม ซึ่งสิ่งนี้มันแตกต่างกันอย่างไร?” เอาล่ะ เมื่อคุณมีตัวแปรเพียงไม่กี่ตัวและมีจำนวนตัวอย่างที่ค่อนข้างน้อย การใช้การวิเคราะห์สหสัมพันธ์ร่วมกับกราฟ matrix plot ก็สมเหตุสมผลดี
แต่ลองมาดูตัวอย่างของวิศวกรผู้ออกแบบเซลล์เชื้อเพลิงสำหรับรถยนต์ไฟฟ้า เพื่อแสดงให้เห็นว่า เหตุใด กราฟ correlogram จึงเป็นเครื่องมือที่ทรงพลัง เมื่อมีตัวแปรและจำนวนตัวอย่างที่มาก
อุณหภูมิในการทำปฏิกิริยา (operating temperature) เป็นหนึ่งในตัวแปรที่ส่งผลต่อประสิทธิภาพของเซลล์เชื้อเพลิง ควบคู่ไปกับความดัน (pressure) อัตราการไหล (flow rates) และความชื้น (humidity) ซึ่งการออกแบบเซลล์เชื้อเพลิงใด ๆ จะต้องระบุ อุณหภูมิในการทำปฏิกิริยา (operating temperature) ที่เหมาะสมที่สุด เพื่อให้การออกแบบเซลล์เชื้อเพลิงมีประสิทธิภาพสูงสุด ดังนั้น วิศวกรจึงจำเป็นต้องเข้าใจความสัมพันธ์ระหว่างปริมาณไฮโดรเจนในเซลล์เชื้อเพลิง ปริมาณออกซิเจนในเซลล์เชื้อเพลิง และอุณหภูมิที่ไฮโดรเจนและออกซิเจนถูกผลักเข้าไปในเซลล์เชื้อเพลิง เพื่อสร้างพลังงาน
วิศวกรได้ทำการวางแผน เพื่อจะประเมินว่า ปฏิกิริยาเคมีระหว่างออกซิเจนและไฮโดรเจนที่มีอุณหภูมิสูงขึ้นหรือต่ำลง สามารถส่งผลกระทบต่อพลังงานของเซลล์เชื้อเพลิงหรือไม่ โดยใช้ข้อมูลทั้ง 14 ตัวในแต่ละมาตรวัดเหล่านี้
หลังจากใช้การวิเคราะห์สหสัมพันธ์ในโปรแกรม Minitab (ทำง่าย ๆ โดยการคลิกเมนู Stat > Basic Statistics > Correlation) วิศวกรจะสังเกตความสัมพันธ์ระหว่างตัวแปรในการศึกษานี้ ทั้งตารางแสดงค่าสถิติสหสัมพันธ์ และกราฟ matrix plot
จากผลลัพธ์ในตาราง พบว่า ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (Pearson correlation coefficient) ระหว่างปริมาณไฮโดรเจนและเวลาการใช้พลังงาน (นาที) คือ −0.791 และค่า p-value คือ 0.001 ซึ่งค่า p-value น้อยกว่าระดับนัยสำคัญที่ 0.05 แสดงให้เห็นว่า ค่าสถิติสหสัมพันธ์แตกต่างจาก 0 อย่างมีนัยสำคัญ โดยความสัมพันธ์นี้อธิบายได้ว่า เมื่อปริมาณไฮโดรเจนเพิ่มขึ้น ส่งผลให้เวลาการใช้พลังงาน (นาที) ที่สร้างขึ้นนั้นมีแนวโน้มลดลง (โปรดจำไว้ว่า ค่าสถิติสหสัมพันธ์ บอกระดับของความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว โดยมีค่าได้ตั้งแต่ -1 [มีความสัมพันธ์เชิงลบอย่างมาก] และ +1 [มีความสัมพันธ์เชิงบวกอย่างมาก] และหากค่าสถิติสหสัมพันธ์ มีค่าใกล้เคียง 0 นั่นหมายถึงว่า ไม่มีความสัมพันธ์เชิงเส้นที่ชัดเจนระหว่างทั้งสองตัวแปร)
สำหรับกราฟ matrix plot แสดงความสัมพันธ์แต่ละตัวแปร และเป็นเครื่องมือที่มีประโยชน์สำหรับการแสดงให้เห็นภาพของการวิเคราะห์นี้ สำหรับตัวอย่างด้านล่าง โปรดทราบว่า ความสัมพันธ์ระหว่างเวลาการใช้พลังงาน (นาที) และปริมาณไฮโดรเจนอยู่ที่มุมล่างซ้าย
และกราฟ matrix plot ยังเป็นเครื่องมือที่มีประโยชน์ในการระบุค่าผิดปกติที่อาจจะเกิดขึ้น แต่มันไม่ได้ออกแบบมาเพื่อระบุค่าสถิติสหสัมพันธ์ที่มีค่ามากหรือน้อยได้อย่างรวดเร็ว ตัวอย่างเช่น หากคุณดูที่กราฟ matrix plot ด้านบน คุณจะใช้เวลานานแค่ไหนในการตัดสินใจว่า ค่าสถิติสหสัมพันธ์ใดบ้างที่มีค่าใกล้เคียง -1 หรือ +1
ฉะนั้น เพื่อตอบคำถามนั้นได้อย่างรวดเร็ว กราฟ correlogram จึงเป็นเครื่องมือที่มีประโยชน์มากกว่า โดยเฉพาะอย่างยิ่ง เมื่อคุณนำเสนอการวิเคราะห์ประเภทนี้กับผู้อื่นที่ต้องการสแกน และทำความเข้าใจข้อมูลอย่างรวดเร็ว
พิจารณาด้วยข้อมูลชุดเดียวกันนำเสนอด้วย Correlogram กราฟข้างใต้ (อยู่ใน Minitab Statistical Software : Graph Correlogram) :
คุณสังเกตเห็นไหมว่า? ตาของคุณมองไปที่กล่องสีแดงเข้มที่ด้านล่างอย่างรวดเร็ว ระหว่างตัวแปร เวลาการใช้พลังงาน (นาที) และปริมาณออกซิเจน ซึ่งความเข้มของสีของกราฟ correlograms จะสอดคล้องกันกับค่าสัมประสิทธิ์สหสัมพันธ์ โดยที่กล่องสีเข้มกว่าจะแสดงถึงค่าสถิติสหสัมพันธ์ที่มีค่ามาก ด้วยเหตุนี้ กราฟ correlograms จึงแสดงให้เห็นของค่าสถิติสหสัมพันธ์ได้อย่างชัดเจนและสามารถตรวจดูได้ และเมื่อใช้กราฟ correlograms ในกรณีนี้ วิศวกรสามารถเข้าใจความสัมพันธ์ในข้อมูลได้โดยไม่ต้องพยายามอะไรมากมาย
ใช้กราฟ CORRELOGRAM ด้วยข้อมูลที่มีจำนวนมาก
ตอนนี้ เราพิจารณาการวิเคราะห์ด้วยตัวแปร 14 ตัวและข้อมูลจำนวน 1,000 แถว ซึ่งรายละเอียดเฉพาะแต่ละตัวแปรนั้นไม่สำคัญ มันอาจจะเป็นผลจากการสำรวจสินค้าอุปโภคบริโภค หรือค่าวัดในกระบวนการผลิตแผงวงจรก็ได้ หากคุณขอให้ทีมของคุณเลือกค่าสถิติสหสัมพันธ์ที่มีความสัมพันธ์กันอย่างมากที่สุด ด้วยการพิจารณาจากกราฟ matrix plot ด้านล่าง (ใกล้เคียงกับ +1 หรือ -1 มาก ๆ) จะต้องใช้เวลานานแค่ไหนในการระบุค่าสถิติสหสัมพันธ์ที่มีความสัมพันธ์กันอย่างมากที่สุด ?
ทีนี้ดูข้อมูลเดียวกันที่นำเสนอผ่านกราฟ correlogram ด้านล่าง สังเกตว่า ค่าสถิติสหสัมพันธ์ที่มีค่าน้อย ๆ จะถูกแสดงด้วยสีจาง ในขณะที่ตาของคุณจะถูกดึงดูดไปยังบริเวณที่มีค่าสถิติสหสัมพันธ์ที่มีค่าสูง ลองนึกภาพดูว่า ทีมของคุณจะระบุข้อมูลที่มีนัยสำคัญได้เร็วขึ้นกว่าเดิมแค่ไหน!
การศึกษาความสัมพันธ์ระหว่างตัวแปร เช่น การวิเคราะห์สหสัมพันธ์ เป็นสิ่งสำคัญสำหรับการวิเคราะห์เชิงคาดการณ์ที่มีประสิทธิภาพ ขณะที่การระบุความสัมพันธ์นั้นเป็นเรื่องง่าย เมื่อวิเคราะห์ข้อมูลด้วยตัวแปรที่ค่อนข้างน้อย หรือถ้ามีจำนวนของตัวแปรและจำนวนของชุดข้อมูลมากขึ้น ก็สามารถระบุได้เช่นเดียวกัน ฉะนั้นแล้ว การทำความเข้าใจเกี่ยวกับความสัมพันธ์ถือเป็นสิ่งที่จำเป็น และด้วยประสิทธิภาพของกราฟ correlogram รวมทั้งการวิเคราะห์ทางสถิติด้วยโปรแกรม Minitab จะทำให้การวิเคราะห์นั้นดียิ่งขึ้น เร็วยิ่งขึ้น และง่ายยิ่งขึ้น โดยเฉพาะอย่างยิ่งสำหรับปัญหาที่ซับซ้อนมากขึ้นของคุณ!
พร้อมที่จะสำรวจข้อมูลของคุณด้วยกราฟที่ยอดเยี่ยมอย่างเช่น Correlograms ใน Minitab Statistical Software แล้วหรือยัง?
บทความต้นฉบับ : Learning to Love Correlograms in the Latest Minitab Release
ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยรัฐพงษ์ ยอดสีมา
บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร, บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย
เพิ่มเติมเกี่ยวกับบริษัท Minitab
Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ