แนะนำเบื้องต้นการวิเคราะห์การจำแนกกลุ่มด้วยเทคนิค Discriminant

Minitab มีเครื่องมือทางสถิติอยู่หลายตัวที่ถูกนำมาใช้งานไม่บ่อยนัก และในบรรดาเครื่องมือเหล่านั้นเครื่องมือที่เกี่ยวกับพหุตัวแปร (Multivariate) Minitab มีเครื่องมือเกี่ยวกับการวิเคราะห์พหุตัวแปรอยู่หลายอย่าง เช่น การวิเคราะห์องค์ประกอบหลัก (Principal component analysis) การวิเคราะห์องค์ประกอบ (Factor analysis) การจำแนกกลุ่มด้วยวิธี Clustering, และอื่นๆ ในบทความนี้ผมต้องการให้คุณได้เห็นภาพของเครื่องมือเกี่ยวกับการวิเคราะห์ พหุตัวแปรที่เรียกว่าการจำแนกกลุ่มด้วยเทคนิค Discriminant และวิธีการใช้เครื่องมือนี้

การจำแนกกลุ่มด้วยเทคนิค Discriminant จะนำมาใช้เพื่อแบ่งกลุ่มข้อมูลออกเป็น 2 กลุ่มหรือมากกว่านั้น ถ้าคุณมีสิ่งตัวอย่างที่ถูกจำแนกกลุ่มไว้แล้ว โดยพื้นฐานการแยกแยะกลุ่มสามารถจัดการได้ง่าย เมื่อกลุ่มต่างๆถูกจัดแยกไว้แล้วข้อมูลใหม่ที่ได้มาจะถูกจัดลงในกลุ่มต่างๆ ตามคุณสมบัติที่กำหนดไว้ การจำแนกกลุ่มด้วยเทคนิค Discriminant
จะถูกนำมาใช้เพื่อวิเคราะห์ว่าข้อมูลนั้นควรจัดลงในกลุ่มใด

เครื่องมือนี้จะเป็นประโยชน์ต่องานการคัดแยกชาติพันธุ์ (Species) อย่างมาก เราจะใช้ตัวอย่างนี้ในการอธิบายการทำงานของเครื่องมือ และถ้าคุณต้องการที่จะทำตามตัวอย่างในบทความนี้และคุณยังไม่มี Minitab คุณสามารถดาวน์โหลด ฟรีใช้งานได้ 30 days

การทำงานของการจำแนกกลุ่มด้วยเทคนิค Discriminant

ผมมีข้อมูล (data set) หนึ่งชุดเกี่ยวกับสุนัขป่าพันธุ์ Rocky Mountain และ Arctic เรารู้แล้วว่าข้อมูลที่เราเก็บมานั้นเป็นของพันธุ์ไหน เป้าหมายของการวิเคราะห์ครั้งนี้คือข้อมูลที่เรามีนั้นเป็นตัวแบ่งแยกกลุ่ม อย่างไร และนำสิ่งที่ได้(สมการ)มาใช้ในการแยกข้อมูลว่าจะเป็นกลุ่มใด

ใน Minitab เราเริ่มจากการสร้าง worksheet แบบทั่วไป โดยให้คอลัมน์เป็นพันธุ์ของสุนัขป่า และอีก 9 คอลัมน์เป็นค่าวัดของแต่ละข้อมูล

เมื่อ Worksheet ของเรามีค่าทำนายที่เป็นตัวแปรต่อเนื่องและตัวจำแนกกลุ่มที่อยู่ในแต่ละ คอลัมน์ครบ เราจะเริ่มที่ Stat>Multivariate>Discriminant Analysis จากนั้นทำการกรอกข้อมูลในไดอะลอก

Discrimdia

ในช่อง ‘Group’ เราจะใส่ชื่อคอลัมน์ ที่มีข้อมูลที่เป็นตัวบ่งบอกกลุ่มของข้อมูล ในกรณีตัวอย่างนี้คือ ‘Location’ ซึ่งเป็นค่าบอกพันธุ์ของสุนัขป่า ส่วนตัวแปรทำนายอยู่ที่ X1-X9 ซึ่งเป็นค่าวัดต่างๆของสุนัขป่าแต่ละตัว ซึ่งมีทั้งหมด 9 หมวดหมู่ ซึ่งเราจะใช้เป็นคุณสมบัติในการจำแนกเพื่อแยกว่าเป็นกลุ่มใด

หมายเหตุก่อนที่เราจะให้โปรแกรมเริ่มวิเคราะห์ เราจะเริ่มจากการใช้ฟังก์ชั่นเส้นตรง (Linear Discrimination Function) ก่อน โดยมีสมมติฐานว่า Covariance Matrix นั้นมีความเท่ากันในทุกกลุ่ม ซึ่งการพิสูจน์ตรงนี้ใช้วิธี Bartlett’s Test (ซึ่งมีให้ใน Minitab เช่นกัน) และเมื่อกรอกข้อมูลในไดอะลอกเสร็จเลือก ‘OK’ เพื่อให้โปรแกรมแสดงผลลัพธ์

การใช้ Linear Discriminant Function ในการจำแนกกลุ่มให้กับข้อมูลตัวใหม่

เราจะได้ส่วนที่สำคัญที่สุดของการวิเคราะห์ คือ สมการเชิงเส้นเพื่อการจำแนกกลุ่ม (Linear Discriminant Function) จากตัวอย่างของเราจะมีหน้าตาแบบนี้

Function

สมการนี้จะใช้เพื่อจำแนกข้อมูลใหม่ว่าควรจะอยู่กลุ่มใด การใช้สมการนี้คือนำสัมประสิทธิ์ที่อยู่ในแต่ละกลุ่มเพื่อจำแนกข้อมูลว่าควร จะอยู่กลุ่มไหน ใน Minitab ยังมีตัวเลือก “options” ใน subdialog ตัวอย่างเช่น ถ้าเรามีข้อมูลที่มีค่าแน่นอนแต่ละค่าวัด (X1,….,X9) และถ้าเราทำการประมวลผลอีกครั้ง ผลลัพธ์ที่เราจะได้จะเป็นเช่นนี้

Predic

ซึ่งผลลัพธ์นี้เราจะได้ค่าความน่าจะเป็นของข้อมูลตัวใหม่ว่าควรจะอยู่ใน กลุ่มใด 2 กลุ่มที่เรามีตามตัวอย่าง ซึ่งจากผลลัพธ์จะเห็นว่าความน่าจะเป็นที่อยู่ในกลุ่ม AR คือ 1 ซึ่งหมายความว่าข้อมูลใหม่ของเราอยู่ในกลุ่ม AR แต่บางครั้งในการวิเคราะห์อาจให้ผลลัพธ์ค่าความน่าจะเป็นนั้นมีความใกล้ เคียงกันมาก นั้นหมายความว่าทำให้เราไม่สามารถจำแนกได้อย่างชัดเจน

ฉํนหวังว่าคุณจะได้แนวคิดการใช้งานการจำแนกกลุ่มด้วยเทคนิค Discriminant ด้วย Minitab เพื่อทำการตัดสินใจในงานของคุณได้มากขึ้น


บทความต้นฉบับ : An Overview of Discriminant Analysis

ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยสุวดี นำพาเจริญ,

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ