หากคุณไม่ใช่นักเขียนโปรแกรม การทดลองใช้การวิเคราะห์เชิงคาดการณ์เพื่อระบุว่าปัจจัยใดเป็นสาเหตุที่ทําให้กระบวนการเกิดความล้มเหลว อาจจะดูเป็นเรื่องน่ากลัวในการจะนำมาใช้งาน
เรากําลังจะแสดงให้คุณเห็นว่ามันอาจจะไม่ได้น่ากลัวอย่างที่คิด! และนี่เป็นบทความที่สองที่มีเนื้อหาเกี่ยวกับการใช้ส่วนช่วยเหลือของ Minitab ทำงานร่วมกับ R และ Python อ่านบทความตัวอย่างแรก ได้ที่ creating Python-based visualizations
ในบทความนี้เราจะแสดงให้เห็นถึงวิธีการสร้าง Neural Network ใน Minitab โดยใช้ R – และจะทำเปรียบเทียบกับผลลัพธ์ที่ได้จากโมดูลการวิเคราะห์เชิงคาดการณ์ (Predictive Analytics) ที่มีของ Minitab
R คือ อะไร
R เป็นภาษาโปรแกรมแบบโอเพ่นซอร์สที่อาจใช้ดําเนินงานที่เกี่ยวข้องกับข้อมูลจํานวนมาก เช่น การแปลงข้อมูล (data transformation) การสร้างตัวแบบ (modelling) และ การแสดงภาพ (visualization) R มีแคตตาล็อกของไลบรารีสําหรับข้อมูลและการวิเคราะห์ทางสถิติ รวมถึงอัลกอริธึมของ machine learning แต่ก็ขึ้นอยู่กับความสามารถของผู้ใช้ว่าจะเข้าใจโครงสร้างของภาษาโปรแกรมนั้นแค่ไหน
ทําไมต้องรวม R เข้ากับ MINITAB?
โปรแกรม Minitab Statistical เป็นเครื่องมือที่พยายามลดข้อบกพร่องเพื่อให้เหมาะสมต่อการใช้งานของมืออาชีพ โดยมีการรวมเครื่องมือการวิเคราะห์ทางสถิติและการวิเคราะห์เชิงคาดการณ์ และยังให้ผู้ใช้สามารถเลือกใช้งานได้ง่าย
Minitab ได้ให้ส่วนเพิ่มความสามารถเพื่อให้รวมสคริปต์ R มาใช้ในการทำงานได้อย่างมีประสิทธิภาพ ในการปรับเปลี่ยนกระบวนการทำงานไม่ใช่เรื่องง่ายๆสำหรับนักเขียนโปรแกรมที่ไม่ได้มีความถนัดกับภาษา R ดังนั้นการที่ Minitab ได้มีส่วนเพิ่มเพื่อให้มีการเข้าถึงสคริปต์ R เพื่อเสริมการทำงานของโปรแกรม ทำให้เข้าถึงผู้คนที่หลากหลายขึ้นรวมทั้งผลประโยชน์ที่พวกเขาได้รับก็มากขึ้นด้วย ส่วนเสริมของ Minitab ที่เพิ่มขึ้นมาทำงานร่วมกับ R เรียกว่า mtbr
ดูข้อมูลเพิ่มเติมได้ที่ https://support.minitab.com/en-us/minitab/21/integration/
วิธีการใช้ภาษา R เพื่อสร้าง Neural Networks ใน Minitab
สถานการณ์สมมติ:
ซูซานเป็นวิศวกรด้านคุณภาพที่ทํางานในบริษัทผลิตชิ้นส่วน พวกเขากำลังมีปัญหาด้านคุณภาพของหนึ่งในผลิตภัณฑ์ของพวกเขาเมื่อเร็ว ๆ นี้ – ปัญหาที่ว่า คือ มีแบชที่มีชิ้นส่วนบกพร่องจํานวนมากซึ่งนําไปสู่ต้นทุนที่เพิ่มขึ้นและคําสั่งซื้อที่ค้างส่ง
สิ่งท้าทาย:
ซูซานต้องหาวิธีการลดจำนวนข้อบกพร่องที่เกิดจากกระบวนการ เธอโชคดีที่มีข้อมูลเกี่ยวกับพารามิเตอร์ของการผลิตและข้อมูลของแบชที่ไม่ผ่านและผ่านการตรวจสอบ
แนวคิดของซูซาน คือ การใช้การวิเคราะห์เชิงคาดการณ์เพื่อพยายามทําความเข้าใจว่า:
พารามิเตอร์ของการผลิตใดที่มีโอกาสต่อการเกิดแบชที่ไม่ผ่าน (มีจำนวนชิ้นส่วนบกพร่อง)
ค่าพารามิเตอร์ของกระบวนการควรต้องมีค่าเท่าไหร่ เพื่อลดโอกาสในการเกิดแบชที่ล้มเหลว
ซูซานต้องการใช้ตัวแบบจำลองเชิงคาดการณ์หลากหลายตัวเพื่อหาว่าตัวแบบใดที่จะเหมาะสมกับข้อมูลของเธอมากที่สุด
และด้วยความโชคดีของซูซานที่มีทางเลือกชของตัวแบบการถดถอย (regression model) และ CART® ที่มีอยู่ใน Minitab รวมถึงตัวแบบ Random Forests® และ TreeNet® ที่เป็นส่วนเสริมสำหรับการวิเคราะห์เชิงคาดการณ์ (Predictive Analytics)
สิ่งที่ไม่คาดคิด
ก่อนที่ซูซานจะได้ลงมือกับสิ่งที่เธอคิดไว้ เจ้านายของเธอ ผู้ซึ่งเคยได้ยินเรื่องราวของ มาบ้าง และต้องการให้เธอได้ลองใช้ Neural Networks ในงานครั้งนี้ด้วย แต่ว่า Neural Networks ไม่มีในส่วนเสริมของ Minitab แต่โชคดีที่ R สามารถสร้าง Neural Networks ได้
เนื่องจากซูซานไม่ได้มีประสบการณ์กับการใช้ R แต่เธอสามารถเรียกใช้สคริปต์ R ร่วมกับ Minitab ด้วยการรวม R (R integration) ของ Minitab ซึ่งมีข้อดีหลายประการ
การรวม R ของ Minitab (Minitab’s R integration) ทําให้ซูซานทำงานทั้งหมดได้ง่ายขึ้น โดยเก็บข้อมูลและผลลัพธ์ทั้งหมดไว้ใน Minitab ซูซานจะใช้ Minitab เพียงตัวเดียวในการทำงานแทนที่จะต้องใช้สองโปรแกรมที่แตกต่างกันทำงานแยกกัน และยังสามารถเปรียบเทียบประสิทธิภาพและผลลัพธ์ที่ได้จากตัวแบบต่างๆได้อย่างง่ายดาย รวมทั้งยังสามารถรวบรวมผลลัพธ์ต่างๆเพื่อทำเป็นงานนําเสนอสําหรับผู้จัดการของเธอได้อย่างง่ายดายโดยการส่งออกผลลัพธ์ต่างๆ (ตาราง กราฟ ฯลฯ … ) ที่ได้จาก Minitab ไปยัง PowerPoint
บทช่วยสอน: การวิเคราะห์
แล้วซูซานทําการวิเคราะห์เชิงคาดการณ์และการรวม R ของ Minitab ได้อย่างไร
ขั้นแรก เธอจะต้องเรียกข้อมูลไปไว้ที่ Minitab เสียก่อน แล้วด้วยบริษัทของเธอใช้ Minitab Connect อยู่แล้วดังนั้นข้อมูลการผลิตจากจุดต่างๆจะถูกรวบรวมไว้โดยอัตโนมัติ ทำให้เธอสามารถเรียกข้อมูลนี้ไปไว้ที่ Minitab ได้อย่างง่ายดาย
เมื่อเรียกข้อมูลลงใน Minitab เรียบร้อยแล้วเธอก็พร้อมที่จะเริ่มทำการวิเคราะห์กัน แต่ตอนนี้เรามาดูข้อมูลกันก่อน
แนวคิด คือ ใช้ข้อมูลในคอลัมน์ C1 ถึง C8 เพื่อดูว่าแบชใดที่น่าจะเป็นแบชที่ล้มเหลว (ที่คอลัมน์ Defects เมื่อค่า 1 หมายถึงข้อบกพร่อง) ซูซานจะเลือกใช้ตัวแบบที่มีอยู่ใน Minitab
ด้วยการเลือก Automated Machine Learning ที่มีใน Minitab® โดย Minitab จะใช้ตัวแบบทั้งหมดที่มีกับชุดข้อมูล แล้วเลือกตัวแบบที่ทำงานได้ดีที่สุด ซึ่งจะช่วยประหยัดเวลาได้อย่างมาก
ตัวแบบที่ทำงานได้ดีที่สุด คือ Random Forests และ TreeNet โดยตัวแบบ TreeNet มีอัตราการจัดประเภทที่ไม่ถูกต้อง (misclassification rate) ที่ดีที่สุด คือ 0.8% (0.008) ซึ่งหมายความว่ามีเพียง 0.8% ของการคาดการณ์ว่าแบชจะผ่านหรือล้มเหลวนั้นไม่ถูกต้อง ซูซานจึงเลือกตัวแบบ TreeNet เพราะให้ผลลัพธ์ที่มีประโยชน์และให้ข้อมูลมากกว่า Random Forests
ต่อไปก็ถึงเวลาที่จะรวมกับ Neural Network ที่เขียนด้วย R โดยใช้การรวม R ของ Minitab
และด้านล่างที่เห็นนี้คือตัวอย่างของสคริปต์
ส่วนผลลัพธ์ของ Neural Network ส่วนหนึ่งที่เราสามารถแสดงเป็นภาพได้ในรูปด้านล่างนี้
ส่วนชั้นของปัจจัยตั้งต้น (Input layer) แสดงไว้ทางด้านซ้าย (แถวแรกของโหนด) ซึ่งมีทั้งหมดแปดตัว ค่าที่อยู่ด้านบนของแต่ละเส้น คือ ค่าน้ำหนักของ synaptic ซึ่งเป็นค่ามีผลต่อชั้นถัดไปของเครือข่าย และมีชั้นที่ซ่อนไว้อยู่อีกหนึ่งชั้น ซึ่งมีเซลล์ประสาท (neurons) สองเซลล์ และวงกลมสีน้ำเงินแทน bias ซึ่งสอดคล้องกับค่า intercept ของตัวแบบถดถอยมาตรฐาน
และสิ่งพิเศษจะเกิดขึ้นที่ชั้นที่ซ่อนอยู่ ส่วนเซลล์ประสาทผลลัพธ์ (output neuron) จะอยู่ทางด้านขวามือและแสดงถึงตัวแปรข้อบกพร่อง (Defects variable)
สคริปต์จะถูกบันทึกเป็นสคริปต์ R (. R) และในการเรียกให้ทำงานใน Minitab เราจะใช้คําสั่ง RSCRIPT ตามด้วยชื่อของสคริปต์ในเครื่องหมายคําพูด ตัวแบบมีค่าเปอร์เซ็นต์ของข้อผิดพลาดในการจัดประเภทผิดเท่ากับ 7% ซึ่งไม่แม่นยําเท่ากับตัวแบบTreeNet ดังนั้นซูซานจึงตัดสินใจใช้ตัวแบบ TreeNet แทน
จากนั้นเธอจะใช้ผลลัพธ์ที่ได้จากตัวแบบ TreeNet เพื่อทําความเข้าใจว่าพารามิเตอร์ใดมีอิทธิพลมากที่สุดในการทําให้เกิดแบชที่มีข้อบกพร่อง ประโยชน์อย่างหนึ่งของตัวแบบที่ได้จาก Minitab คือให้ข้อมูลเพิ่มเติมจำนวนมาก (เช่น กราฟที่ปรากฎอยู่ด้านล่าง) ตามมาตรฐานที่ต้องมี และทําให้การทำความเข้าใจว่าตัวแบบแต่ละตัวแบบมีความหมายอย่างไร
O2, Production Rate, Caustic และ MgSO4 ทั้ง 4 ปัจจัยนี้ดูเหมือนจะมีผลกระทบต่ออัตราการเกิดข้อบกพร่องเป็นอย่างมาก และ ตัวแบบ TreeNet ยังสามารถช่วยให้ทำความเข้าใจเกี่ยวกับผลกระทบของปัจจัยเหล่านี้ได้ดีขึ้นอีกด้วย
สิ่งที่พวกเขาต้องทำความเข้าใจ คือ ค่าพารามิเตอร์ของปัจจัยตั้งต้นควรเป็นเท่าใดเพื่อลดโอกาสในการเกิดแบชที่ล้มเหลว
จากกราฟจะเห็นว่าจุดที่มีค่าสูงขึ้นบนกราฟ หมายความว่า มีโอกาสในการเกิดแบชที่มีข้อบกพร่องต่ำกว่า และจากกราฟที่สร้างนี้แสดงให้เห็นว่า:
ค่าระดับของ O2 ควรอยู่ที่ 20.5 ถึง 22%
อัตราการผลิตที่ต่ำกว่าทําให้อัตราการเกิดข้อบกพร่องลดลง
ค่าของ Caustic ควรอยู่ที่ระดับ 60 ถึง 70%
ค่า MgSO4 ที่มากกว่า 6% จะส่งผลให้มีโอกาสเกิดแบชที่ล้มเหลวน้อยลง
จากผลลัพธ์ทั้งหมดที่ได้นี้ซูซานจะใช้แผนการควบคุมพารามิเตอร์ที่มีผลแต่ละตัว เพื่อทำให้พวกเขาได้ผลลัพธ์ในการผลิตที่มีโอกาสในการเกิดชิ้นส่วนบกพร่องอยู่ในระดับต่ำตามที่ต้องการ
และเมื่ออัตราข้อบกพร่องลดลง ทุกคนมีความสุขและซูซานก็จะได้รับการเลื่อนตําแหน่ง 🤩👌
สุดท้าย คุณอยากทดลองการวิเคราะห์แบบนี้ด้วยตัวคุณเองหรือไม่?
คุณสามารถดาวน์โหลดชุดข้อมูลและสคริปต์ R ได้ที่นี่
นี่คือลิงก์ไปยังหน้าสนับสนุนที่เกี่ยวกับการรวม R กับ Minitab
สำหรับการติดตั้งส่วนเสริมของโปรแกรมและขั้นตอนการทดสอบ R ใน Minitab รวมถึงการเรียกใช้สคริปต์ Neural Net R ใน Minitab สามารถดูได้ในวิดีโอตามลิงก์
บทความต้นฉบับ : 4 Steps to Reduce Process Defects with Machine Learning and R Integration
ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยสุวดี นำพาเจริญ,
บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย
เพิ่มเติมเกี่ยวกับบริษัท Minitab
Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ