4 ขั้นตอนในการลดข้อบกพร่องของกระบวนการด้วยการใช้ แมชชีนเลิร์นนิ่งร่วมกับ R

หากคุณไม่ใช่นักเขียนโปรแกรม การทดลองใช้การวิเคราะห์เชิงคาดการณ์เพื่อระบุว่าปัจจัยใดเป็นสาเหตุที่ทําให้กระบวนการเกิดความล้มเหลว อาจจะดูเป็นเรื่องน่ากลัวในการจะนำมาใช้งาน

เรากําลังจะแสดงให้คุณเห็นว่ามันอาจจะไม่ได้น่ากลัวอย่างที่คิด! และนี่เป็นบทความที่สองที่มีเนื้อหาเกี่ยวกับการใช้ส่วนช่วยเหลือของ Minitab ทำงานร่วมกับ R และ Python อ่านบทความตัวอย่างแรก ได้ที่ creating Python-based visualizations

ในบทความนี้เราจะแสดงให้เห็นถึงวิธีการสร้าง Neural Network ใน Minitab โดยใช้ R – และจะทำเปรียบเทียบกับผลลัพธ์ที่ได้จากโมดูลการวิเคราะห์เชิงคาดการณ์ (Predictive Analytics) ที่มีของ Minitab

R คือ อะไร

R เป็นภาษาโปรแกรมแบบโอเพ่นซอร์สที่อาจใช้ดําเนินงานที่เกี่ยวข้องกับข้อมูลจํานวนมาก เช่น การแปลงข้อมูล (data transformation) การสร้างตัวแบบ (modelling) และ การแสดงภาพ (visualization) R มีแคตตาล็อกของไลบรารีสําหรับข้อมูลและการวิเคราะห์ทางสถิติ รวมถึงอัลกอริธึมของ machine learning แต่ก็ขึ้นอยู่กับความสามารถของผู้ใช้ว่าจะเข้าใจโครงสร้างของภาษาโปรแกรมนั้นแค่ไหน

ทําไมต้องรวม R เข้ากับ MINITAB?

โปรแกรม Minitab Statistical เป็นเครื่องมือที่พยายามลดข้อบกพร่องเพื่อให้เหมาะสมต่อการใช้งานของมืออาชีพ โดยมีการรวมเครื่องมือการวิเคราะห์ทางสถิติและการวิเคราะห์เชิงคาดการณ์ และยังให้ผู้ใช้สามารถเลือกใช้งานได้ง่าย

Minitab ได้ให้ส่วนเพิ่มความสามารถเพื่อให้รวมสคริปต์ R มาใช้ในการทำงานได้อย่างมีประสิทธิภาพ ในการปรับเปลี่ยนกระบวนการทำงานไม่ใช่เรื่องง่ายๆสำหรับนักเขียนโปรแกรมที่ไม่ได้มีความถนัดกับภาษา R  ดังนั้นการที่ Minitab ได้มีส่วนเพิ่มเพื่อให้มีการเข้าถึงสคริปต์ R เพื่อเสริมการทำงานของโปรแกรม ทำให้เข้าถึงผู้คนที่หลากหลายขึ้นรวมทั้งผลประโยชน์ที่พวกเขาได้รับก็มากขึ้นด้วย ส่วนเสริมของ Minitab ที่เพิ่มขึ้นมาทำงานร่วมกับ R เรียกว่า mtbr

ดูข้อมูลเพิ่มเติมได้ที่ https://support.minitab.com/en-us/minitab/21/integration/

วิธีการใช้ภาษา R เพื่อสร้าง Neural Networks ใน Minitab

สถานการณ์สมมติ:

ซูซานเป็นวิศวกรด้านคุณภาพที่ทํางานในบริษัทผลิตชิ้นส่วน พวกเขากำลังมีปัญหาด้านคุณภาพของหนึ่งในผลิตภัณฑ์ของพวกเขาเมื่อเร็ว ๆ นี้ – ปัญหาที่ว่า คือ มีแบชที่มีชิ้นส่วนบกพร่องจํานวนมากซึ่งนําไปสู่ต้นทุนที่เพิ่มขึ้นและคําสั่งซื้อที่ค้างส่ง

สิ่งท้าทาย:

ซูซานต้องหาวิธีการลดจำนวนข้อบกพร่องที่เกิดจากกระบวนการ  เธอโชคดีที่มีข้อมูลเกี่ยวกับพารามิเตอร์ของการผลิตและข้อมูลของแบชที่ไม่ผ่านและผ่านการตรวจสอบ

แนวคิดของซูซาน คือ การใช้การวิเคราะห์เชิงคาดการณ์เพื่อพยายามทําความเข้าใจว่า:

พารามิเตอร์ของการผลิตใดที่มีโอกาสต่อการเกิดแบชที่ไม่ผ่าน (มีจำนวนชิ้นส่วนบกพร่อง)

ค่าพารามิเตอร์ของกระบวนการควรต้องมีค่าเท่าไหร่ เพื่อลดโอกาสในการเกิดแบชที่ล้มเหลว

ซูซานต้องการใช้ตัวแบบจำลองเชิงคาดการณ์หลากหลายตัวเพื่อหาว่าตัวแบบใดที่จะเหมาะสมกับข้อมูลของเธอมากที่สุด

และด้วยความโชคดีของซูซานที่มีทางเลือกชของตัวแบบการถดถอย (regression model)  และ CART® ที่มีอยู่ใน Minitab รวมถึงตัวแบบ Random Forests® และ TreeNet® ที่เป็นส่วนเสริมสำหรับการวิเคราะห์เชิงคาดการณ์ (Predictive Analytics)

สิ่งที่ไม่คาดคิด

ก่อนที่ซูซานจะได้ลงมือกับสิ่งที่เธอคิดไว้ เจ้านายของเธอ ผู้ซึ่งเคยได้ยินเรื่องราวของ มาบ้าง และต้องการให้เธอได้ลองใช้ Neural Networks ในงานครั้งนี้ด้วย แต่ว่า Neural Networks ไม่มีในส่วนเสริมของ Minitab แต่โชคดีที่ R สามารถสร้าง Neural Networks ได้

เนื่องจากซูซานไม่ได้มีประสบการณ์กับการใช้ R แต่เธอสามารถเรียกใช้สคริปต์ R ร่วมกับ Minitab ด้วยการรวม R  (R integration) ของ Minitab ซึ่งมีข้อดีหลายประการ

การรวม R ของ Minitab (Minitab’s R integration) ทําให้ซูซานทำงานทั้งหมดได้ง่ายขึ้น โดยเก็บข้อมูลและผลลัพธ์ทั้งหมดไว้ใน Minitab ซูซานจะใช้ Minitab เพียงตัวเดียวในการทำงานแทนที่จะต้องใช้สองโปรแกรมที่แตกต่างกันทำงานแยกกัน และยังสามารถเปรียบเทียบประสิทธิภาพและผลลัพธ์ที่ได้จากตัวแบบต่างๆได้อย่างง่ายดาย รวมทั้งยังสามารถรวบรวมผลลัพธ์ต่างๆเพื่อทำเป็นงานนําเสนอสําหรับผู้จัดการของเธอได้อย่างง่ายดายโดยการส่งออกผลลัพธ์ต่างๆ (ตาราง กราฟ ฯลฯ … ) ที่ได้จาก Minitab ไปยัง PowerPoint

บทช่วยสอน: การวิเคราะห์

แล้วซูซานทําการวิเคราะห์เชิงคาดการณ์และการรวม R ของ Minitab ได้อย่างไร

ขั้นแรก เธอจะต้องเรียกข้อมูลไปไว้ที่ Minitab เสียก่อน แล้วด้วยบริษัทของเธอใช้  Minitab Connect อยู่แล้วดังนั้นข้อมูลการผลิตจากจุดต่างๆจะถูกรวบรวมไว้โดยอัตโนมัติ ทำให้เธอสามารถเรียกข้อมูลนี้ไปไว้ที่ Minitab ได้อย่างง่ายดาย

image png jan 11 2023 08 22 33 3502 pm

เมื่อเรียกข้อมูลลงใน Minitab เรียบร้อยแล้วเธอก็พร้อมที่จะเริ่มทำการวิเคราะห์กัน แต่ตอนนี้เรามาดูข้อมูลกันก่อน

picture1 jan 11 2023 08 25 42 9090 pm

แนวคิด คือ ใช้ข้อมูลในคอลัมน์ C1 ถึง C8 เพื่อดูว่าแบชใดที่น่าจะเป็นแบชที่ล้มเหลว (ที่คอลัมน์ Defects เมื่อค่า 1 หมายถึงข้อบกพร่อง) ซูซานจะเลือกใช้ตัวแบบที่มีอยู่ใน Minitab

ด้วยการเลือก Automated Machine Learning ที่มีใน Minitab® โดย Minitab จะใช้ตัวแบบทั้งหมดที่มีกับชุดข้อมูล แล้วเลือกตัวแบบที่ทำงานได้ดีที่สุด ซึ่งจะช่วยประหยัดเวลาได้อย่างมาก

image png jan 11 2023 08 28 59 7168 pm

ตัวแบบที่ทำงานได้ดีที่สุด คือ Random Forests และ TreeNet โดยตัวแบบ TreeNet มีอัตราการจัดประเภทที่ไม่ถูกต้อง (misclassification rate) ที่ดีที่สุด คือ 0.8% (0.008) ซึ่งหมายความว่ามีเพียง 0.8% ของการคาดการณ์ว่าแบชจะผ่านหรือล้มเหลวนั้นไม่ถูกต้อง ซูซานจึงเลือกตัวแบบ TreeNet เพราะให้ผลลัพธ์ที่มีประโยชน์และให้ข้อมูลมากกว่า Random Forests

ต่อไปก็ถึงเวลาที่จะรวมกับ Neural Network ที่เขียนด้วย R โดยใช้การรวม R ของ Minitab

และด้านล่างที่เห็นนี้คือตัวอย่างของสคริปต์

image png jan 11 2023 08 29 33 3564 pm

ส่วนผลลัพธ์ของ Neural Network ส่วนหนึ่งที่เราสามารถแสดงเป็นภาพได้ในรูปด้านล่างนี้  

aaa 1

ส่วนชั้นของปัจจัยตั้งต้น (Input layer) แสดงไว้ทางด้านซ้าย (แถวแรกของโหนด) ซึ่งมีทั้งหมดแปดตัว ค่าที่อยู่ด้านบนของแต่ละเส้น คือ ค่าน้ำหนักของ synaptic ซึ่งเป็นค่ามีผลต่อชั้นถัดไปของเครือข่าย และมีชั้นที่ซ่อนไว้อยู่อีกหนึ่งชั้น ซึ่งมีเซลล์ประสาท (neurons) สองเซลล์ และวงกลมสีน้ำเงินแทน bias ซึ่งสอดคล้องกับค่า intercept ของตัวแบบถดถอยมาตรฐาน

และสิ่งพิเศษจะเกิดขึ้นที่ชั้นที่ซ่อนอยู่  ส่วนเซลล์ประสาทผลลัพธ์ (output neuron) จะอยู่ทางด้านขวามือและแสดงถึงตัวแปรข้อบกพร่อง (Defects variable)

สคริปต์จะถูกบันทึกเป็นสคริปต์ R (. R) และในการเรียกให้ทำงานใน Minitab เราจะใช้คําสั่ง RSCRIPT ตามด้วยชื่อของสคริปต์ในเครื่องหมายคําพูด ตัวแบบมีค่าเปอร์เซ็นต์ของข้อผิดพลาดในการจัดประเภทผิดเท่ากับ 7% ซึ่งไม่แม่นยําเท่ากับตัวแบบTreeNet ดังนั้นซูซานจึงตัดสินใจใช้ตัวแบบ TreeNet แทน

จากนั้นเธอจะใช้ผลลัพธ์ที่ได้จากตัวแบบ TreeNet เพื่อทําความเข้าใจว่าพารามิเตอร์ใดมีอิทธิพลมากที่สุดในการทําให้เกิดแบชที่มีข้อบกพร่อง ประโยชน์อย่างหนึ่งของตัวแบบที่ได้จาก Minitab คือให้ข้อมูลเพิ่มเติมจำนวนมาก (เช่น กราฟที่ปรากฎอยู่ด้านล่าง) ตามมาตรฐานที่ต้องมี และทําให้การทำความเข้าใจว่าตัวแบบแต่ละตัวแบบมีความหมายอย่างไร

a

O2, Production Rate, Caustic และ MgSO4 ทั้ง 4 ปัจจัยนี้ดูเหมือนจะมีผลกระทบต่ออัตราการเกิดข้อบกพร่องเป็นอย่างมาก และ ตัวแบบ TreeNet ยังสามารถช่วยให้ทำความเข้าใจเกี่ยวกับผลกระทบของปัจจัยเหล่านี้ได้ดีขึ้นอีกด้วย

a 1

สิ่งที่พวกเขาต้องทำความเข้าใจ คือ ค่าพารามิเตอร์ของปัจจัยตั้งต้นควรเป็นเท่าใดเพื่อลดโอกาสในการเกิดแบชที่ล้มเหลว

จากกราฟจะเห็นว่าจุดที่มีค่าสูงขึ้นบนกราฟ หมายความว่า มีโอกาสในการเกิดแบชที่มีข้อบกพร่องต่ำกว่า และจากกราฟที่สร้างนี้แสดงให้เห็นว่า:

ค่าระดับของ O2 ควรอยู่ที่ 20.5 ถึง 22%

อัตราการผลิตที่ต่ำกว่าทําให้อัตราการเกิดข้อบกพร่องลดลง

ค่าของ Caustic ควรอยู่ที่ระดับ 60 ถึง 70%

ค่า MgSO4 ที่มากกว่า 6% จะส่งผลให้มีโอกาสเกิดแบชที่ล้มเหลวน้อยลง

จากผลลัพธ์ทั้งหมดที่ได้นี้ซูซานจะใช้แผนการควบคุมพารามิเตอร์ที่มีผลแต่ละตัว เพื่อทำให้พวกเขาได้ผลลัพธ์ในการผลิตที่มีโอกาสในการเกิดชิ้นส่วนบกพร่องอยู่ในระดับต่ำตามที่ต้องการ

และเมื่ออัตราข้อบกพร่องลดลง ทุกคนมีความสุขและซูซานก็จะได้รับการเลื่อนตําแหน่ง 🤩👌

สุดท้าย คุณอยากทดลองการวิเคราะห์แบบนี้ด้วยตัวคุณเองหรือไม่?

คุณสามารถดาวน์โหลดชุดข้อมูลและสคริปต์ R ได้ที่นี่

นี่คือลิงก์ไปยังหน้าสนับสนุนที่เกี่ยวกับการรวม R กับ Minitab

สำหรับการติดตั้งส่วนเสริมของโปรแกรมและขั้นตอนการทดสอบ R ใน Minitab  รวมถึงการเรียกใช้สคริปต์ Neural Net R ใน Minitab สามารถดูได้ในวิดีโอตามลิงก์

link

บทความต้นฉบับ : 4 Steps to Reduce Process Defects with Machine Learning and R Integration

ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยสุวดี นำพาเจริญ,

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ