การผลิตไวน์รสชาติดีจะต้องทำอะไรบ้าง มาใช้สมการถดถอยทางสถิติในการสร้างตัวแบบเพื่อผลิตไวน์รสชาติดีๆกัน

เวลานึกถึงไวน์ที่ดีน่าจะอธิบายออกมาได้ประมาณนี้  “ไวน์ที่มีรสชาติดีควรมีความเข้มข้นแต่ไม่หนัก มีแอลกอฮอล์ปริมาณสูง แต่ไม่มีความเป็นกรดและมีแทนนินมากเกินไป มีรสชาติคล้ายเชอรี่สีดำแต่มีความนุ่มนวล”  ดอกไม้และผลไม้จะเป็นตัวแทนในการบรรยายถึงไวน์เพื่อให้ผู้ดื่มได้เข้าใจถึงรสชาติของไวน์แก้วนั้น คำพูดเหล่านั้นจะเป็นการพิจารณาเปรียบเปรยให้เห็นถึงว่าการเปลี่ยนผลไม้มาเป็นไวน์นั้นคือศิลปะชั้นดีอย่างหนึ่ง

รสชาติต่างๆนั้นเกิดจากการเปลี่ยนองค์ประกอบทางเคมีที่มีผลต่อรสชาติของไวน์ ดังนั้นการบรรยายถึงรสชาติของไวน์ในลักษณะงานศิลปะยังเป็นศาสตร์อย่างหนึ่งและตรงนี้เองที่ตัวถดถอยเชิงสถิติ (Statistical regression) สามารถช่วยให้การบรรยายถึงรสชาตินั้นดียิ่งขึ้น

รสชาติไวน์เป็นอย่างไร

เรารู้ว่าไวน์มีองค์ประกอบทางเคมีที่ประกอบขึ้นจากผลไม้และเครื่องเทศ ดังนั้นเพื่อให้เกิดความเข้าใจเราจึงใช้คำบรรยายมาอธิบายรสชาติต่างๆ องค์ประกอบทางเคมีต่างๆซึ่งเป็นตัวที่ทำให้เรารับรู้รสชาติว่า หวาน ขม หรือ เปรี้ยว

ปัจจัยที่เป็นเรื่องจำเป็นในการผลิตไวน์ให้ดีที่ขาดไม่ได้มี 3 สิ่งคือ องุ่นที่ดีมีคุณภาพ ขั้นตอนการผลิตไวน์ และการหมักบ่มไวน์ ในแต่ละขั้นตอนของการทำไวน์จะส่งผลต่อรสชาติของไวน์

รสชาติที่เกิดขึ้นมาจากการเปลี่ยนแปลงสารเคมีที่อยู่ในไวน์ โดยเกิดขึ้นในแต่ละขั้นตอนการทำไวน์ รสชาติต่างๆมาจากองุ่นที่ใช้มาผลิตและกระบวนการผลิตไวน์ ซึ่งการจัดการกับปัจจัยทั้งสองนี้จะทำให้ได้ไวน์ที่มีรสชาติดีขึ้น

รสชาติของไวน์อาจจะดูเหมือนไม่มีอยู่จริงแต่ว่ามันมาจากองค์ประกอบของสารเคมีที่เกิดขึ้น ซึ่งการบรรยายถึงไวน์ในเชิงงานศิลปะ จริงๆแล้วมันคือวิทยาศาสตร์ ความเป็นกรดทำให้เกิดรสชาติเปรี้ยว  แอลกอฮอล์ส่งผลต่อรสชาติด้วยเช่นกัน ซึ่งปริมาณแอทานอลทำให้เกิดรสขม หวาน และ เปรี้ยว ดังนั้นการใช้องค์ความรู้เพื่อให้ได้ไวน์รสชาติตามที่ต้องการจะต้องทำความเข้าใจก่อนว่าขั้นตอนการผลิตนั้นส่งผลต่อองค์ประกอบเคมีนี้อย่างไร

การระบุไวน์ที่ดีจากไวน์ที่แย่

แน่นอนนักชิมไวน์แต่ละคนย่อมให้ผลในการระบุรสชาติไวน์แตกต่างกัน (De Gustibus non est disputandum : “ในเรื่องของรสชาติ เราจะไม่มีข้อถกเถียงกัน”) อย่างไรก็ตามบางครั้งเราก็สามารถเปรียบเทียบได้ว่าไวน์ใดดีกว่า และโดยทั่วไปก็สามารถแยกแยะไวน์ที่ดีจากไวน์ที่แย่ได้

กรณีนี้จะเป็นกรณีที่ต้องมีการทำความเข้าใจกับเหตุการณ์ที่มีความแตกต่างและสิ่งรบกวนที่เป็นส่วนสำคัญในการศึกษา ตัวแบบทางสถิติจะเป็นเครื่องมือที่มีประสิทธิผลอย่างมากในการระบุปัจจัยสำคัญที่โดดเด่นในเหตุการณ์นั้นๆว่าคืออะไร

ในบทความนี้จึงเป็นเรื่องราวเกี่ยวกับข้อมูลของรสชาติไวน์ และเทคนิคของการสร้างตัวแบบที่แสดงให้เห็นผลที่ตัวแปรมีส่วนและสำคัญต่อสิ่งที่ศึกษาซึ่งเป็นสิ่งที่นักชิมไวน์ใช้ในประสบการณ์ของตัวเอง

การวิเคราะห์จะทำให้เห็นภาพว่าแม้แต่เรื่องของรสชาติไวน์ก็สามารถสร้างตัวแบบมาประเมินหรือวัดได้ถ้าเราเลือกตัวแบบการวิเคราะห์อย่างเหมาะสม

เราใช้ตัวสถิติเพื่อแสดงให้เห็นว่าไวน์มีองค์ประกอบเคมีอะไรบ้าง การมีปริมาณซัลเฟตหรือคอลไรด์ที่มีมากกว่าจะทำให้รสชาติดีขึ้นหรือไม่ ซึ่งจากการทำความเข้าใจเรื่องนี้จะทำให้การผลิตไวน์ได้รสชาติดีขึ้น เราจะทำการพิจารณาตัวแปรที่จะเป็นตัวแปรทำนาย เช่น ความเป็นกรด ปริมาณซัลเฟอร์ไดออกไซด์ และเปอร์เซ็นต์แอลกอฮอล์


ในบทความนี้ยังเป็นการแสดงให้เห็นว่า Minitab 19 มีการเพิ่มคำสั่งทำงานใหม่อะไรบ้าง และถ้าคุณอยากลองใช้งาน Minitab 19 ด้วยตนเอง คุณสามารถดาวน์โหลด Minitab 19 ใช้ฟรีได้ 30 วัน


การทดสอบรสชาติ

ในศาสตร์ของการทำไวน์จะมีการประเมินรสชาติของไวน์ขาวและแดงในเชิงคุณภาพเป็นสองแบบ คือ ดี (1) และ แย่ (0)  ซึ่งเป้าหมายของเราในการระบุตัวแปรต่างๆเพื่อดูว่ามีผลอย่างมีนัยสำคัญต่อคุณภาพของไวน์หรือไม่

1 5

การใช้ตัวแบบการถดถอยในการวิเคราะห์ข้อมูลแอตทริบิวต์รสชาติของไวน์

กรณีนี้การใช้เพียงกราฟอาจไม่เพียงพอในการระบุว่าตัวแปรใดมีความสำคัญ ทั้งนี้เพราะว่าข้อมูลมีความซับซ้อนและมีความผันแปรอยู่มาก การวิเคราะห์ตัวแบบถดถอยเพื่อทำให้เห็นปัจจัยที่มีหลายตัวที่ส่งผลต่อผลลัพธ์ น่าจะเป็นวิธีที่ใช้ดูตัวแปรที่ส่งผลต่อรสชาติของไวน์ได้ดีที่สุด

อย่างไรก็ตามคณะผู้ชิมรสชาติไวน์ทำการประเมินไวน์และจัดลำดับคุณภาพจากสูงไปต่ำ ซึ่งเท่ากับเราจะได้ข้อมูลแบบไบนารี่มา และเราจะต้องมีการดำเนินการต่อ การใช้ตัวแบบถดถอยมาตรฐานที่ใช้ ANOVA ในการวิเคราะห์ข้อมูลแบบไบนารี่อาจจะไม่ใช่ทางเลือกที่ดี

เพราะว่าข้อมูลไบนารี่จะเป็นตัวแปรที่มีการแจกแจงแบบไบโนเมียลมากกว่าการแจกแจงแบบปกติ ที่มีเส้นโค้งการแจกแจงแบบโค้งระฆังคว่ำ ซึ่งการใช้ตัวแบบถดถอยมาตรฐานจะทำให้ผลการทำนายความน่าจะเป็นมีค่าติดลบหรือมากกว่า 100% เราอาจจะได้ตัวแบบที่มีความซับซ้อนเกินไป ได้ความสัมพันธ์ของ interaction ของปัจจัยที่มีอาจจะดูเหมือนมีนัยสำคัญ และความผันแปรของข้อมูลไบนารี่มีลักษณะไม่คงที่

แต่เรามีทางออกที่ง่ายกว่า เนื่องจากข้อมูลที่เป็นไบนารี่ เราจะเลือกใช้เครื่องมือที่เหมาะสมสำหรับข้อมูลแบบนี้ ซึ่งคือ การวิเคราะห์โลจิสติคแบบทวิ (binary logistic regression)

การวิเคราะห์การถดถอยแบบรูปแบบเต็ม

ในการวิเคราะห์การถดถอยเราจะเริ่มที่ตัวแบบที่มีรูปแบบเต็ม ซึ่งจะรวบรวมปัจจัยที่คาดว่าจะมีนัยสำคัญในข้อมูลไว้ทั้งหมด ซึ่งกรณีนี้เราจะเริ่มการวิเคราะห์ตัวแปรทุกตัวรวมไปถึง interaction ระหว่างตัวแปร ซึ่งรวมไปถึงชนิดของไวน์ด้วย

2 5

ในการวิเคราะห์ส่วน interaction ให้ทำการเลือก  Stat > Regression > Binary Logistic Regression > Fit Binary Logistic Model > Model > Add interactions

3 5

เมื่อทำการเลือกให้มีการวิเคราะห์ interaction ควรที่จะทำการปรับตัวแปรทำนายที่เป็นข้อมูลแบบต่อเนื่องเพื่อหลีกเลี่ยงผลของสเกลของตัวเลขด้วยการเลือก  Stat > Regression > Regression > Fit Regression Model > Coding

4 3

เราเริ่มจากวิธี stepwise เพื่อทำการสร้างตัวแบบ จะทำการสร้างตัวแบบเป็นขั้นบันไดและกำหนดเซตย่อยจากกลุ่มขนาดใหญ่ๆ ด้วยการใช้คำสั่ง Stat > Regression > Binary Logistic Regression > Fit Binary Logistic Model > Stepwise

เกณฑ์ในที่นำมาใช้กำหนดตัวแปรในขั้นตอนการทำ Stepwise จะใช้วิธีพิจารณาของ  Akaike Information Criteria (AIC) วิธีของ AIC จะทำการประมาณค่าจำนวนข้อมูลที่หายไปจากตัวแบบที่กำหนด ซึ่งเป็นค่าสถิติที่ใช้ในการเปรียบเทียบตัวแบบ ตัวแบบที่มีค่า AIC ยิ่งน้อยหมายความว่าตัวแบบนั้นมีความเหมาะสมกับข้อมูล ค่า AIC จะรวมค่าด้านลบที่เพิ่มขึ้นเมื่อจำนวนค่าประมาณของพารามิเตอร์ที่ไม่เกี่ยวข้องกับตัวแบบนำมารวมในตัวแบบ วัตถุประสงค์ของ AIC คือ เพื่อไม่ให้ได้ตัวแบบมีตัวแปรอิสระที่มากเกินไปหรือน้อยเกินไป

6 1

เมื่อทำเสร็จทุกขั้นตอนเราจะได้ตัวแบบตามที่อธิบายด้านล่างนี้

ปัจจัยที่ทำให้ไวน์มีรสชาติดี

มีทั้งหมด 12 ปัจจัย ซึ่งตัว  แบบนี้จะเห็นว่ามีความยากที่จะทำความเข้าใจ แต่ก็แสดงให้เห็นบางอย่างที่จะทำให้เราค้นหาต่อไปได้ว่าปัจจัยตัวไหนที่เกี่ยวข้องหรือทำให้รสชาติของไวน์ได้ดีขึ้น

7

ค่าสัมประสิทธิ์แบบ coded  ซึ่งทำให้เข้าใจตัวแปรง่ายขึ้นว่าตัวแปรใดมีความสำคัญที่สุด

Density เป็นตัวแปรที่มีผลมากที่สุด (ค่าสัมประสิทธิ์เท่ากับ -3.504) ต่อมาคือ Residual Sugar * Types of Wines (มีค่า 2.75 ซึ่งเป็น interaction) และที่มีผลรอง ๆ ลงไปตามลำดับ คือ Fixed acidity (1.33) และ Fixed acidity * Density interaction (1.213)

8

จากแผนภาพที่แสดง interaction ทำให้เห็นว่า Residual Sugar มีผลต่อคุณภาพของไวน์ โดยเฉพาะกับไวน์ขาว แต่ไม่มีผลกับไวน์แดง

9

ตอนนี้เรามีตัวแบบที่สามารถระบุปัจจัยที่เกี่ยวข้องกับคุณภาพไวน์ ซึ่งทำให้เราเห็นได้ว่าคุณสมบัติใดบ้างที่มีผลต่อคุณภาพ เช่น จากแผนภาพ main effect ซึ่งเป็นกราฟที่แสดงความสัมพันธ์ระหว่าง fixed acidity  กับ ความน่าจะเป็นที่ผลิตไวน์ดี และ density กับ ความน่าจะเป็นที่ผลิตไวน์ดี โดยในแผนภาพสามารถตีความได้ว่า ค่า fixed acidity  สูง และ density ต่ำ จะทำให้คุณภาพของไวน์ดีขึ้น

บทสรุป

เมื่อไหร่ก็ตามที่คุณต้องทำความเข้าใจกับสถานการณ์ต่างๆ เช่น การวิเคราะห์ข้อมูล หรือ เมื่อจำนวนตัวแปรอิสระมีจำนวนมากมาย ให้นึกถึง binary logistic regression เพื่อเป็นตัวช่วยในการวิเคราะห์เชิงลึกมากขึ้น

คุณสามารถใช้การวิเคราะห์ตามแบบที่เรายกตัวอย่างมานี้ที่เหมือนกับการทดสอบไวน์ แล้วนำมาวิเคราะห์เพื่อดูยอดขายหรือเรื่องการตลาด เพื่อทำให้ความเข้าใจเรื่องความต้องการของลูกค้าและทำให้เห็นปัจจัยที่มีความสำคัญคืออะไร และมันสามารถทำได้จริง เช่นตัวอย่างเรื่องการหาปัจจัยที่มีผลต่อรสชาติไวน์ ซึ่งถือเป็นค่าที่วัดได้ยากตามที่กล่าวมา

คำสั่งที่เพิ่มมาใน MINITAB 19 ที่เราใช้ในการวิเคราะห์ตามบทความนี้คือ การวิเคราะห์ตัวแบบด้วยวิธี stepwise ตามวิธีการแบบ Akaike Information Criteria (AIC)


ต่อไป: ดูสัมมนาออนไลน์ของเราเพื่อเรียนรู้ “WHAT’S NEW IN MINITAB 19”

ค้นพบพลังของเครื่องมือใหม่ๆของ Minitab ที่ทำให้คุณตัดสินใจได้ดีกว่า รวดเร็วและง่ายในการใช้งาน คลิ้กปุ่มข้างใต้เพื่อดู สัมมนาออนไลน์ย้อนหลัง

screenshot 1

บทความต้นฉบับ : What Makes A Good Wine? Using Statistical Regression to Model The Taste of Wine

ต้นฉบับนำมาจาก Minitab blog, แปลและเรียบเรียงโดยสุวดี นำพาเจริญ,

บริหารจัดการ SCM Blog โดยชลทิชา จำรัสพร บริษัท โซลูชั่น เซ็นเตอร์ จํากัด ตัวแทน Minitab ในประเทศไทย

Minitabbloglogo

เพิ่มเติมเกี่ยวกับบริษัท Minitab

Minitab ช่วยให้บริษัทและองค์กรต่างๆ สามารถมองเห็นแนวโน้มของข้อมูล, แก้ปัญหาและค้นพบประเด็นสำคัญจากข้อมูลเชิงลึก โดยนำเสนอชุดโซลูชั่นที่ครอบคลุมทุกด้านและดีที่สุดสำหรับซอฟต์แวร์ในระดับเดียวกัน ที่ใช้สำหรับการวิเคราะห์ข้อมูลและการปรับปรุงกระบวนการ 
ด้วยวิธีการที่เป็นเอกลักษณ์ และการนำเสนอซอฟต์แวร์และบริการแบบองค์รวม Minitab ช่วยให้องค์กรเข้าถึงกระบวนการตัดสินใจในส่วนที่ช่วยผลักดันให้เกิดความเป็นเลิศทางธุรกิจได้ดีขึ้น ความง่ายในการใช้งานที่โดดเด่นกว่าใครมีส่วนช่วยให้ Minitab สามารถทำให้การเข้าถึงข้อมูลเชิงลึกเป็นเรื่องที่ง่าย ทีมงานของ Minitab ซึ่งประกอบด้วยผู้เชี่ยวชาญทางด้านการวิเคราะห์ข้อมูลที่ได้ผ่านการอบรมมาเป็นอย่างเข้มงวด จะช่วยให้ผู้ใช้งานมั่นใจว่าจะได้รับประโยชน์สูงสุดจากการใช้งานวิเคราะห์ข้อมูลและพร้อมที่จะให้คำปรึกษาตลอดเวลาที่ใช้งานเพื่อนำไปสู่การตัดสินใจที่ดีขึ้น รวดเร็ว และแม่นยำ 
เป็นเวลากว่า 50 ปีที่ Minitab ได้ช่วยองค์การต่าง ๆ เพิ่มรายได้ ควบคุมและลดต้นทุน เพิ่มคุณภาพ เสริมสร้างความพึงพอใจของลูกค้า และเพิ่มประสิทธิภาพ ธุรกิจและองค์นับหมื่นทั่วโลกใช้ Minitab Statistical Software®, Companion by Minitab®, Minitab Workspace®, Salford Predictive Modeler® and Quality Trainer® เป็นเครื่องมือช่วยในการค้นพบและปรับปรุงความบกพร่องในกระบวนการ