Predictive Analytics Module
Machine learning และ Predictive Analytics เป็นคำศัพท์ที่เราได้ยิน แต่มันหมายถึงอะไรและเกี่ยวข้องกันอย่างไร?
ทั้ง Machine Learning และ Predictive Analytics ใช้ประโยชน์จากข้อมูลเพื่อคาดการณ์อนาคต แต่ในแนวทางที่ต่างกัน:
Machine learning คืออะไร?
เป็นวิธีการที่อัลกอริทึมทำงานเฉพาะโดยไม่มีคำสั่งที่ชัดเจนหรือกฎที่กำหนดไว้ล่วงหน้า โดยอาศัยรูปแบบและการอนุมานแทนการทำนายและปรับเทียบใหม่ตามความจำเป็น
Machine Learning ถูกแบ่งออกเป็นการเรียนรู้แบบ Supervised และ Unsupervised กระบวนการสร้างโมเดลจะถูกชี้นำโดยตัวแปรตอบสนองที่ระบุ ในทางตรงกันข้าม การเรียนรู้แบบ Unsupervised จะใช้ตัวแปรทั้งหมดเท่าๆ กัน เนื่องจากไม่มีเป้าหมายเฉพาะ
Predictive analytics คืออะไร?
เป็นกลุ่มของการวิเคราะห์ข้อมูลที่มุ่งคาดการณ์เกี่ยวกับผลลัพธ์ในอนาคตโดยอิงจากข้อมูลในอดีตและเทคนิคการวิเคราะห์
Minitab's Tree-Based Predictive Models
Tree-based Machine Learning อัลกอริธึมนี้เป็นอัลกอริธึมที่ดีที่สุดและเป็นกรรมสิทธิ์ของเรา ไม่เพียงแต่มีพลังในการให้ข้อมูลเชิงลึกที่ลึกซึ้งยิ่งขึ้นและแสดงให้เห็นภาพความซับซ้อนของอิทธิพลร่วมด้วยแผนผังการตัดสินใจ แต่ยังพร้อมที่จะจัดการชุดข้อมูลปริมาณมากที่มีตัวแปรมากขึ้น ข้อมูลที่ยุ่งเหยิง ค่าที่หายไป ค่าผิดปกติและความสัมพันธ์แบบไม่เชิงเส้น
CART® (Classification & Regression Trees)
หนึ่งในเครื่องมือที่สำคัญและเป็นที่นิยมที่สุดในการขุดเหมืองข้อมูลสมัยใหม่, CART คืออัลกอริธึมแบบต้นไม้ที่ค้นพบวิธีแบ่งข้อมูลออกเป็นส่วนย่อยๆ แล้วเลือกการแยกที่มีประสิทธิภาพดีที่สุดซ้ำๆ กันจนกว่าจะพบกลุ่มที่เหมาะสมที่สุด
Random Forests®
จากการรวมกลุ่มต้นไม้ที่ได้จาก CART, Random Forests ใช้ประโยชน์จากการทำซ้ำ การสุ่มตัวอย่าง การเลือกตัวอย่าง และการเรียนรู้ทั้งหมดในที่เดียวที่เหมาะสม ที่นำเอาต้นไม้แต่ละต้นที่อิสระต่อกันและหาการคาดการณ์โดยรวมของต้นไม้ทั้งป่า
TreeNet® (Gradient Boosting)
เครื่องมือการเรียนรู้ที่ยืดหยุ่น ชนะรางวัล และทรงพลังที่สุดของเรา TreeNet Gradient Boosting ขึ้นชื่อในด้านความแม่นยำในการทำนายที่ยอดเยี่ยมและสม่ำเสมอ เนื่องจากมีโครงสร้างแบบวนซ้ำซึ่งแก้ไขข้อผิดพลาดรวมในขณะที่สร้างการเรียนรู้