การวิเคราะห์การทำนายเพื่อแปลงข้อมูลไปเป็นข้อมูลเชิงลึกเพื่อใช้ตัดสินใจและในการดำเนินการในงานต่างๆ (Predictive analytics transform insight into action)
RapidMiner Studio 7 เป็นเครื่องมือที่ใช้ในการทำวิเคราะห์ข้อมูล(Data analytics),สร้างโมเดลคณิตศาสตร์ทั้งในงานเชิงวิศวะกรรมและงานด้านธุรกิจ และเนื่องจากโลกในยุคปัจจุบันได้ก้าวเข้าไปสู่ยุคเทคโนโลยี “Big Data” หรือ อภิมหาข้อมูล แน่นอนเราจำเป็นต้องนำข้อมูลอภิมหาศาลเหล่านี้มาทำการวิเคราะห์ (analyze) ข่าวดีก็คือ RapidMiner Studio 7 สามารถใช้ในการการวิเคราะห์ Big Data โดยสามารถต่อกับฐานข้อมูลบน Server หรือ Cloud เพื่อดึง data มา process ได้
เพื่อให้เห็นภาพรวมการใช้งาน RapidMiner ในการทำ Data analytics โดยแบ่งออกเป็น 4 ขั้นตอนคือ
- Descriptive เป็นลักษณะการดูข้อมูลย้อนหลังที่มีอยู่ในรูปของกราฟ เพื่อวัดผลและดูพฤติกรรมของข้อมูลว่าเกิดอะไรขึ้นบ้าง
- Diagnostic เป็นกระบวนการวิเคราะห์ข้อมูลดิบ เพื่อดูว่าทำไมข้อมูลแบบนี้ถึงเป็นเช่นนี้ เช่น ทำไมเวลาเข้าป้ายช้ากว่าปกติ มากใช้เวลาเป็น ชั่วโมง ทั้งๆที่ ระยะทางแค่ 500 เมตร ซึ่งอาจจะมีสาเหตุมาจากรถติด หรือ อุบัติเหตุ หรือ รถเสีย
- Predictive คือการใช้ข้อมูลเยอะๆ เพื่อทำนายอนาคต เช่นทำนายว่าอีกกี่นาทีรถจะุเข้าป้าย
- Prescriptive เป็นหัวใจของการวิเคราะห์การทำงานด้านวิศวกรรมข้อมูลหรือธุรกิจ โดยใช้ข้อมูลและโมเดลมารวมกัน เพื่อนำมาแนะนำการตัดสินใจว่าจะดำเนินการอย่างไร ซึ่งก็ขึ้นอยู่กับ Project Objective หรือ Business Objective ด้วย
ในที่นี่จะยกตัวอย่างการสร้างโมเดลเพื่อทำนายเวลาเข้าป้ายรถเมล์(Arrival Time Predict)และการวิเคราะห์ข้อมูล
ขั้นตอนการทำ Arrival Time Prediction ด้วย RapidMiner Studio 7
- Import Data คือการนำข้อมูลเข้ามาและเตรียมข้อมูล
- Visualizing Data คือการทำภาพข้อมูลที่ข้อมูลมีลักษณะเชื่อมโยงกันและมีความหมาย
- Creating the Model คือกระบวนการสร้างแบบจำลองทางคณิตศาสตร์
- Applying the Model คือการคำนวณเพื่อให้ได้แบบจำลองทางคณิตศาสตร์
- Validating the Model การตรวจความถูกต้องของแบบจำลองทางคณิตศาสตร์
- การนำแบบจำลองไปใช้งาน หรือ การทำไป Implement ใช้งานจริง