การวิเคราะห์การทำนายเพื่อแปลงข้อมูลไปเป็นข้อมูลเชิงลึกเพื่อใช้ตัดสินใจและในการดำเนินการในงานต่างๆ (Predictive analytics transform insight into action)

RapidMiner Studio 7  เป็นเครื่องมือที่ใช้ในการทำวิเคราะห์ข้อมูล(Data analytics),สร้างโมเดลคณิตศาสตร์ทั้งในงานเชิงวิศวะกรรมและงานด้านธุรกิจ และเนื่องจากโลกในยุคปัจจุบันได้ก้าวเข้าไปสู่ยุคเทคโนโลยี  “Big Data” หรือ อภิมหาข้อมูล แน่นอนเราจำเป็นต้องนำข้อมูลอภิมหาศาลเหล่านี้มาทำการวิเคราะห์ (analyze) ข่าวดีก็คือ RapidMiner Studio 7  สามารถใช้ในการการวิเคราะห์ Big Data โดยสามารถต่อกับฐานข้อมูลบน Server หรือ Cloud เพื่อดึง data มา process ได้

เพื่อให้เห็นภาพรวมการใช้งาน RapidMiner  ในการทำ Data analytics โดยแบ่งออกเป็น 4 ขั้นตอนคือ   

  1. Descriptive เป็นลักษณะการดูข้อมูลย้อนหลังที่มีอยู่ในรูปของกราฟ เพื่อวัดผลและดูพฤติกรรมของข้อมูลว่าเกิดอะไรขึ้นบ้าง
  2. Diagnostic เป็นกระบวนการวิเคราะห์ข้อมูลดิบ เพื่อดูว่าทำไมข้อมูลแบบนี้ถึงเป็นเช่นนี้ เช่น ทำไมเวลาเข้าป้ายช้ากว่าปกติ มากใช้เวลาเป็น ชั่วโมง ทั้งๆที่ ระยะทางแค่ 500 เมตร  ซึ่งอาจจะมีสาเหตุมาจากรถติด หรือ อุบัติเหตุ หรือ รถเสีย
  3. Predictive คือการใช้ข้อมูลเยอะๆ เพื่อทำนายอนาคต เช่นทำนายว่าอีกกี่นาทีรถจะุเข้าป้าย
  4. Prescriptive เป็นหัวใจของการวิเคราะห์การทำงานด้านวิศวกรรมข้อมูลหรือธุรกิจ โดยใช้ข้อมูลและโมเดลมารวมกัน เพื่อนำมาแนะนำการตัดสินใจว่าจะดำเนินการอย่างไร ซึ่งก็ขึ้นอยู่กับ Project Objective หรือ Business Objective ด้วย

 

ในที่นี่จะยกตัวอย่างการสร้างโมเดลเพื่อทำนายเวลาเข้าป้ายรถเมล์(Arrival Time Predict)และการวิเคราะห์ข้อมูล

ขั้นตอนการทำ Arrival Time Prediction ด้วย RapidMiner Studio 7

cycle_machinlerning

 

  1. Import Data คือการนำข้อมูลเข้ามาและเตรียมข้อมูล
  2. Visualizing Data คือการทำภาพข้อมูลที่ข้อมูลมีลักษณะเชื่อมโยงกันและมีความหมาย
  3. Creating the Model คือกระบวนการสร้างแบบจำลองทางคณิตศาสตร์
  4. Applying the Model  คือการคำนวณเพื่อให้ได้แบบจำลองทางคณิตศาสตร์
  5. Validating the Model   การตรวจความถูกต้องของแบบจำลองทางคณิตศาสตร์
  6. การนำแบบจำลองไปใช้งาน หรือ การทำไป Implement ใช้งานจริง