หน้าแรกของ RapidMiner Studio 7
- เมื่อเริ่มต้นใช้งาน RapidMiner Studio 7 จะแสดงหน้าต่างเริ่มต้นซึ่งประกอบดวย 4 เมนูหนักดังนี้
- GET STARTED แสดงวิธีเริ่มต้นการใช้งานในรูปแบบวีดีโอ คือ
- การนำข้อมูลเข้า (Import Data)
- การสร้างโปรเซส (Build Process)
- การประมวลผล (Run Process)
- ตรวจสอบและวิธีการดูผลการประมวลผลของโปรเซส (Inspect Result)
- การปรับตั้งค่าในโปรเซส (Improve Process)
- LEAR์N เป็นหน้าที่รวบรวมและแสดงวิธีการใช้งานของ RapidMiner Studio 7 ซึ่งทำ Link ไปยังหน้าเวปที่ แสดงการใช้งานในรูปแบบ document,VDO และมีบทเรียนฝึกหัดให้ทำตาม 3 บทคือ
- Basic สอนพื้นฐานการใช้งาน
- Data Handling สอนการจัดการข้อมูล
- Modeling, Scoring and Validation โดยสอนเกี่ยวกับการสร้างโมเดลเพื่อทำ Prediction, การวิเคราะห์ผลและนำผลลัพธ์ข้อมูลเชิงลึกที่คาดการณ์ได้มาใช้จริง และสอนกระบวนการยืนยันความถูกต้องของโมเดล
- NEW PROCESS สร้างโปรเซสใหม่เพื่อเริ่มการใช้งาน RapidMiner ซึ่งทุกครั้งที่ต้องสร้างานใหม่ที่แตกต่างจะต้องสร้าง โปรเซสใหม่
- OPEN PROCESS เปิดโปรเซสเก่าที่เคยสร้างไว้เพื่อดูหรือแก้ไข โดย โปรเซสที่สร้างไว้แล้วสามารถ Reuse ได้ หรือ ส่งให้คนอื่นได้
- GET STARTED แสดงวิธีเริ่มต้นการใช้งานในรูปแบบวีดีโอ คือ
องค์ประกอบของหน้าต่าง Design ใน RapidMiner Studio 7
หน้า Design RapidMiner Studio 7 ประกอบด้วย 5 ส่วนหลักๆ คือ
- Operators เป็นส่วนที่ใช้เก็บ ตัวโอเปอร์เรเตอร์ ที่ใช้ในการทำงานทั้งหมด ซึ่งจัดเป็นกลุ่มๆ โดยกลุ่มที่ใช้งานคล้ายคลึงกันจะจะอยู่ในกลุ่มเดียวกัน มี 8 กลุ่ม โอเปอร์เรเตอร์คือ
- Data Access
- Blending
- Cleansing
- Modeling
- Scoring
- Validation
- Utility
- Extentions
2. Repository ส่วนนี้เป็นส่วนจัดการไฟล์ RapidMiner Studio 7 จะจัดการข้อมูลจาก 3 แหล่งคือ DB(ดาต้าเบส), Local (ในเครื่องคอมพิวเตอร์ที่ใช้อยู่) และ Cloud Repository (ในคลาวด์) โดยเก็บไฟล์ Data Set และ Process ต่างๆ แยกเก็บคนละโฟลเดอร์กัน
3. Process เป็นหน้าหลักในการทำงานในการสร้างโปรเซสสำหรับทำ Machine Learning ของซอฟต์แวร์นี้ โดยจะนำโอเปรอเรเตอร์มาประกอบเพื่อสร้างโปรเซสขึ้นมาตามวัตถุประสงค์ของโจทย์ที่ตั้งไว้
4. Parameters เป็นส่วนที่กำหนดพารามิเตอร์ที่เป็นรายละเอียดของ โอเปอร์เรเตอร์ ที่เลือกใช้งาน เช่น โอเปอเรเตอร์ Set Role เป็น Operator ที่มีพารามิเตอร์ที่เกี่ยวข้องสองพารามิเตอร์คือ แอทติบิวเนม ซึ่งเป็นพารามิเตอร์ที่ใช้กำหนดเอาท์พุทของโปรเซสว่าจะเลือกใหน ซึ่งจากตัวอย่าง เลือก time_btw_stop เป็นเอาท์พุทของโปรเซส และ พารามิเตอร์ target role เพื่อระบุว่าพารามิเตอร์เอาท์พุทเป็น label เท่านั้น
5. Help เป็นส่วนช่วยเหลือซึ่งจะแสดงรายละเอียดของตัวโอเปอเรเตอร์ที่เลือกใช้งานอยู่ ส่วนช่วยเหลือของ RapidMiner Studio 7 จะบอกเพียงหน้าที่และรายละเอียดคร่าวๆของโอเปอเรเตอร์หากต้องการดูรายละเอียดมากกว่านี้ต้องไปที่ Jum to Tutorai Process ซึ่งจะ Link ไปยังเวปไซต์ที่มีรายละเอียดของเกี่ยวกับ Operator ที่ใช้อยู่ เช่น โอเปอเรเตอร์ชื่อ Linear Regression ใน หน้า Help ก็จะบอกว่าเป็น โอเปอเรเตอร์ ที่ใช้คำนวณข้อมูลจากจาก data set โดยใช้วิธี Linear Regression