ระบบการจำแนกผู้ป่วยโควิด-19 ด้วยเทคนิคป่าสุ่ม
เป็นงานที่ผมทำไว้ช่วงเรียนระดับปริญญาโท แผน ก. ในด้านวิจัย Manchine Learning ประยุกต์กับการพัฒนาเว็ปแอปพลิเคชันในการทำนายข้อมูล
งานวิจัยนี้มีวัตถุประสงค์เพื่อสร้างแบบจำลองสำหรับพัฒนาระบบจำแนกผู้ป่วยโควิด-19 ในรูปแบบเว็บแอปพลิเคชันโดยใช้เทคนิคการเรียนรู้ของเครื่อง โดยจะทำการเปรียบเทียบประสิทธิภาพของอัลกอริทึมในการการจำแนกผู้ป่วยโควิด-19 และได้ทำการศึกษาข้อมูลผู้ป่วย จำนวน 1,608,923 ราย จากกรมควบคุมโรคโดยทำการรวบรวมข้อมูล 1 มกราคม 2563 ถึง วันที่ 1 ตุลาคม 2564 โดยใช้อัลกอริทึมการจำแนกข้อมูลทั้งหมด 3 แบบได้แก่ Random Forest, Neural network และ Naive Bayes ซึ่งทำการเปรียบเทียบประสิทธิภาพรูปแบบเทคนิคการทำนายระหว่างคุณลักษณะ การทดสอบประสิทธิภาพตัวแบบทำนายด้วยวิธีการ Split Test คือ การแบ่งข้อมูลด้วยการสุ่มออกเป็น 2 ส่วนคือ Training Data (ร้อยละ 80) และ Test Data (ร้อยละ 20) โดยใช้โปรแกรม Orange Data mining จากนั้นทำการทดลองเพื่อหาผลการทดสอบประสิทธิภาพที่มีค่าความถูกต้องที่สูงที่สุด ผลการวิจัยพบว่า Random Forest มีค่าความถูกต้องเท่ากับ 93.33% Neural network มีค่าความถูกต้องเท่ากับ 92.7% Naive Bayes มีค่าความถูกต้องเท่ากับ 92.1% จากผลการเปรียบเทียบในครั้งนี้จึงนำ Random Forest ที่มีค่าสูงสุดไปใช้ในการพัฒนาโปรแกรมระบบในการจำแนกผู้ป่วยโควิด-19ได้