PEMBELAJARAN MESIN MyEdu-X

Teknik pembelajaran mesin (machine learning) telah diterapkan dalam projek MyEdu-X. Teknik ini membolehkan ramalan prestasi universiti dan kadar pengangguran dalam kalangan graduan dilakukan melalui proses komputer belajar daripada data. Data yang dimaksudkan adalah:

Semua data ini telah digunakan sebagai fitur (feature) untuk mengeluarkan ramalan yang telah dinyatakan. Pemilihan fitur-fitur ini telah dilakukan berdasarkan pemerhatian dan analisa kebergantungan antara fitur dengan prestasi universiti serta kadar pengangguran graduan. Kemungkinan untuk pemilihan fitur-fitur yang lebih baik tidak dinafikan namun dengan mengambil kira kekangan masa (48 jam tempoh pertandingan), fitur-fitur yang telah di pilih menghasilkan prestasi ramalan yang baik.

Algoritma pembelajaran mesin yang telah diguna pakai adalah Gradient Boosted Trees (GBT). Algoritma ini tergolong dalam keluarga Pokok (Tree models). Hal ini disebabkan kaedah pembelajaran yang bercabang seperti pokok. Algoritma ini di pilih setelah mengambil kira kesesuaiannya dengan jumlah data yang sangat terhad. GBT berfungsi dengan menggabungkan pepohon keputusan yang lemah (weak decision trees) untuk membentuk satu model baru yang lebih baik. Berbeza dengan algoritma random forest yang juga menggabungkan pepohon keputusan, pepohon keputusan GBT saling bergantung antara satu sama lain dalam usaha mendapatkan model akhir yang terbaik.

MyEdu-X menggunakan implementasi GBT daripada Turi Machine Learning Platform. Kaedah implementasi yang mudah dan cepat merupakan antara sebab Turi menjadi pilihan dalam projek ini. Selain itu, implementasi GBT ini juga telah menghasilkan satu model yang berprestasi tinggi. Sebagai contoh, skor Root Mean Square Error (RMSE) bagi ramalan Universiti Malaya dicatatkan pada tahap 4.11 bagi set data percubaan (testing set) manakala set data latihan (training set) mencatatkan 3.10. Ini menunjukkan model MyEdu-X telah berjaya mengurangkan masalah overfitting walaupun berdepan dengan kekangan jumlah data yang sangat terhad.

Carta aliran kerja MyEdu-X disertakan di bawah untuk memberi gambaran yang lebih jelas mengenai proses pembelajaran mesin yang berlaku dalam MyEdu-X.