ABSTRAK - Pada penelitian ini dikembangkan metode klasifikasi berdasarkan pengelompokan K-Means dan LVQ. Metodemetode klasifikasi yang telah ada jika ada data dengan frekuensi kecil cenderung tidak digunakan dalam pengujian kelas, padahal dimungkinkan data tersebut sangat bermanfaat. Langkah untuk melakukan pengelompokan adalah: melakukan pengelompokkan dengan K-Means. Pengelompokan terus dilakukan sampai mencapai threshold (batasan tertentu). Jika threshold sudah dicapai dan pada satu cluster masih terdapat kelas yang berbeda maka dilakukan pembelajaran dengan menggunakan LVQ. Akurasi gabungan K-Means dan LVQ lebih baik daripada dengan K-Means murni. Untuk akurasi rata-rata tertinggi K-Means dan LVQ didapatkan 92%, sedang untuk K-Means murni 82%.
Kata kunci: klasifikasi, pengelompokan, K-Means, LVQ
PENDAHULUAN - Klasifikasi merupakan bagian dari data mining. Terdapat beberapa metode klasifikasi antara lain : SLIQ, ID3,C4.5, KNN. Secara umum, metode klasifikasi yang melakukan pembentukan pohon (decision tree), sering menghilangkan informasi data yang frekuensinya kecil. Hal ini diterapkan agar memperoleh jumlah aturan yang tidak terlalu banyak. Pada kenyataannya, frekuensi data yang kecil belum tentu data tersebut tidak berguna, bisa jadi kecilnya data disebabkan kesulitan untuk mendapatkannya dibandingkan dengan data yang lain. Oleh karena itu pada penelitian ini akan dibangun sebuah model klasifikasi yang tetap memperhitungkan semua data, baik data yang frekuensinya kecil maupun data yang frekuensinya besar. Untuk bisa melakukan klasifikasi yang bisa mempertimbangkan kemunculan data dengan frekuensi kecil tersebut, pada penelitian ini akan digabungkan dua metode, yaitu K-Means dan LVQ ( Learning Vector Quantization). Penggabungan metode tersebut diharapkan akan dapat saling melengkapi
Post a Comment
Post a Comment