Abstrak
Penentuan gender secara otomatis dapat bermanfaat untuk kepentingan forensik dan komersial. Penelitian ini membahas penentuan gender pengguna secara otomatis berdasarkan isi microblog (Twitter) yang ditulis dalam Bahasa Indonesia dengan memanfaatkan fitur sosiolinguistik. Dilakukan pengukuran akurasi model klasifikasi untuk tiga jenis fitur: leksikal, sosiolinguistik dan kombinasi keduanya. Fitur leksikal menghasilkan akurasi 84.94%, dan sosiolinguistik 83.01%. Hasil terbaik dengan akurasi 86.22% didapat dengan kombinasi kedua fitur tersebut. Ditemukan beberapa perbedaan aspek sosiolinguistik antara Bahasa Indonesia dengan Bahasa Inggris.
Kata Kunci Microblog, Twitter, Gender, Sosiolinguistik, Klasifikasi Teks
Pendahuluan
Penentuan gender seseorang secara otomatis berdasarkan isi tulisannya dapat digunakan untuk berbagai kepentingan. Pihak berwajib dapat menggunakannya untuk membuat profil tersangka. Sedangkan perusahaan dapat memanfaatkan prediksi gender ini untuk mengetahui jenis pelanggan yang menggunakan atau mengomentari produknya.
Peneliti: Yudi Wibisono
Untuk lebih lengkapnya silahkan download di link berikut:
Post a Comment
Post a Comment