Abstrak
Analisis sentimen dalam penelitian ini merupakan proses klasifikasi dokumen tekstual ke dalam dua kelas, yaitu kelas sentimen positif dan negatif. Data opini diperoleh dari jejaring sosial Twitter berdasarkan query dalam Bahasa Indonesia. Penelitian ini bertujuan untuk menentukan sentimen publik terhadap objek tertentu yang disampaikan di Twitter dalam bahasa Indonesia, sehingga membantu usaha untuk melakukan riset pasar atas opini publik.
Data yang sudah terkumpul dilakukan proses preprocessing dan POS tagger untuk menghasilkan model klasifikasi melalui proses pelatihan. Teknik pengumpulan kata yang memiliki sentimen dilakukan dengan pendekatan berdasarkan kamus, yang dihasilkan dalam penelitian ini berjumlah 18.069 kata. Algoritma Maximum Entropy digunakan untuk POS tagger dan algoritma yang digunakan untuk membangun model klasifikasi atas data pelatihan dalam penelitian ini adalah Support Vector Machine. Fitur yang digunakan adalah unigram dengan fitur pembobotan TFIDF. Implementasi klasifikasi diperoleh akurasi 86,81 % pada pengujian 7 fold cross validation untuk tipe kernel Sigmoid. Pelabelan kelas secara manual dengan POS tagger menghasilkan akurasi 81,67%.
Kata kunci—analisis sentimen, klasifikasi, maximum entropy POS tagger, support vector machine, twitter.
PENDAHULUAN
enurut data yang dirilis situs Semiocast Dot Com pada 1 juli 2012 jumlah tweeps di Indonesia sebanyak 29,5 juta orang [2]. Jumlah tersebut menempati posisi kelima dunia, sedangkan data yang dirilis situs A World of Tweets Dot Com menempatkan Indonesia sebagai negara ketiga terbanyak di dunia dalam menulis tweet (kicauan), yakni sebesar 11,39% diperoleh berdasarkan rekaman total jumlah tweet seluruh dunia sejak November 2010 dari 383 juta profil pengguna Twitter yang dibuat sebelum 1 Januari 2012 [4]. Jumlah pengguna Twitter di Indonesia merupakan pangsa pasar yang menjanjikan. Maka tidak heran berbagai produsen mulai kelas kecil hingga besar berlomba-lomba menggelola potensi ekonomi besar ini agar produk-produk mereka laku di pasaran sekurang-kurangnya menjadi referensi.
Post a Comment
Post a Comment