Algoritma Bayesian Classification
Bayesian Classification adalah pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Bayesian Classification didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi serupa decision tree dan neural network.Bayesian Classification terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar.
Rumus Teorema Bayes
Contoh Data training “All Electronics customer database”
Keterangan
Terdapat dua class dari klasifikasi yang dibentuk yaitu :
C1 => buys_computer = yes
C2 => buys_computer = no
Misal terdapat data X (belum diketahui class-nya).
X = (age=“<=30”, income=“Medium”, student=“Yes”, credit_rating=“Fair”)
Penyelesaian (1)
Dibutuhkan untuk memaksimalkan
P(X|Ci) P(Ci) untuk i=1, 2
P(Ci) merupakan prior probability untuk setiap class berdasar data contoh:
P(buys_computer=“yes”) = 9/14 = 0.643
P(buys_computer=“no”) = 5/14 = 0.357
Hitung P(X|Ci), untuk i=1, 2.
P(age=“<=30”|buys_computer=“yes”) = 2/9= 0.222
P(age=“<=30”|buys_computer=“no”) = 3/5 = 0.600
P(income=“medium”|buys_computer=“yes”)=4/9=0.444
P(income=“medium”|buys_computer=“no”)=2/5=0.400
Penyelesaian (2)
P(student=“yes”|buys_computer=“yes”) = 6/9= 0.667
P(student=“yes”|buys_computer=“no”) = 1/5= 0.200
P(credit_rating=“fair”|buys_computer=“yes”)=6/9= 0.667
P(credit_rating=“fair”|buys_computer=“no”)=2/5= 0.400
P(X|buys_computer=“yes”) = 0.222*0.444*0.677*0.677
= 0.044
P(X|buys_computer=“no”) = 0.600*0.400*0.200*0.400
= 0.019
P(X|buys_computer=“yes”) P(buys_computer=“yes”) = 0.044 * 0.643
= 0.028
P(X|buys_computer=“no”) P(buys_computer=“no”) = 0.019 * 0.357
= 0.007
Kesimpulan: buys_computer = “yes”
Nilai YES di dapatkan 0.028. Dengan demikian kesimpulan pembelian komputer berstatus YA/YES.
Untuk contoh perhitungan naive bayes lainnya anda bisa lihat pada contoh kasus Perhitungan Naive Bayes Classification Untuk Mendeteksi Kerusakan Laptop
Post a Comment
Post a Comment