Algoritma Bayesian Classification
Bayesian Classification adalah pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Bayesian Classification didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi serupa decision tree dan neural network.Bayesian Classification terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar.
Rumus Teorema Bayes
Data training “All Electronics customer database”
Keterangan
Terdapat dua class dari klasifikasi yang dibentuk yaitu :
C1 => buys_computer = yes
C2 => buys_computer = no
Misal terdapat data X (belum diketahui class-nya).
X = (age=“<=30”, income=“Medium”,
student=“Yes”, credit_rating=“Fair”)
Penyelesaian (1)
Dibutuhkan untuk memaksimalkan
P(X|Ci) P(Ci) untuk i=1, 2.
P(Ci) merupakan prior probability untuk setiap class berdasar data contoh:
P(buys_computer=“yes”) = 9/14 = 0.643
P(buys_computer=“no”) = 5/14 = 0.357
Hitung P(X|Ci), untuk i=1, 2.
P(age=“<=30”|buys_computer=“yes”) = 2/9= 0.222
P(age=“<=30”|buys_computer=“no”) = 3/5 = 0.600
P(income=“medium”|buys_computer=“yes”)=4/9=0.444
P(income=“medium”|buys_computer=“no”)=2/5=0.400
Penyelesaian (2)
P(student=“yes”|buys_computer=“yes”) = 6/9= 0.667
P(student=“yes”|buys_computer=“no”) = 1/5= 0.200
P(credit_rating=“fair”|buys_computer=“yes”)=6/9= 0.667
P(credit_rating=“fair”|buys_computer=“no”)=2/5= 0.400
P(X|buys_computer=“yes”) = 0.222*0.444*0.677*0.677
= 0.044
P(X|buys_computer=“no”) = 0.600*0.400*0.200*0.400
= 0.019
P(X|buys_computer=“yes”) P(buys_computer=“yes”) = 0.044 * 0.643
= 0.028
P(X|buys_computer=“no”) P(buys_computer=“no”) = 0.019 * 0.357
= 0.007
Kesimpulan: buys_computer = “yes”
0 komentar:
Post a Comment