Pengertian Algoritma Apriori
- A priori
- Generalized Rule Induction
- Algoritma Hash Based
Association rule mining merupakan teknik data mining untuk menemukan aturan asosiatif antara suatu kombinasi item.contohnya Analisis pembelian di suatu pasar swalayan, dapat diketahui brp besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu.
Dengan kondisi tersebut pemilik swalayan dpt mengatur penempatan barangnya, atau merancang promosi pemasaran dengan memakai kupon diskon utk kombinasi barang tertentu.
Baca juga Jasa Bimbingan Skripsi Teknik Informatika
Association Rule menjadi terkenal karena aplikasinya utk menganalisis isi keranjang belanja pelanggan di pasar swalayan, Makanya itu sering disebut Market Basket Analysis.
Association Rule juga dikenal salah satu teknik DM yang menjadi dasar dari berbagai teknik DM lainnya
Salah satu tahap analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah analisis pola frekuensi tinggi (frequent pattern mining). Penting tidaknya suatu aturan asosiatif dapat diketahui dgn dua parameter :
- Support (nilai penunjang) = Persentase kombinasi item tsb dlm database.
- Confidence (nilai kepastian) = Kuatnya hubungan antar item dalam aturan asosiasi
- 50% dari transaksi database yang memuat item roti dan mentega juga membeli susu. 40% dari seluruh transaksi yang ada daii database memuat ketiga item tersebut.
- “Seorang pelanggan yg membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan tersebut cukup signifikan karena mewakili 40% dari catatan transaksi selama ini”
Metodologi Dasar Analisis Asosiasi
1. Analisis Pola Frekuensi Tinggi
- Nilai support dari 2 item diperoleh dari rumus 2 berikut:
- D adalah himpunan transaksi yg dipresentasikan dlm tabel “Transaksi” diatas
- Dimana setiap transaksi T dalam D mempresentasikan himpunan item yg berada dalam I
- I adalah himpunan item yg dijual {teh, gula, kopi, susu, roti}
- Jika kita memiliki himpunan item A (misal Susu dan Gula) dan himpunan lain B (Misal Kopi)
- Dimana antecedent A dan consequent B merupakan subset dari I, dan A dan B merupakan mutually exclusive di mana aturan:
- Definisi diatas tidak berlaku untuk aturan trivial seperti: Jika Beans dan Squash, maka Beans
- Seorang analis mungkin saja hanya akan mengambil aturan yang memiliki support dan/atau confidence yang tinggi.
- Aturan yang kuat adalah aturan-aturan yang melebihi kriteria support dan/atau confidence minimum.
- Misalnya, seorang analis menginginkan aturan yang memiliki support lebih dari 20% dan confidence lebih dari 35%.
- Sebuah itemset adalah himpunan item-item yabg ada dalam I
- k-itemset adalah itemset yang berisi k item, misalnya:
- Frequent Itemset menunjukkan itemset yang memiliki frekuensi kemunculan l
- Lebih dari nilai minimum yang telah ditentukan (Φ), misalkan:
2. Pembentukkan Aturan Asosiasi
- Setelah semua pola frekuensi tinggi ditemukan, kemudian dicari aturan asosiasi yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif A → B
- Nilai confidence dari aturan A → B diperoleh dari rumus berikut:
- Dari F3 yang telah ditemukan, dapat dilihat besarnya nilai support dan confidence dari calon aturan asosiasi.
- Misalnya, ditetapkan nilai confidence minimal 60%, maka aturan yang bisa terbentuk adalah dengan 2 antecedent berikut:
Calon Aturan asosiasi dari F2
Contoh Lain:
Misalnya: Φ = 4, Support = 30 %, Confidence = 70 %
Misalnya: Φ = 4, Support = 30 %, Confidence = 70 %
Hasilnya :
Φ = 4, Min. Support = 30 %, Min. Confidence = 70 %
Post a Comment
Post a Comment