Jumat, 12 Februari 2010

Light-Weight Frequent Item Mining

RESOURCE AWARE ON-LINE DATA STREAM FREQUENT ITEM MINING


MINING DATA BERFREKUENSI TERBANYAK PADA ALIRAN DATA ON-LINE MENGGUNAKAN FRAMEWORK RESOUREC-AWARE

 

Nama Mahasiswa      : Jumadi M. Parenreng

NRP                                 : 5108.201.032

Pembimbing                : Prof. Dr. Ir. Supeno Djanali, M.Sc, Ph.D

                                             Ary Mazharuddin Shiddiqi, S.Kom, M.Comp.Sc

 

 

ABSTRAK

 

Online Data Stream saat ini menjadi trend komunikasi data, ini tidak terlepas dari kemampuan transfer data dari perangkat jaringan yang semakin cepat sehingga sangat memungkinkan untuk transfer live data stream. Pemanfaatan teknologi ini salah satunya dimanfaatkan oleh perangkat Wireless Sensor Network (WSN). Hanya saja kendalanya adalah sumber daya (Resource) yang dimiliki oleh setiap perangkat wireless berupa Bateri, Memori dan CPU sangat terbatas. Karena demikian terbatasnya sumber daya yang dimiliki oleh setiap perangkat wireless sehingga muncul ide jika data yang didapatkan oleh perangkat wireless tidak seharusnya dikirimkan seluruhnya ke server pengelohan data karena akan menghabiskan sumber daya, tetapi data yang dikirim adalah data yang telah mengalami proses mining sehingga data yang didapat adalah data yang benar-benar dibutuhkan saja. Pengolahan data model ini diperkenalkan oleh Gaber et al [13] dengan nama Algorithm Granularity (AG) yang memanfaatkan Resource-Aware (RA) ketersediaan berupa  Memory, CPU dan Bateri.

Algoritma Granularitas oleh Gaber et al menuliskan bahwa ada tiga Algoritma Granularitas yang didasarkan pada teknik mining yakni : Light Weight Clustering (LWC), Light Weight Classification (LWClass) dan Light Weight Frequent Item (LWF). Dua algoritma sebelumnya, LWC dan LWClass telah dilakukan pembuktian oleh peneliti-peneliti lain, adapun penelitian tesis ini dikhususkan pada pembahasan tentang Algoritma LWF yang bekerja dengan memanfaatkan ketersediaan sumber daya (Resource-Aware) yang dimiliki, banyaknya Frequent Item dan banyaknya counter yang terus berubah sesuai dengan ketersediaan memori dan waktu. Item yang memiliki jumlah frekuensi data terendah akan dilepaskan dari memori secara periodik sehingga hanya mengijinkan jenis data dengan frekuensi terbanyak untuk menempati memori. Yang ingin dicapai dari penelitian tesis ini adalah pembuktian algoritma LWF sekaligus sebagai pembanding dengan dua algoritma granularitas lainnya. Percobaan dari algoritma ini menggunakan data yang telah digunakan oleh peneliti sebelumnya dan dilakukan dengan simulasi pada program Java.

 

Kata Kunci : Data Stream, Algoritma Granularity, Resource-Aware, Frequent Item, Wireless Sensor