Data Mining adalah kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola dan hubungan dalam set data berukuran besar. Kegunaan data mining adalah untuk menspesifikasikan pola yang harus ditemukan dalam tugas Data Mining. Kehadiran Data Mining dilatarbelakangi dengan problema data explosion yang dialami akhir-akhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data penjualan, data nasabah, data transaksi dsb.)
Pembahasan materi pada Training Data Mining ini fokus pada pemanfaatan data mining dalam dunia nyata. Pada training ini, anda akan mempelajari penerapan data mining menggunakan software Rapid Miner. Anda akan mendapatkan banyak studi kasus penerapan Data Mining. Diharapkan setelah mengikuti training ini, anda siap menghadapi tantangan kasus-kasus pada penerapan Data Mining pada kehidupan nyata.
TUJUAN
1. Memahami konsep dan peran utama dalam Data Mining
2. Memahami dan mampu melakukan tahapan-tahapan proses dalam Data Mining
3. Memahami dan mampu melakukan proses persiapan data
4. Memahami dan mampu menerapkan Algoritma Klasifikasi, Klastering, Asosiasi, Estimasi dan Forecasting
5. Memahami konsep Text Mining serta mampu melakukan operasi Text Clustering dan Text Classification
MATERI
1. Pengantar Data Mining
* Pengantar Data Mining
* Peran Utama dan Metode Data Mining
* Sejarah Data Mining
2. Proses Data Mining
* Proses Data Mining
* Tool Aplikasi Data Mining
* Penerapan Proses Data Mining (Dataset-Model)
* Evaluasi dan Validasi terhadap Model yang Terbentuk
* Proses Standard pada Data Mining (CRISP-DM)
3. Persiapan Data
* Data Pre Processing
* Data Cleaning
* Data Reduction
* Data Transformation and Data Discretization
* Data Integration
4. Algoritma Klasifikasi
* Decision Tree Induction
* Bayesian Classification
* Neural Network
* Model Evaluation and Selection
* Techniques to Improve Classification Accuracy : Ensemble Methods
5. Algoritma Klastering
* Cluster Analysis : Basic Concepts
* Partitioning Methods
* Hierarchical Methods
* Density-Based Methods
* Grid-Based Methods
* Evaluation of Clustering
6. Algoritma Asosiasi
* Basic Concepts
* Frequent Itemset Mining Methods
* Pattern Evaluation Methods
7. Algoritma Estimasi dan Forecasting
* Linear Regression
* Neural Network
* Support Vector Machine
* Time Series Forecasting
8. Text Mining
* Text Mining Concepts
* Text Clustering
* Text Classification
9. Data Mining Law
PESERTA
* Database Administrator
* Data Analyst
* Researcher
* Programmer
METHOD
Presentation
Discussion
Case Study
Evaluation