Definisi Data Mining
Pengertian Data Mining Data
mining adalah melakukan data mining konten, memilih algoritma yang sesuai untuk
penelitian data sesuai topik, dan melakukan data mining. Data mining adalah
istilah yang dapat digunakan untuk menggambarkan pencarian pengetahuan dalam
database. Data mining adalah proses menggunakan statistik, matematika,
kecerdasan buatan dan teknik pembelajaran mesin untuk mengekstrak dan
mengidentifikasi informasi yang berguna dan pengetahuan yang relevan dari
daftar besar.
Knowledge Discovery Process and Data
Mining Knowledge
Discovery in Databases (KDD) adalah ekstraksi non sepele dari pengetahuan
implisit, yang sebelumnya tidak diketahui dan berpotensi berguna dari data.
Penambangan data adalah eksplorasi dan analisis data dalam jumlah besar secara
berurutan untuk menemukan valid, baru, berpotensi berguna, dan pada akhirnya
dapat dimengertipola dalam data. Proses semi-otomatis menganalisis database
besar untuk temukan pola yang: 1.
Valid: Pola-pola yang berlaku secara umum. 2.
Novel: Kami tidak tahu polanya sebelumnya. 3.
Berguna: Kita dapat merancang tindakan dari
pola. 4.
Dapat dimengerti: Kita dapat menafsirkan dan
memahami pola-polanya.
Dataset Data
mining tidak pernah dihilangkan dari istilah data, dengan alasan bahwa dalam
pengolahan data mining diperlukan kumpulan data untuk memperoleh pengetahuan. Dalam
terminologi aritmatika , dataset adalah kumpulan objek yang berisi properti
tertentu atau variabel, di mana untuk objek adalah data individu yang memiliki
atribut atau variabel tersebut.
Jenis - Jenis Dataset jenis
dataset terbagi atas tiga jenis , yaitu sebagai berikut : 1.
Record Data merupakan data yang terdiri dari
sekumpulan record, yang masing - masing record terditri dari satu set atribut
tetap. 2.
Data Graph adalah data yang mempunyai bentuk
grafik yang terdiri dari sejumlah node dan edge. 3.
Ordered Data Merupakan data - data yang
memperhatikan urutan nilai - nilainya. Yang termaksud dalam data urut merupakan
genomic sequence data atau spatio-temporal data.
Jenis - Jenis Atribut 1.
Atribut Nominal 2.
Atribut Ordinal 3.
Atribut Interval atau jarak 4.
Atribut Rasio (Mutlak)
Proses Data Mining Memilih
algoritme yang tepat dan yang tepat akan bergantung pada proses penemuan
pengetahuan dalam kumpulan data secara keseluruhan.
Himpunan Data (Pemahaman dan Pengolahan
Data) 1.
Data Cleaning Pembersihan
data adalah pemrosesan data untuk menangani data yang memiliki nilai yang
hilang dalam catatan dan menghilangkan kebisingan. 2.
Data Integration Integrasi
data adalah penggabungan data basis data ke dalam basis data baru. Integrasi
yang baik data akan menghasilkan data gabungan dengan sedikit redundansi/atau
inkonsistensi, sehingga meningkatkan akurasi dan kecepatan proses data mining. 3.
Data Transformation Misalnya,
beberapa metode standar seperti hanya analisis asosiasi pengelompokan hanya
dapat menerima input kategorikal. Analisis
klasifikasi dan asosiasi tidak dapat menerima numerik kontinu, sehingga harus
dipecah menjadi beberapaProses ini sering disebut transformasi data. Dalam
kasus yang diterapkan ke kumpulan data penyakit ginjal kronis, langkah
transformasi data memerlukan kumpulan data untuk didiskritisasi menggunakan .
Teknik Data Mining 1.
Klasifikasi 4.
2.Klasterisasi 2.
Association Rule 3.
Regression
Pengetahuan Pengetahuan
dari data mining adalah mengetahui bagaimana mengelola pengambilan keputusan
tertentu atau tindakan selanjutnya yang akan dilakukan sesuai dengan hasil
analisis yang diperoleh. Proses
pemberian informasi dari pengolahan data mining terkadang diperlukan untuk
orang yang tidak mengerti data mining.
Evaluasi Evaluasi
model adalah proses untuk mengidentifikasi model untuk dimasukkan ke dalam
basis pengetahuan yang ditemukan.
Evaluasi
adalah proses mengevaluasi model yang menarik atau model prediksi, apakah
mereka memenuhi hipotesis awal atau tidak. |