Definisi Data Mining

Definisi Data Mining

 

 

Pengertian Data Mining

Data mining adalah melakukan data mining konten, memilih algoritma yang sesuai untuk penelitian data sesuai topik, dan melakukan data mining. Data mining adalah istilah yang dapat digunakan untuk menggambarkan pencarian pengetahuan dalam database. Data mining adalah proses menggunakan statistik, matematika, kecerdasan buatan dan teknik pembelajaran mesin untuk mengekstrak dan mengidentifikasi informasi yang berguna dan pengetahuan yang relevan dari daftar besar. 

 

Knowledge Discovery Process and Data Mining

Knowledge Discovery in Databases (KDD) adalah ekstraksi non sepele dari pengetahuan implisit, yang sebelumnya tidak diketahui dan berpotensi berguna dari data. Penambangan data adalah eksplorasi dan analisis data dalam jumlah besar secara berurutan untuk menemukan valid, baru, berpotensi berguna, dan pada akhirnya dapat dimengertipola dalam data. Proses semi-otomatis menganalisis database besar untuk temukan pola yang:

1.    Valid: Pola-pola yang berlaku secara umum.

2.    Novel: Kami tidak tahu polanya sebelumnya.

3.    Berguna: Kita dapat merancang tindakan dari pola.

4.    Dapat dimengerti: Kita dapat menafsirkan dan memahami pola-polanya.

 

Dataset

Data mining tidak pernah dihilangkan dari istilah data, dengan alasan bahwa dalam pengolahan data mining diperlukan kumpulan data untuk memperoleh pengetahuan.

Dalam terminologi aritmatika , dataset adalah kumpulan objek yang berisi properti tertentu atau variabel, di mana untuk objek adalah data individu yang memiliki atribut atau variabel tersebut.

 

Jenis - Jenis Dataset

jenis dataset terbagi atas tiga jenis , yaitu sebagai berikut :

1.    Record Data merupakan data yang terdiri dari sekumpulan record, yang masing - masing record terditri dari satu set atribut tetap.

2.    Data Graph adalah data yang mempunyai bentuk grafik yang terdiri dari sejumlah node dan edge.

3.    Ordered Data Merupakan data - data yang memperhatikan urutan nilai - nilainya. Yang termaksud dalam data urut merupakan genomic sequence data atau spatio-temporal data.

 

Jenis - Jenis Atribut

1.    Atribut Nominal

2.    Atribut Ordinal

3.    Atribut Interval atau jarak

4.    Atribut Rasio (Mutlak)

 

Proses Data Mining

Memilih algoritme yang tepat dan yang tepat akan bergantung pada proses penemuan pengetahuan dalam kumpulan data secara keseluruhan.

 

Himpunan Data (Pemahaman dan Pengolahan Data)

1.    Data Cleaning

Pembersihan data adalah pemrosesan data untuk menangani data yang memiliki nilai yang hilang dalam catatan dan menghilangkan kebisingan.

2.    Data Integration

Integrasi data adalah penggabungan data basis data ke dalam basis data baru.

Integrasi yang baik data akan menghasilkan data gabungan dengan sedikit redundansi/atau inkonsistensi, sehingga meningkatkan akurasi dan kecepatan proses data mining.

3.    Data Transformation

Misalnya, beberapa metode standar seperti hanya analisis asosiasi pengelompokan hanya dapat menerima input kategorikal.

Analisis klasifikasi dan asosiasi tidak dapat menerima numerik kontinu, sehingga harus dipecah menjadi beberapaProses ini sering disebut transformasi data. Dalam kasus yang diterapkan ke kumpulan data penyakit ginjal kronis, langkah transformasi data memerlukan kumpulan data untuk didiskritisasi menggunakan .

 

Teknik Data Mining

1.    Klasifikasi

4.    2.Klasterisasi

2.    Association Rule

3.    Regression

 

Pengetahuan

Pengetahuan dari data mining adalah mengetahui bagaimana mengelola pengambilan keputusan tertentu atau tindakan selanjutnya yang akan dilakukan sesuai dengan hasil analisis yang diperoleh.

Proses pemberian informasi dari pengolahan data mining terkadang diperlukan untuk orang yang tidak mengerti data mining.

 

Evaluasi

Evaluasi model adalah proses untuk mengidentifikasi model untuk dimasukkan ke dalam basis pengetahuan yang ditemukan.

Evaluasi adalah proses mengevaluasi model yang menarik atau model prediksi, apakah mereka memenuhi hipotesis awal atau tidak. 

 Copyright stekom.ac.id 2018 All Right Reserved