Sabtu, 07 Juni 2014

BAB 2 - Landasan Teori - Data Mining Sebagai Solusi Bisnis

BAB 2
LANDASAN TEORI

2.1 Pengertian Data
Menurut Turban (2010, p41), data adalah deskripsi  dasar dari benda, peristiwa, aktivitas dan transaksi yang direkam, dikelompokkan, dan disimpan tetapi belum memiliki arti. Sedangkan menurut Keri E.Pearlson, Carol S. Saunders (2009, p13), data adalah suatu set tertentu berupa fakta-fakta yang berdiri sendiri yang memiliki makna intrinsik, tetapi dapat dengan mudah ditangkap, dan dikirim, disimpan secara elektronik.
Menurut Indrajani (2009, p2), data adalah fakta atau observasi mentah yang biasanya mengenai fenomena fisik atau transaksi bisnis dan data merupakan ukuran objektif dari atribut atau karakteristik dari entitas seperti orang, benda, tempat dan kejadian. Representasi fakta yang mewakili suatu objek seperti pelanggan, pemasok, karyawan, murid, dosen, mahasiswa dan sebagainya yang disimpan dalam bentuk angka, huruf, simbol, teks, suara, gambar dan sebagainya.
Berdasarkan pengertian diatas, dapat disimpulkan bahwa data adalah kumpulan dari kumpulan fakta yang didapat dari kejadian yang terjadi dan kumpulan tersebut direkam, dikelompokan dan disimpan dalam berbagai bentuk.

2.2 Pengertian Database
Menurut Kroenke dan Auer (2010, p8), database atau basis data adalah kumpulan data yang saling berhubungan antara data yang satu dengan data yang lainnya dan struktur lainnya. Sedangkan menurut Turban (2009, p108), database adalah suatu kumpulan dari file-file yang menyimpan suatu data yang saling berhubungan dan berasosiasi satu dengan yang lainnya, data yang disimpan tersebut dapat mempengaruhi kecepatan user untuk melakukan akses, waktu respon pada query, entri data, security dan biaya.
Menurut Abdillah (2012, p1) menjelaskan bahwa database adalah dua atau lebih data dengan elemen-elemen data penghubung yang dapat diakses dengan berbagai cara. Sedangkan menurut Iskandar dan Rangkuti (2008, p3) mengatakan kalau database merupakan kumpulan dari data yang saling berhubungan satu dengan data lainnya.

Jadi database adalah penyimpanan data yang saling terintegrasi dan saling terkait dengan elemen-elemen penghubungnya yang dapat diakses dengan berbagai cara.

2.3 Pengertian Data Mining
Menurut Han et al (2011, p6) menjelaskan bahwa data mining merupakan pemilihan suatu data atau dengan istilah menggali pengetahuan dari jumlah data yang banyak. Selain itu, Han et al (2011, p36) menjelaskan lagi bahwa data mining adalah proses menemukan  pola yang menarik, dan pengetahuan dari data yang berjumlah besar. Sedangkan menurut Segall, Guha dan Nonis (2008, p127) menjelaskan bahwa data mining disebut penemuan pola-pola yang tedapat pada suatu data dan data mining merupakan proses menganalisis data dari perspektif atau pandangan yang berbeda, mengumpulkan data tersebut dan merincikan data tersebut sehingga menjadi informasi yang berguna.
Berdasarkan pengertian diatas, dapat disimpulkan bahwa data mining merupakan suatu proses yang menganalisis data dalam jumlah yang besar atau banyak dan membuat suatu pola untuk menjadi informasi yang berguna bagi penggunanya.

2.3.1 Karakteristik Data Mining
Menurut Turban (2007, p230) menjelaskan beberapa karakteristik data mining, yaitu :
1)      Data sering terpendam dalam waktu yang lama biasanya bertahun-tahun didalam database,
2)      Lingkungan data mining berupa arsitektur client-server dan arsitektur sistem informasi,
3)      Tool yang canggih seperti tool visualisasi tambahan yang membantu menghilangkan lapisan informasi yang terpendam dalam file-file atau record-record,
4)      Data drill dan tool penguasaan query yang mendukung user untuk menanyakan pertanyaan dan mendapatkan jawaban secepatnya,
5)      Tool data mining yang dikombinasikan dengan spreadsheet dan tools software pengembangan yang lainnya,
6)      Proses paralel untuk data mining yang membantu dalam pencarian data dalam jumlah yang besar.

2.3.2 Fungsi Data Mining
Menurut Maclennan et al(2009, p6) menjelaskan beberapa fungsi data mining, yaitu :
1)      Classification
Berfungsi untuk mengklasifikasikan suatu target class kedalam kategori yang akan dipilih.


 Gambar 2.1 Classification – Decision Tree
Sumber: Maclennan et al (2009, p7)

2)      Clustering
Berfungsi untuk mencari pengelompokan atribut ke dalam segmentasi-segmentasi berdasarkan similaritas.

Gambar 2.2 Clustering
Sumber: Maclennan et al (2009, p7)

3)      Association
Berfungsi untuk mencari keterkaitan antara atribut atau item set berdasarkan jumlah item yang muncul dan rule association yang ada.

Gambar 2.3 Product Association
Sumber: Maclennan et al (2009, p7)

4)      Regression
Berfungsi untuk mencari prediksi dari suatu pola yang ada, hampir mirip dengan klasifikasi.



5)      Forecasting
Berfungsi untuk peramalan waktu yang akan datang berdasarkan trend yang telah terjadi di waktu sebelumnya.

Gambar 2.4 Forecasting
Sumber: Maclennan et al (2009, p8)

6)      Sequence Analysis
Berfungsi untuk mencari pola urutan dari rangkaian suatu kejadian.

Gambar 2.5 Web Navigation Sequence
Sumber: Maclennan et al (2009, p9)

7)      Deviation Analysis
Berfungsi untuk mencari kejadian langka atau kejadian yang belum pernah terjadi sebelumnya dan kejadian yang sangat berbeda dari keadaan normal.

  

Tidak ada komentar:

Posting Komentar