BAB 2
LANDASAN TEORI
2.1 Pengertian Data
Menurut Turban (2010, p41), data
adalah deskripsi dasar dari benda,
peristiwa, aktivitas dan transaksi yang direkam, dikelompokkan, dan disimpan
tetapi belum memiliki arti. Sedangkan menurut Keri E.Pearlson, Carol S. Saunders (2009, p13), data adalah suatu set tertentu berupa fakta-fakta yang berdiri sendiri yang memiliki
makna intrinsik, tetapi dapat dengan mudah ditangkap, dan dikirim, disimpan
secara elektronik.
Menurut Indrajani (2009, p2), data
adalah fakta atau observasi mentah yang biasanya mengenai fenomena fisik atau
transaksi bisnis dan data merupakan
ukuran objektif dari atribut atau karakteristik dari entitas seperti orang,
benda, tempat dan kejadian. Representasi fakta yang mewakili suatu objek seperti
pelanggan, pemasok, karyawan, murid, dosen, mahasiswa dan sebagainya yang
disimpan dalam bentuk angka, huruf, simbol, teks,
suara, gambar dan sebagainya.
Berdasarkan pengertian diatas, dapat
disimpulkan bahwa data adalah kumpulan
dari kumpulan fakta yang didapat dari kejadian yang terjadi dan kumpulan
tersebut direkam, dikelompokan dan disimpan dalam berbagai bentuk.
2.2 Pengertian Database
Menurut Kroenke dan Auer (2010, p8),
database atau basis data adalah kumpulan data yang saling berhubungan antara data yang satu dengan data yang lainnya dan struktur lainnya.
Sedangkan menurut Turban (2009, p108),
database adalah suatu kumpulan dari file-file yang menyimpan suatu data yang saling berhubungan dan
berasosiasi satu dengan yang lainnya, data
yang disimpan tersebut dapat mempengaruhi kecepatan user untuk melakukan akses, waktu respon pada query, entri data, security dan biaya.
Menurut Abdillah (2012, p1) menjelaskan bahwa database adalah dua atau lebih data dengan elemen-elemen data penghubung yang dapat diakses
dengan berbagai cara. Sedangkan menurut Iskandar
dan Rangkuti (2008, p3) mengatakan kalau database merupakan kumpulan dari data yang saling berhubungan satu dengan data lainnya.
Jadi database
adalah penyimpanan data yang saling
terintegrasi dan saling terkait dengan elemen-elemen penghubungnya yang dapat
diakses dengan berbagai cara.
2.3 Pengertian Data Mining
Menurut Han et al (2011, p6)
menjelaskan bahwa data mining
merupakan pemilihan suatu data atau
dengan istilah menggali pengetahuan dari jumlah data yang banyak. Selain itu, Han
et al (2011, p36) menjelaskan
lagi bahwa data mining adalah proses
menemukan pola yang menarik, dan
pengetahuan dari data yang berjumlah
besar. Sedangkan menurut Segall, Guha dan Nonis (2008, p127) menjelaskan bahwa data
mining disebut penemuan pola-pola yang tedapat pada suatu data dan data mining merupakan proses menganalisis data dari perspektif atau pandangan yang berbeda, mengumpulkan data tersebut dan merincikan data tersebut sehingga menjadi informasi
yang berguna.
Berdasarkan pengertian diatas, dapat disimpulkan
bahwa data mining merupakan suatu
proses yang menganalisis data dalam
jumlah yang besar atau banyak dan membuat suatu pola untuk menjadi informasi
yang berguna bagi penggunanya.
2.3.1 Karakteristik
Data Mining
Menurut Turban (2007, p230) menjelaskan beberapa karakteristik data mining, yaitu :
1)
Data sering
terpendam dalam waktu yang lama biasanya bertahun-tahun didalam database,
2)
Lingkungan
data mining berupa arsitektur client-server dan arsitektur sistem
informasi,
3)
Tool yang canggih
seperti tool visualisasi tambahan
yang membantu menghilangkan lapisan informasi yang terpendam dalam file-file
atau record-record,
4)
Data drill dan tool penguasaan query
yang mendukung user untuk menanyakan
pertanyaan dan mendapatkan jawaban secepatnya,
5)
Tool data mining yang
dikombinasikan dengan spreadsheet dan
tools software pengembangan yang
lainnya,
6)
Proses
paralel untuk data mining yang
membantu dalam pencarian data dalam
jumlah yang besar.
2.3.2 Fungsi Data Mining
Menurut Maclennan et al(2009, p6) menjelaskan beberapa fungsi data mining, yaitu :
1)
Classification
Berfungsi untuk
mengklasifikasikan suatu target class
kedalam kategori yang akan dipilih.
Gambar 2.1 Classification – Decision Tree
Sumber:
Maclennan
et al (2009, p7)
2)
Clustering
Berfungsi untuk
mencari pengelompokan atribut ke dalam segmentasi-segmentasi berdasarkan
similaritas.
Gambar 2.2 Clustering
Sumber: Maclennan et al (2009, p7)
3)
Association
Berfungsi untuk
mencari keterkaitan antara atribut atau item
set berdasarkan jumlah item yang muncul dan rule association
yang ada.
Gambar 2.3 Product
Association
Sumber: Maclennan et al (2009, p7)
4)
Regression
Berfungsi untuk
mencari prediksi dari suatu pola yang ada, hampir mirip dengan klasifikasi.
5)
Forecasting
Berfungsi untuk
peramalan waktu yang akan datang berdasarkan trend yang telah terjadi di waktu
sebelumnya.
Gambar 2.4 Forecasting
Sumber: Maclennan et al (2009, p8)
6)
Sequence
Analysis
Berfungsi untuk
mencari pola urutan dari rangkaian suatu kejadian.
Gambar 2.5 Web Navigation Sequence
Sumber: Maclennan et al (2009, p9)
7)
Deviation
Analysis
Berfungsi untuk
mencari kejadian langka atau kejadian yang belum pernah terjadi sebelumnya dan
kejadian yang sangat berbeda dari keadaan normal.





Tidak ada komentar:
Posting Komentar