Data
mining berpotensi tinggi jika data yang dikumpulkan dan disimpan dalam sebuah
gudang data (data warehouse). Sebuah gudang data merupakan suatu sistem
manajemen basis data relasional (RDBMS) yang didesain khusus untuk memenuhi
kebutuhan sistem pengolahan transaksi.
Data
warehouse secara bebas dapat didefinisikan sebagai tempat penyimpanan data
terpusat yang dapat di query untuk manfaat bisnis. Data warehouse merupakan
teknik baru yang powerful yang membuatnya mungkin untuk mengekstrak data
operasional yang diarsipkan dan mengatasi ketidak konsistensian dari
format-format data warisan yang berbeda.
Karakteristik
data warehouse
Menurut
Bill Inmon, ada empat karakteristik data warehouse yaitu:
1. Subject
– Oriented : Data diorganisasikan
menurut subjek dari aplikasi, misalnya sebuah perusahaan asuransi menggunakan
data warehouse yang mengorganisasi data mereka sebagai kastemer, premi dan
klaim daripada dengan produk-produk berbeda (otomotif, jiwa, dsb).
2. Integrated : ketika data menempati
aplikasi-aplikasi yang terpisah dalam lingkungan operasional, pengkodean data
sering kali tidak konsisten. Contoh dalam aplikasi, jender mungkin dikodekan
sebagai “m” dan “f” ada juga dengan 0 dan 1. Saat data dipindahkan dari
lingkungan operasionalnya ke dalam data warehouse, mereka akan mengasumsikan
suatu konvensi pengkodean dengan konsisten. Misalnya data jender
ditransformasikan menjadi “m” dan “f”.
3. Time
– variant : data warehouse
terdiri dari suatu tempat untuk menyimpan data yang berusia 5 – 10 th atau
lebih lama untuk digunakan sebagai komparasi, trend dan peramalan. Data-data
ini tidak di-update.
4. Non-volatile
: data yang tidak diupdate sesudah
mereka memasukkan data warehouse tetapi hanya dimuat dan diakses.
Sumber Referensi:
Hermawati, Fajar Astuti.2013. Data
Mining. Yogyakarta: Andi.
Tidak ada komentar:
Posting Komentar