Kamis, 05 Juni 2014

Gudang Data (Data Warehouse)




Data mining berpotensi tinggi jika data yang dikumpulkan dan disimpan dalam sebuah gudang data (data warehouse). Sebuah gudang data merupakan suatu sistem manajemen basis data relasional (RDBMS) yang didesain khusus untuk memenuhi kebutuhan sistem pengolahan transaksi.
Data warehouse secara bebas dapat didefinisikan sebagai tempat penyimpanan data terpusat yang dapat di query untuk manfaat bisnis. Data warehouse merupakan teknik baru yang powerful yang membuatnya mungkin untuk mengekstrak data operasional yang diarsipkan dan mengatasi ketidak konsistensian dari format-format data warisan yang berbeda.

Karakteristik data warehouse
Menurut Bill Inmon, ada empat karakteristik data warehouse yaitu:
1.     Subject – Oriented : Data diorganisasikan menurut subjek dari aplikasi, misalnya sebuah perusahaan asuransi menggunakan data warehouse yang mengorganisasi data mereka sebagai kastemer, premi dan klaim daripada dengan produk-produk berbeda (otomotif, jiwa, dsb).
2.    Integrated : ketika data menempati aplikasi-aplikasi yang terpisah dalam lingkungan operasional, pengkodean data sering kali tidak konsisten. Contoh dalam aplikasi, jender mungkin dikodekan sebagai “m” dan “f” ada juga dengan 0 dan 1. Saat data dipindahkan dari lingkungan operasionalnya ke dalam data warehouse, mereka akan mengasumsikan suatu konvensi pengkodean dengan konsisten. Misalnya data jender ditransformasikan menjadi “m” dan “f”.
3.    Time – variant : data warehouse terdiri dari suatu tempat untuk menyimpan data yang berusia 5 – 10 th atau lebih lama untuk digunakan sebagai komparasi, trend dan peramalan. Data-data ini tidak di-update.
4.    Non-volatile : data yang tidak diupdate sesudah mereka memasukkan data warehouse tetapi hanya dimuat dan diakses.

Sumber Referensi:
Hermawati, Fajar Astuti.2013. Data Mining. Yogyakarta: Andi.

Tidak ada komentar:

Posting Komentar