Danau, gudang dan data mart

Mari pertimbangkan tiga jenis penyimpanan data cloud, perbedaan dan aplikasinya.







Danau data



Sebuah danau data repositori besar data mentah mentah, baik terstruktur dan semi-terstruktur. Data dikumpulkan dari berbagai sumber dan disimpan dengan mudah. Mereka tidak diubah untuk tujuan tertentu dan tidak dikonversi ke format apa pun. Menganalisis data ini membutuhkan persiapan, pembersihan, dan pemformatan yang lama agar homogen. Danau data adalah sumber daya yang bagus untuk pemerintah kota dan organisasi lain yang menyimpan informasi terkait gangguan infrastruktur, lalu lintas, kejahatan, atau demografi. Data tersebut nantinya dapat digunakan untuk membuat perubahan anggaran atau merevisi sumber daya yang dialokasikan untuk utilitas atau layanan darurat.



Penyimpanan data



Sebuah gudang data adalah data dikumpulkan dari sumber yang berbeda ke dalam sebuah repositori pusat tunggal yang unifies mereka dalam hal kualitas dan format. Ilmu data dapat memanfaatkan data dari penyimpanan di berbagai bidang seperti penggalian data , kecerdasan buatan (AI) , pembelajaran mesindan, tentu saja, dalam intelijen bisnis. Gudang data dapat digunakan di kota-kota besar untuk mengumpulkan informasi tentang transaksi elektronik dari berbagai departemen, termasuk data tentang tiket ngebut, pajak cukai, dan lainnya. Gudang data juga dapat digunakan oleh pengembang untuk mengumpulkan terabyte data yang dihasilkan oleh sensor otomotif. Ini akan membantu mereka membuat keputusan yang tepat saat mengembangkan teknologi untuk mengemudi otonom.



Etalase Data



Sebuah data mart adalah data warehouse dirancang untuk lingkaran tertentu dari pengguna dalam sebuah perusahaan atau divisi. Data mart dapat digunakan oleh departemen pemasaran sebuah perusahaan manufaktur untuk mengidentifikasi khalayak sasaran ketika mengembangkan rencana pemasaran. Ini juga dapat digunakan oleh departemen manufaktur untuk menganalisis kinerja dan tingkat kesalahan untuk menciptakan kondisi untuk perbaikan proses yang berkelanjutan. Kumpulan data di data mart sering digunakan secara real time untuk analitik dan hasil yang dapat ditindaklanjuti.



Danau, Gudang, dan Data Mart: Perbedaan Utama



Semua repositori yang disebutkan digunakan untuk menyimpan data, tetapi ada perbedaan yang signifikan di antara mereka. Misalnya, gudang data dan danau data adalah tempat penyimpanan yang besar, tetapi danau biasanya lebih hemat biaya dalam hal biaya implementasi dan pemeliharaan karena sebagian besar menyimpan data yang tidak terstruktur. 



Arsitektur data lake telah berkembang selama beberapa tahun terakhir dan sekarang mampu mendukung lebih banyak data dan komputasi awan. Data dalam jumlah besar mengalir dari sumber yang berbeda ke repositori terpusat. 



Sebuah gudang data dapat diatur dengan salah satu dari tiga cara:



  1. Sebagai layanan terkelola yang ditawarkan oleh penyedia cloud.
  2. , .
  3. , , .


Data di gudang lebih mudah digunakan untuk tujuan yang berbeda dari data di danau. Ini karena data di gudang terstruktur dan lebih mudah diambil dan dianalisis.



Data mart berisi sejumlah kecil data dibandingkan dengan gudang dan danau, yang dikategorikan untuk digunakan oleh sekelompok orang atau divisi perusahaan tertentu. Data mart dapat diwakili oleh berbagai skema (bintang, kepingan salju, atau kubah) yang ditentukan oleh struktur data logis. Format data vault adalah yang paling fleksibel, serbaguna, dan dapat diskalakan.



Ada tiga jenis data mart:



  1. Data mart yang bergantung yang terdiri dari bagian-bagian gudang data perusahaan. Ini berisi kumpulan data primer untuk gudang.
  2. , , .
  3. , . .


Pilihan jenis dan struktur repositori data sangat bergantung pada kebutuhan dan persyaratan perusahaan. Jika itu yang penting bagi Anda, manfaatkan penyimpanan cloud hybrid , yang fleksibel dan dapat diskalakan, serta pendekatan yang lebih komprehensif dan terinformasi untuk pemecahan masalah dan pengambilan keputusan.



IBM menawarkan berbagai solusi penyimpanan awan dan penambangan data. Tanmay Sinha Direktur Program, Link Blog Portofolio Db2


























All Articles