Dalam pekerjaan kami, saya dan rekan kerja sering melihat bagaimana perusahaan dihadapkan pada masalah pengelolaan data - ketika ada banyak tabel dan kueri dan sangat sulit untuk mengelola semua ini. Dalam situasi seperti itu, kami merekomendasikan pemodelan data. Untuk memahami apa itu, saya menerjemahkan artikel-review tentang pemodelan data dari Towards Data Science, di mana, selain istilah dan konsep dasar, Anda dapat menemukan contoh ilustrasi penggunaan pemodelan data di ritel. Maju di bawah luka!
Jika Anda melihat aplikasi perangkat lunak apa pun, Anda akan melihat bahwa, pada tingkat fundamental, ia mengatur, memproses, dan menyajikan data untuk memenuhi persyaratan bisnis.
Model data adalah representasi konseptual untuk mengekspresikan dan mengkomunikasikan kebutuhan bisnis. Ini secara visual menunjukkan sifat data, aturan bisnis yang mengatur data, dan bagaimana data akan diatur dalam database.
Pemodelan data dapat dibandingkan dengan membangun rumah. Katakanlah ABC perlu membangun rumah tamu (database). Perusahaan memanggil arsitek (pemodel data) dan menjelaskan persyaratan bangunan (persyaratan bisnis). Arsitek (pemodel data) mengembangkan rencana (model data) dan mengirimkannya ke ABC. Akhirnya, ABC memanggil insinyur sipil (DBA dan DBA) untuk membangun rumah.
Istilah kunci dalam pemodelan data
Entitas dan atribut. Entitas adalah "benda" dalam lingkungan bisnis yang datanya ingin kita simpan, seperti produk, pelanggan, pesanan, dan sebagainya. Atribut digunakan untuk mengatur dan menyusun data. Misalnya, kita perlu menyimpan informasi tertentu tentang produk yang kita jual, seperti harga jual atau jumlah yang tersedia. Potongan data ini adalah atribut entitas Produk. Entitas biasanya tabel database, dan atribut adalah kolom dari tabel tersebut.
Hubungan . Hubungan antar entitas menggambarkan bagaimana satu entitas terkait dengan yang lain. Dalam model data, entitas dapat dikaitkan sebagai satu-ke-satu, banyak-ke-satu, atau banyak-ke-banyak.
. « », , « » « ».
: 2 — . , .
, « »:
ER . ER- , .
, . :
— . , , , - -. :
, , , . , , — . :
:
vs
- . — , . , . 3- . OLTP .
. , .
ABC 200 . , « », «», « », « » .. 20 000 . (SKU). 6 000 -, . - (UPC). POS- 2 : , , .
, . , , ..
.
1. -
, POS-. , , , . , , .
2:
. . , . :
Date Dimension
Product Dimension
Store Dimension
Promotion Dimension
, (, , .), .
3:
, . :
4:
. :
Date Dimension:
Product:
Store:
Promotion:
Sales Fact:
.
(, ).
: * .
: , .
: - .
:
Langkah 5: membuat tabel fisik di database
Dengan menggunakan alat pemodelan data atau skrip kustom, Anda sekarang dapat membuat tabel fisik di database.
Saya pikir sekarang sudah cukup jelas bahwa pemodelan data adalah salah satu tugas terpenting dalam mengembangkan aplikasi perangkat lunak. Dan itu meletakkan dasar untuk mengatur, menyimpan, mengambil, dan menyajikan data.