6 prinsip visualisasi data yang efektif

Prinsip-prinsip utama untuk membuat grafik yang berguna dan informatif



Visualisasi data merupakan langkah penting dalam proses memahami ilmu data. Di sinilah Anda menyajikan dan melaporkan hasil Anda dalam format grafis yang intuitif dan mudah dimengerti.



Visualisasi data membutuhkan banyak pekerjaan, banyak pekerjaan pembersihan dan analisis dilakukan untuk menyaring dan mengubah data kotor menjadi grafik dan bagan yang indah. Tetapi bahkan dengan data yang disiapkan, Anda masih harus mematuhi prinsip atau metodologi tertentu untuk membuat grafik yang berguna dan informatif.



Namun, dalam menulis artikel ini, saya mengambil inspirasi dari buku Edward Taft Beautiful Evidence, yang berisi enam prinsip tentang bagaimana membuat grafik data berguna. Prinsip-prinsip inilah yang memisahkan bagan yang berguna dari yang tidak berguna.



Artikel ini juga sangat terinspirasi oleh Analisis Data Eksplorasi Roger D. Peng di R. Ini tersedia secara gratis di Bookdown dan Anda dapat membacanya untuk mempelajari lebih lanjut tentang EDA.



Mari kita lihat lebih dekat prinsip-prinsip ini.





Contoh visualisasi data di Our World in Data






1. Tunjukkan perbandingan (kelompok kontrol dan eksperimen)



Demonstrasi perbandingan adalah dasar dari penelitian ilmiah yang baik. Bukti hipotesis selalu terkait dengan hal lain. Mari kita ambil contoh: Anda berkata, "Cokelat hitam meningkatkan konsentrasi dan kemampuan belajar." Pertanyaan penting dalam pernyataan ini adalah "dibandingkan dengan apa?" Tanpa perbandingan (hipotesis relatif), pernyataan itu tidak berguna.



Salah satu cara untuk menunjukkan perbandingan adalah dengan kelompok kontrol dan perlakuan. Orang dalam satu kelompok akan makan coklat, orang dalam kelompok kedua tidak. Dengan cara ini, Anda dapat membandingkan efek cokelat terhadap konsentrasi dan kemampuan belajar berdasarkan hasil tes atau dengan mengukur aktivitas otak.



Saat membuat grafik untuk presentasi penelitian Anda, Anda dapat membuat grafik kelompok kontrol dan perlakuan menggunakan kotak kumis. Dengan cara ini, pembaca mendapatkan gambaran yang jelas tentang efek percobaan.



Saat membuat grafik untuk mewakili penelitian Anda, Anda dapat membuat grafik kelompok kontrol dan perlakuan menggunakan grafik persegi panjang. Dengan cara ini, pembaca mendapatkan pemahaman yang jelas tentang efek pengobatan.



2. Kausalitas dan penjelasan



Berikut adalah penjelasan yang menunjukkan kausalitas dalam memikirkan pertanyaan yang coba Anda jawab. Jika Anda telah menunjukkan bahwa suatu efek diperoleh pada kelompok eksperimen tetapi tidak pada kelompok kontrol, Anda harus merumuskan hipotesis dari bukti mengapa demikian.



Kembali ke contoh sebelumnya, misalkan subjek dalam kelompok eksperimen mendapatkan skor yang lebih tinggi pada tes, yang menunjukkan bahwa cokelat hitam meningkatkan konsentrasi. Sebuah pertanyaan penting: mengapa ini terjadi?



Pertanyaan ini penting karena membantu memunculkan pertanyaan lain yang dapat menyangkal atau mendukung hipotesis Anda selama penelitian.



Untuk menunjukkan hubungan sebab akibat atau mekanisme, Anda dapat mengukur aktivitas otak dari kelompok kontrol dan perlakuan dan membuat grafik hasil dengan menunjukkannya secara berdampingan. Dengan menggunakan grafik skor tes dan grafik aktivitas otak, Anda akan melihat alasan mengapa subjek yang mengonsumsi cokelat memperoleh skor yang lebih tinggi, yaitu jawaban atas pertanyaan bagaimana cokelat hitam meningkatkan fungsi kognitif.



3. Data dengan banyak variabel (lebih dari dua variabel)



Dunia nyata itu kompleks dan hubungan antara dua peristiwa biasanya tidak linier. Jadi dalam penelitian, Anda memiliki atribut atau variabel yang dapat Anda ukur. Semua variabel ini berinteraksi satu sama lain dengan cara yang berbeda. Beberapa di antaranya dapat membingungkan , sementara yang lain dapat menjadi atribut penting yang menjelaskan hubungan peristiwa.



Seperti yang telah Anda ketahui, korelasi tidak berarti penyebab. Oleh karena itu, bukanlah ide yang baik untuk membatasi penelitian Anda hanya pada dua variabel: ini mengarah pada kesimpulan yang salah. Dengan demikian, Anda harus menampilkan data sebanyak mungkin di bagan Anda. Ini dapat membantu Anda menemukan kebingungan dalam data Anda.



Ambil contoh paradoks Simpson, sebuah paradoks dalam statistik probabilistik, ketika "ketika kelompok digabungkan, kecenderungan yang terjadi pada kelompok data yang berbeda menghilang." Menggambarkan:



  • Dua variabel - hubungan negatif.

  • Tiga variabel - hubungan positif (x, y, z) (ada variabel yang membingungkan).



4. Jangan biarkan alat mendorong analisis Anda



Pendongeng yang baik tahu bagaimana menarik perhatian orang sambil bercerita dengan cara yang produktif. Pendongeng tidak terbatas pada cerita itu sendiri, tetapi dapat mengungkapkan cerita dengan cara yang unik, menggabungkan persepsi yang berbeda dan termasuk banyak citra, membuat cerita menjadi hidup.



Demikian pula, visualisator data yang baik tidak terbatas pada alat visualisasi yang ada. Orang yang merender data memiliki kemampuan untuk beralih dari satu bentuk ekspresi (misalnya, garis atau lingkaran) ke menggunakan beberapa mode presentasi.



Misalnya, alih-alih membuat laporan yang hanya berisi teks, gunakan infografis: gambar, bagan, kata, angka, dan sebagainya, semua ini akan memperkaya informasi. Dengan informasi dan grafik yang berlimpah, pembaca dapat mengamati banyak korelasi bukti yang berbeda di satu tempat. Jadi ingatlah bahwa Anda sedang bercerita. Jangan biarkan alat membatasi pemikiran Anda. Biarkan analisis menggerakkan alat, membuat grafik yang menakjubkan dan kaya akan bukti.



5. Dokumentasikan bagan Anda dengan label, skala, dan sumber data yang sesuai



Saat pertama kali melihat bagan, Anda akan melihat judulnya terlebih dahulu, lalu label konteks bagan. Tanpa mereka, grafik tidak menunjukkan apapun. Laporan / grafik yang baik didokumentasikan dengan baik dengan skala dan label yang sesuai untuk setiap grafik. Sumber data yang digunakan untuk membuat grafik juga penting. Karenanya, merupakan praktik yang baik untuk menyimpan kode yang digunakan untuk menghasilkan data dan grafik: ini memungkinkan data direproduksi. Ini juga menambah kredibilitas grafik Anda. Selain itu, dengan menyimpan kodenya, Anda dapat mengedit grafik jika perlu.



6. Konten didahulukan



Pada akhirnya, terlepas dari semua prinsip di atas, tanpa konten yang berkualitas tinggi, relevan, dan holistik, grafik Anda tidak akan berguna atau menyesatkan. Dengan kata lain, "sampah di dalam, sampah di luar". Sebelum melaporkan hasil apa pun, pastikan hasil tersebut menarik dan penting. Tidak peduli seberapa indah atau visual grafik Anda, tidak ada yang menginginkan hasil yang tidak berguna. Sesuatu yang menarik adalah pengalaman pribadi atau sesuatu yang terinspirasi dari Internet. Bagaimanapun, selalu ajukan pertanyaan: begitulah ide menjadi kenyataan.



Kesimpulan



Visualisasi data adalah keterampilan yang luar biasa. Anda dapat mengambil data dan mengubahnya menjadi grafik dan plot indah yang menceritakan sebuah cerita kepada orang-orang. Di era ketika data tumbuh secara eksponensial, semakin penting untuk dapat menceritakan sebuah cerita dengan data. Inilah momen terbaik untuk mempelajari hal-hal baru. Dan ringkasan prinsip:



  1. Tunjukkan perbandingan.
  2. Tunjukkan alasannya.
  3. Tampilkan data multidimensi.
  4. Gabungkan bukti sebanyak mungkin.
  5. Jelaskan dan dokumentasikan jadwal tersebut.
  6. Pastikan cerita Anda menarik.


Apa yang saya ingin Anda ambil dari artikel ini adalah ini: Selalu ingat untuk memulai dengan pertanyaan yang bagus, gunakan pendekatan yang benar, dan hanya menyajikan informasi yang diperlukan untuk menjawab pertanyaan Anda yang baik.



Saya meninggalkan kutipan ini dari matematikawan Amerika John Tukey , yang mengantar era baru statistik: 



Grafik sederhana membawa lebih banyak informasi ke dalam benak seorang analis data daripada perangkat apa pun.


Untuk pemahaman yang lebih dalam tentang prinsip-prinsip ini, saya merekomendasikan untuk merujuk pada buku karya Roger D. Peng "Analisis Data Eksplorasi di R" (Saya akan meninggalkan tautan ke sana di bawah).



Sumber daya dan tautan



Jika Anda ingin mempelajari lebih lanjut tentang visualisasi data, lihat buku-buku gratis yang hebat ini:





Platform yang menampilkan visualisasi yang indah




Panduan untuk membuat bagan tersedia di sumber daya ini.




Tautan untuk artikel ini




Terima kasih sudah membaca!



gambar






Profesi dan kursus lainnya


















All Articles