3 Paradoks Statistik Teratas dalam Ilmu Data

Terjemahan disiapkan sebagai bagian dari " Machine Learning. Profesional " Tentu saja .



Kami juga mengundang semua orang untuk mengambil bagian dalam dua hari intensif online "Menerapkan model ML: dari kode kotor di laptop ke layanan yang berfungsi".






Kesalahan pengamatan dan perbedaan subkelompok menyebabkan paradoks statistik

Kesalahan pengamatan dan perbedaan subkelompok dapat dengan mudah menyebabkan paradoks statistik dalam aplikasi ilmu data apa pun. Mengabaikan elemen-elemen ini dapat sepenuhnya mendiskreditkan kesimpulan analisis kami.





Memang, tidak jarang melihat fenomena yang mencengangkan sebagai tren subkelompok yang berbalik sepenuhnya dalam data agregat. Pada artikel ini, kita akan melihat 3 paradoks statistik paling umum yang ditemukan di Ilmu Data.





1. Paradoks Burkson

Contoh mencolok pertama adalah korelasi terbalik antara tingkat keparahan penyakit COVID-19 dan merokok (lihat, misalnya, tinjauan Wenzel 2020 Komisi Eropa ). Merokok merupakan faktor risiko yang terkenal untuk penyakit pernapasan, jadi bagaimana Anda menjelaskan kontroversi ini?





Griffith 2020, Nature, , (Collider Bias), . , , : «».





: «» — - « », « COVID-19». ( )





«» . , COVID-19 . , , , .





. , ( -).





: «», COVID-19! ( )





COVID-19 , , , .





— — ! , .





  1. COVID-19 . , 1, .





  2. (- , , ), - .





  3. , COVID-19,   ! , COVID-19 - , (, - , , ).





Berkson 1946, , , .





2. ()

. - - (, , ), , .





, , , , , . , ( — . ), : , !





, . : « ».





: « » — «n » «n ». ( )





. , , , , .





. , , (.. ).





: « », ! ( )





, , , .





  • , , .





  • , , , .





3.

— , - , , . .





1975 , , , .





  • , , ,   .





  • , , .





, , : A B.





  • 100 : 80 A, 68 (85%), 20 , 12 (60%).





  • 100 : 30 , 28 (93%), 70 B, 46 (66%).





: - , ! ( )





.





: , . ( )





, , . , ( A: 80–30, B: 20–70). , B ( ), ( ). , .





, -, data science. .






"Machine Learning. Professional"





- « ML : »








All Articles