Ketika saya terlibat dalam pengembangan produk, saya sangat marah oleh para desainer pragmatis - orang-orang yang mencoba melakukan semuanya hanya berdasarkan penelitian statistik.
Jadi saya ingin tombolnya menjadi hijau, hanya karena saya lebih menyukainya. Dan perancangnya berkata - “tidak masalah, tes AB menunjukkan bahwa tombol warna diare 0,2% lebih sering diklik”. Tuhan, sobat, Anda telah memompa selera dan pengalaman Anda selama sepuluh tahun, jadi apa? Untuk membuat produk kami terlihat seperti kotoran burung? Tapi bisnis mengatakan - karena ada angka, maka kita akan membahas semuanya dengannya.
Saya mengerti orang ingin menghasilkan uang. Mereka tidak ingin mempercayai selera mereka dalam hal kepuasan kerumunan. Tetapi sekarang saya tahu bahwa masalahnya mungkin bukan pada angka, tetapi pada orang yang tidak tahu cara menggunakan uji statistik.
Minggu lalu di podcast kami adalah Andrey Akinshin, PhD dalam Fisika dan Matematika dan seorang ahli dalam analisis kinerja. Dia memberi tahu kami mengapa dia, juga, dibom oleh statistik matematika modern.
. — .
, . « ». , , , . – . , , , .
« » — . . , , P-value, . P-value , , . , ( « » ).
- , . — . - . . P-value , . , .
, -, , . , – , : , , , . , ! .
– 0,05. ? , 30- , , – , — . 20 , , , .
0,05. — , . Qwerty, , . Qwerty .
. 80- , , . – . , , - , , – «false positive». . , , – «false negative».
0.2. . : «, , , , . – 0.05. ». , , 0.2 – , , .
: «, , , , , . , , 0.2, ». , . , . -, . , ?
, , - .
. , , , , , . . .
, – . , . P-value. – P-value , 0.05. 0.049 0.051, : «! !».
0.9, , . «» , 20 , P-value , . , .
, . , – -, , . , . - , , , .
— -. — , -.
: ? -, -, P-value . : «, - , , ». , . , – .
– , .
, , , .
, : « ?» ( ), : « !».
– 0 1. . , . , , , , , . . – . : « » « - » — .
. — ? -, , . ; , – P-value – .
, .
, , - — « , . ». , . . . — -, , . , , P-value, — , ! - .
, . , , .
, , . , . . « - , , , , ».
— -, , . , . , — - .
Harlow, Lisa L., Stanley A. Mulaik, and James H. Steiger, eds. What if there were no significance tests? Routledge, 2016.
Cohen, Jacob. "The earth is round (p<. 05)." In What if there were no significance tests?, pp. 69-82. Routledge, 2016.
Amrhein, Valentin, Fränzi Korner-Nievergelt, and Tobias Roth. "The earth is flat (p> 0.05): significance thresholds and the crisis of unreplicable research." PeerJ 5 (2017): e3544.
Wasserstein, Ronald L., Allen L. Schirm, and Nicole A. Lazar. "Moving to a world beyond “p< 0.05”." (2019): 1-19.
Winder, W. C. "What you always wanted to know about testing but were afraid to ask." American dairy review (1973).
Grieve, Andrew P. "How to test hypotheses if you must." Pharmaceutical statistics 14, no. 2 (2015): 139-150.
Krawczyk, Michał. " Pencarian signifikansi: beberapa keanehan dalam distribusi nilai P dalam literatur psikologi eksperimental ." PloS one 10, no. 6 (2015).
Dan satu lagi pidato Andrey, di mana dia berbicara tentang masalah tersebut secara lebih rinci: