Bagaimana perusahaan mengetahui data scientist mana yang lebih keren saat mempekerjakan mereka? Bagaimana cara menunjukkan bakat Anda dan menjadi terkenal di komunitas? Berdasarkan peringkat apa yang dibentuk, berdasarkan apa Anda dapat dipekerjakan untuk posisi bergengsi? Kami akan memberi tahu Anda tentang platform kompetitif paling terkenal, kemungkinan dan aturan permainannya, dan juga mengungkapkan daftar peserta terbaik dari Rusia.

Ilmu data, menurut definisi, adalah ilmu. Oleh karena itu, untuk mengevaluasi pengembang dan analis, indeks Hirsch , tersebar luas di kalangan ilmuwan, telah dan diterapkan sejak lama . Ini membantu, dengan jumlah publikasi dan kutipannya, untuk memahami seberapa banyak karya ilmiah dibutuhkan - dan karenanya penulisnya.
Indeks Hirsch h sama dengan jumlah artikel, yang masing-masing telah direferensikan setidaknya h kali. Artinya, untuk menghitungnya, mereka mengambil semua artikel ilmuwan yang dikutip oleh rekan-rekannya, menyusunnya dalam urutan menurun dari jumlah referensi ke mereka, memberikan nomor kepada mereka. Setelah itu, mereka menemukan artikel terakhir yang jumlahnya tidak melebihi jumlah sitasi. Angka ini adalah indeks Hirsch.Rumit? Tampaknya tidak terlalu baik, dan ilmuwan data yang sebenarnya langsung mengerti - hanya saja tidak terlalu cocok untuk mengevaluasi pekerjaan mereka. Bagaimanapun, hasil kerja mereka lebih sering berupa kode, bukan teks ilmiah. Selain itu, data scientist banyak diminati di pasar, dan pasar lebih penting tentang contoh algoritme daripada pencapaian dalam sains.
Namun seringkali perusahaan merahasiakan informasi tentang karyawan dan pekerjaan mereka. Ilmuwan Data secara hati-hati bersembunyi di Rusia, di mana ada kekurangan besar personel di daerah ini.
Sebagai tanggapan atas permintaan, platform kompetitif untuk pengembang semakin populer. Layanan paling terkenal adalah Kaggle (diucapkan: "cajel"), yang dimiliki oleh Google. Siswa menggunakannya dan pengembang profesional memberi tahucara meningkatkan peringkat Anda. Solusi yang diterapkan di sana mengatur mode di antara para ilmuwan data, dan perusahaan di Rusia serta di dunia memperhatikan tempat mereka di peringkat Kaggle saat merekrut.
Pada tahun 2017, lebih dari satu juta pengguna terdaftar di Kaggle , dan pada Agustus 2020 pengguna dari Rusia menggunakan layanan Google hampir sesering frasa "Big Data":
Kaggle sepenuhnya gratis dan setiap pengguna dapat menyelenggarakan kompetisi penambangan data atau berpartisipasi dalam kompetisi yang sudah ada. Sistem menghosting kumpulan data terbuka , dan juga menyediakan alat cloud untuk pemrosesan dan pembelajaran mesin mereka. Ada juga kesempatan untuk belajar dan bagian untuk memposting lowongan, di mana kontes juga akan membantu memilih kandidat terbaik.
Bagaimana itu bekerja
Salah satu fitur yang menarik dari Kaggle, yang membuatnya menjadi sangat populer di lingkungan ilmu data, adalah sistem peringkat .
Pengguna dapat memperoleh poin dan meningkatkan peringkat mereka dalam empat kategori berbeda:
- Kompetisi. Sendiri atau sebagai tim, Anda memecahkan masalah pembelajaran mesin. Kompetisi sangat beragam: dari tugas yang sederhana dan mudah untuk memprediksi jumlah penyintas di Titanic hingga menilai keefektifan pemain pertahanan saat memainkan umpan dari NFL Big Data Bowl 2021.
- Kode program. Bagikan kode Anda dengan komunitas dengan menjalankannya di Kaggle Notebooks, lingkungan komputasi awan.
- Kumpulan data. Anda dapat membantu ilmuwan data lainnya dengan membagikan data baru.
- Diskusi. Diskusikan tugas dan bagikan solusi terbaik Anda, serta beri peringkat pada postingan pengguna lain.
Promosi di setiap kategori tidak bergantung pada kategori lainnya. Tingkat pencapaian yang berbeda tersedia di dalamnya:
- Pemula. Anda hanya perlu mendaftar.
- Peserta. Anda mengisi profil Anda dan berbicara dengan komunitas, dan juga menggunakan semua fitur platform:
- Jalankan satu skrip.
- Kami ikut serta dalam satu kompetisi.
- Kami menulis satu komentar.
- Kami memberikan satu suara untuk salah satu peserta.
- . Kaggle . , Kaggle .
- . , Kaggle . «» , .
- . . .
Medali diberikan untuk hasil yang luar biasa dalam kompetisi, kode program populer atau kumpulan data yang berguna dan tetap selamanya. Pada saat yang sama, poin kehilangan nilainya dari waktu ke waktu, yang memungkinkan peringkat keseluruhan tetap relevan.
Siapa yang lebih dulu?
Hampir semua Kaggle memiliki pengguna terdaftar dari India dan Amerika Serikat. Rusia menempati tempat kelima yang stabil di peringkat keseluruhan negara - antara Cina dan Jepang. Tempat pertama dalam peringkat keseluruhan kompetisi sains data ditempati oleh Guanshuo Xu, seorang ilmuwan data dari New York. Selama lima tahun, dia mencetak lebih dari 255 ribu poin di kompetisi-Kaggle (ini adalah rekor absolut).
Guangshuo selesai gelar sarjana teknik kelistrikan dan elektronik di Universitas Tongji di Shanghai, dan kemudian memasuki gelar master di Universitas New Jersey. Sejak 2010, ia mengerjakan algoritma image recognition dan machine learning, pada 2017 ia pertama kali menjadi grandmaster di Kaggle, dan sejak 2019 ia bekerja sebagai Data Scientist di H2O.ai (Cisco, Intel, dan PayPal menggunakan algoritme perusahaan ini).
Ilmuwan data terbaik dari Rusia menurut Kaggle
Untuk menyusun daftar ilmuwan data praktik terbaik di Rusia, kami menggunakan data peserta kompetisi Kaggle, yang memiliki informasi pribadi.
Pengembang Rusia paling kuat yang berpartisipasi dalam kompetisi Kaggle Dmitry Gordeev ( dott ) juga bekerja di H2O.ai. Dia mendaftar dengan Kaggle delapan tahun lalu dan memiliki 114.000 poin hari ini.
Di peringkat Kaggle secara keseluruhan, dia berada di peringkat kesembilan... Dmitry lulus dari Universitas Negeri Moskow pada 2010, melakukan pengenalan gambar dan penggalian data di sana. Bekerja di grup pemodelan risiko ritel di bank sejak 2008, ia telah berkembang menjadi direktur divisi dan pindah ke Austria pada 2013. Pada 2014, ia mengambil kursus sains data di Coursera, dan pada 2020 ia bergabung dengan tim di H2O.ai.
Di tempat kedua di antara Ilmuwan Data Rusia dalam kompetisi peringkat Kaggle - Arthur Kuzin ( n01z3 ) - ia menempati posisi ke-28 dalam peringkat keseluruhan Kaggle, memiliki lebih dari 71 ribu poin.
Arthur lulus dari Institut Fisika dan Teknologi Moskow pada 2011 dan bekerja di analitik penelitian dari 2008 hingga 2016. Setelah itu, dia mendapat pekerjaan di Avito sebagai Data Scientist, dan selama beberapa tahun terakhir memimpin tim Computer Vision di X5 Retail Group. Arthur memiliki beberapa publikasi fisika dan paten untuk perangkat untuk mengkalibrasi mikroskop elektron transmisi.
Tempat ketiga dalam peringkat keseluruhan kompetisi Kaggle di antara orang Rusia diraih oleh Artem Kulakov ( Seni) - di peringkat keseluruhan dia berada di peringkat 29 dan 71 ribu poin Kaggle, yang diperolehnya dalam dua tahun partisipasi dalam kompetisi. Artem belajar di HSE dengan gelar di bidang Ilmu Komputer dan telah bekerja sebagai Analis Data di Tinkoff Bank dan Megafon. Artem saat ini bekerja lepas dan berspesialisasi dalam tugas Computer Vision dan NLP.
Di tempat keempat ada Roman Soloviev ( ZFTurbo ) - ia memiliki 69 ribu poin dan 31 dalam peringkat keseluruhan kompetisi Kaggle. Roman adalah peneliti terkemuka di Institute for Design Problems in Microelectronics of Russian Academy of Sciences.
Di tempat kelima ada Ilya Larchenko ( ilialar), saat ini berada di peringkat ke-37 dalam peringkat Kaggle keseluruhan dengan 65 ribu poin. Ilya lulus dari Institut Fisika dan Teknologi Moskow pada 2014, lalu bekerja sebagai analis dan pengembang. Sejak 2017, dia memimpin tim ilmuwan data di DOC +, dan pada 2020 dia pindah ke Thailand, di mana dia bekerja sebagai Manajer Ilmu Data di Agoda.
Sebuah elemen kecil dari permainan yang memungkinkan pengguna untuk mendapatkan poin dan medali di kompetisi Kaggle telah mengubah permainan perekrutan.
Contoh ilmuwan data terbaik dari Rusia menunjukkan bahwa pendidikan dan pengalaman bekerja dengan data tidak begitu penting untuk membangun karier yang sukses. Misalnya, Artem Kulakov masih belajar di universitas, dan mulai mengikuti kompetisi di Kaggle dua tahun lalu. Sekarang dia masuk dalam daftar ilmuwan data terbaik di Rusia dan bekerja sebagai pekerja lepas. Guangshuo Xu lulus dengan gelar sarjana di bidang Teknik Listrik dan Elektronik dan sekarang bekerja di H2O.ai, pemimpin dalam solusi sains data sumber terbuka.
Mulailah dengan tugas-tugas sederhana hari ini - dan siapa tahu, mungkin dalam satu atau dua tahun Anda akan berada di peringkat ilmuwan data terbaik dan bergerak maju, menerapkan teknologi penelitian HIV , model untuk memprediksi kemacetan jalan raya dan banyak lagi. Yang utama adalah memiliki keinginan untuk berkembang di bidang Ilmu Data dan berlatih semaksimal mungkin.

Lebih banyak kursus
Artikel yang direkomendasikan
- Berapa Banyak Data Scientist Hasilkan: Gambaran Umum Gaji dan Pekerjaan di 2020
- Berapa Banyak Penghasilan Data Analyst: Gambaran Umum Gaji dan Pekerjaan di 2020
- Bagaimana Menjadi Ilmuwan Data Tanpa Kursus Online
- 450 kursus gratis dari Ivy League
- Cara mempelajari Machine Learning 5 hari seminggu selama 9 bulan berturut-turut
- Pembelajaran Mesin dan Visi Komputer di Industri Pertambangan