👨🏾‍🚀 👩🏼‍⚖️ 👨‍💼 Apa yang harus dibaca untuk seorang ilmuwan data pada tahun 2020 💣 🔢 🤚🏻

Dalam posting ini, kami berbagi dengan Anda pilihan wawasan tentang Ilmu Data dari salah satu pendiri dan CTO DAGsHub, komunitas dan platform web untuk kontrol revisi data dan kolaborasi antara ilmuwan data dan insinyur pembelajaran mesin. Pilihannya mencakup berbagai sumber, mulai dari akun Twitter hingga blog teknik lengkap yang ditargetkan untuk mereka yang tahu persis apa yang mereka cari. Detail di bawah potongan.

Dari Penulis:

Anda adalah apa yang Anda makan, dan sebagai pekerja pengetahuan Anda membutuhkan pola makan informasional yang baik. Saya ingin berbagi sumber informasi tentang Ilmu Data, Kecerdasan Buatan, dan teknologi terkait yang menurut saya paling berguna atau menarik. Saya harap ini juga membantu Anda!

Makalah dua menit

Saluran YouTube yang bagus untuk mengikuti berita terbaru. Saluran ini sering diperbarui, dan pembawa acara memiliki antusiasme yang tinggi dan sikap positif dalam semua topik yang dibahas. Berharap untuk mencakup pekerjaan yang menarik tidak hanya pada AI, tetapi juga pada grafik komputer dan topik yang menarik secara visual lainnya.

Yannick Kilcher

Di saluran YouTube-nya, Yannick secara teknis menjelaskan penelitian yang bermakna dalam pembelajaran mendalam dalam detail teknis. Alih-alih membaca sendiri studi ini, sering kali lebih cepat dan mudah untuk menonton salah satu videonya untuk mendapatkan pemahaman yang lebih dalam tentang artikel penting. Penjelasan-penjelasan tersebut menyampaikan inti sari dari artikel-artikel tersebut, tanpa mengabaikan matematika dan tanpa tersesat dalam tiga pinus. Yannick juga berbagi pandangannya tentang bagaimana studi dibandingkan satu sama lain, seberapa serius hasil yang harus diambil, interpretasi yang lebih luas, dll. Lebih sulit bagi pemula (atau praktisi non-akademis) untuk sampai pada penemuan ini sendiri.

Distill.pub

Dengan kata-kata mereka sendiri:

Riset machine learning harus jelas, dinamis, dan bersemangat. Dan Distill diciptakan untuk membantu penelitian.

Distill adalah publikasi unik dengan penelitian pembelajaran mesin. Artikel dipromosikan dengan visualisasi yang menakjubkan untuk memberi pembaca pemahaman topik yang lebih intuitif. Pemikiran spasial dan imajinasi cenderung bekerja sangat baik dalam membantu memahami topik Pembelajaran Mesin dan Ilmu Data. Sebaliknya, format publikasi tradisional cenderung kaku dalam strukturnya, statis dan kering, dan terkadang “matematis” . Chris Olah, salah satu pencipta Distill, juga mengelola blog pribadi yang luar biasa di GitHub . Ini belum diperbarui untuk waktu yang lama, tetapi tetap merupakan kumpulan penjelasan terbaik yang pernah ditulis tentang topik pembelajaran mendalam. Secara khusus, deskripsi LSTM sangat membantu saya !

sumber

Sebastian Ruder

Sebastian Ruder menulis blog dan buletin yang sangat informatif, terutama tentang persimpangan jaringan saraf dan analisis teks bahasa alami. Dia juga memberikan banyak nasihat kepada peneliti dan presenter di konferensi ilmiah, yang bisa sangat membantu jika Anda berada di akademisi. Artikel-artikel Sebastian biasanya berupa ulasan, ringkasan, dan penjelasan tentang keadaan penelitian dan metode modern di suatu wilayah tertentu. Ini berarti artikel tersebut sangat berguna bagi praktisi yang ingin mengetahui posisi mereka dengan cepat. Sebastian juga tweet .

Andrey Karpati

Andrey Karpati tidak perlu diperkenalkan. Selain menjadi salah satu peneliti pembelajaran mendalam yang paling terkenal di Bumi, ia menciptakan alat yang banyak digunakan seperti arxiv sanity preserver sebagai proyek sampingan. Banyak orang telah memasuki bidang ini melalui kursus Stanford di cs231n , dan Anda akan merasa terbantu jika mengetahui resepnya untuk mempelajari jaringan saraf. Saya juga merekomendasikan untuk menonton ceramahnya tentang tantangan dunia nyata yang harus diatasi Tesla ketika mencoba menerapkan pembelajaran mesin dalam skala besar di dunia nyata. Pidato itu informatif, mengesankan, dan menenangkan. Selain artikel tentang ML secara langsung, Andrey Karpati memberikan tips hidup yang baik untukilmuwan ambisius . Baca Andrew di Twitter dan Github .

Teknik Uber

Blog teknik Uber sangat mengesankan dengan skala dan luasnya, yang mencakup banyak topik, termasuk kecerdasan buatan . Yang paling saya sukai dari budaya teknik Uber adalah kecenderungan mereka untuk menghasilkan beberapa proyek yang sangat menarik dan berharga dengan sumber terbuka dengan kecepatan sangat tinggi. Berikut beberapa contohnya:

Ludwig
h3
bereaksi-vis
aresdb
Dan daftarnya terus bertambah ... Angkat topi, Uber

Blog OpenAI

Terlepas dari ketidaksepakatan, blog OpenAI tidak diragukan lagi indah. Dari waktu ke waktu, blog memposting konten dan ide tentang pembelajaran mendalam yang hanya dapat muncul pada skala OpenAI: fenomena penurunan ganda hipotetis . Tim OpenAI cenderung jarang memposting, tetapi itu penting.

sumber

Taboola Blog

Blog Taboola tidak setenar beberapa sumber lain di postingan ini, tetapi menurut saya unik - penulis menulis tentang tantangan dunia nyata yang sangat biasa ketika mencoba menerapkan ML di bidang manufaktur untuk bisnis "normal": mobil tanpa pengemudi dan agen RL menang juara dunia, lebih lanjut tentang "bagaimana saya tahu model saya sekarang memprediksi sesuatu dengan keyakinan palsu?" Masalah-masalah ini relevan dengan hampir semua orang yang bekerja di lapangan, dan mereka menerima liputan pers yang lebih sedikit daripada topik AI yang lebih umum, tetapi masih dibutuhkan bakat kelas dunia untuk mengatasi masalah ini dengan benar. Untungnya, Taboola memiliki bakat ini dan kemauan serta kemampuan untuk menulis tentangnya sehingga orang lain dapat belajar juga.

Bersama dengan Twitter, tidak ada yang lebih baik di Reddit selain terpikat pada penelitian, alat, atau kebijaksanaan orang banyak.

Status AI

Posting hanya diterbitkan setiap tahun, tetapi diisi dengan informasi yang sangat padat. Dibandingkan dengan sumber lain di daftar ini, yang satu ini lebih mudah diakses oleh pebisnis non-teknologi. Yang saya sukai dari laporan ini adalah bahwa laporan ini mencoba memberikan pandangan yang lebih holistik tentang ke mana arah industri dan penelitian, menghubungkan kemajuan dalam perangkat keras, penelitian, bisnis, dan bahkan geopolitik dari sudut pandang luas. Pastikan untuk memulai dari akhir untuk membaca tentang konflik kepentingan.

Podcast

Sejujurnya, saya pikir podcast tidak cocok untuk belajar tentang topik teknis. Bagaimanapun, mereka hanya menggunakan suara untuk menjelaskan topik, dan ilmu data adalah bidang yang sangat visual. Podcast cenderung memberi Anda alasan untuk melakukan penelitian lebih dalam nanti atau untuk terlibat dalam diskusi filosofis. Namun, berikut beberapa pedoman:

podcast oleh Lex Friedman saat dia berbicara dengan peneliti terkemuka di bidang kecerdasan buatan. Episode dengan Francois Schollet sangat bagus!
Podcast Rekayasa Data . Senang mendengar tentang alat infrastruktur data baru.

Daftar yang mengagumkan

Ada lebih sedikit yang harus diperhatikan, tetapi lebih banyak sumber daya untuk membantu ketika Anda tahu apa yang Anda cari:

Indonesia

, , — Twitter. .
— . -. , , . , , .
fast.ai, .
ML Github, .
François

Chollet, pencipta Keras, sekarang mencoba memperbarui pemahaman kita tentang apa itu kecerdasan dan bagaimana mengujinya.
Ilmuwan Riset Hardmaru di Google Brain.

Kesimpulan

Posting asli dapat diperbarui karena penulis menemukan sumber konten yang bagus yang akan memalukan jika tidak dicantumkan. Jangan ragu untuk mengikutinya di Twitter jika Anda ingin merekomendasikan sumber baru! DAGsHub juga mempekerjakan Pengacara [kira-kira. terjemahan. praktisi publik] di Ilmu Data, jadi jika Anda membuat konten Anda sendiri di Ilmu Data, silakan tulis ke penulis postingan.

Kembangkan diri Anda dengan membaca sumber yang direkomendasikan, dan menggunakan kode promo HABR , Anda bisa mendapatkan tambahan diskon 10% yang tertera di spanduk.

Lebih banyak kursus

Apa yang harus dibaca untuk seorang ilmuwan data pada tahun 2020