Pada artikel ini, saya menyajikan kursus dan buku yang menurut saya paling optimal untuk mempelajari pembelajaran mesin / ilmu data dari awal. Saya mencoba memberikan daftar yang sesingkat mungkin dan pada saat yang sama memberikan semua pengetahuan yang diperlukan untuk memulai praktik, tanpa kesenjangan pengetahuan yang serius.
Penolakan
Anda dapat memahami apa yang menjadi dasar rekomendasi ini dengan membaca artikel sebelumnya, yang menjelaskan jalan dan prinsip belajar mandiri saya, serta pertimbangan umum tentang cara membangun tahapan pembelajaran:
Artikel sebelumnya
Panduan dalam artikel ini akan menjadi usang, dan yang pasti, sekarang ada kursus dan buku bagus yang dapat dimasukkan di dalamnya. Tapi ini setidaknya beberapa materi terbaik tentang topik mereka. Untuk mempersiapkan daftar ini, puluhan kursus dan buku dibuang, yang juga bertujuan untuk belajar dari awal, tetapi lebih buruk dalam menyajikan konsep-konsep fundamental.
Pedoman tersebut tidak mencakup semua keterampilan teknis yang mungkin diperlukan. Untuk mendapatkan gambaran tentang segala hal yang mungkin perlu dikuasai - lihat Mempelajari ilmu data dari awal: pencapaian dan pencapaian.
Saya tidak mengutip materi tentang jaringan saraf karena, dalam banyak kasus, saya menganggap tidak efektif untuk mulai belajar dengan mereka, atau mempelajarinya pada tahap awal belajar mandiri.
Keterampilan dasar yang dibutuhkan
Pengetahuan tentang dasar-dasar pemrograman: Python dan SQL
Tidak mungkin untuk melakukan pembelajaran mesin atau ilmu data tanpa kemampuan dalam pemrograman dengan Python atau R (Lebih baik mulai dengan Python). Selain itu, sebagian besar lowongan dalam pembelajaran mesin "klasik" (memecahkan masalah bisnis, dan bekerja dengan data numerik / statistik awalnya) akan membutuhkan pengetahuan SQL. Untuk pedoman dasar tentang cara mempelajarinya, lihat Pembelajaran Mandiri dalam Ilmu Data, Dari Nol hingga Senior dalam Dua Tahun .
Matematika
. , , , .
, - : ( ), (, , , ), , .
: . , 2 3 . 2 3 , . Math for machine learning, London Imperial College.
( , ), , : Robert Ghrist. . coursera.org, stepik.org
,
Datasmart ( ) - . , data science. , , . , python, pandas, scikit-learn - ( , .. ).
. . ( , .. , , ). - (). , .
โ 8 , 2 โ seaborn ( , ).
Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking, by Foster Provost ( ) - , , . Datasmart, . " " () . , ..
, - , / - . .
, , , . . , .. , , . . , .
" " - , . -, . , . Python, Pandas, scikit-learn.
- , Python. Applied DS with Python ( 1 3. 2, 4 )
, ( jupyter, pandas). , , . , - .
https://stepik.org/course/4852/syllabus
ยซ ยป ( " " ). 3 , , 1 , . , ; . 4 , , , , .. , .
Kaggle : ( ) , , , ( .. ). - , , , .
scikit-learn - . , .. .
pandas, - , . , . , .
Python python standard library - . , . , collections itertools
-
( ). . , , : https://www.coursera.org/learn/competitive-data-science. kaggle - .
,
- . - -.
, - , Goodhart's law. .
/
, , https://towardsdatascience.com; 3 .
Statistics Done Wrong .The woefully complete guide by Alex Reinhart - . .
Python Machine Learning, by Sebastian Raschka - , . .
, - .
Git - . - Ry's Git tutorial. git. : http://ndpsoftware.com/git-cheatsheet.html
https://www.practicaldatascience.org/ - . , , , ( Cloud , .. , ).
?
. , , - , - /, , , , - , . - .
/
, , , .
, - self.development.mentor gmail.com,
Beberapa menyadari bahwa lebih baik mereka pergi ke area lain (pemrograman, kencan besar), beberapa dapat menyesuaikan kurikulum / rencana karir untuk kebutuhan individu, beberapa saya menyarankan mereka yang dapat membantu mereka dengan lebih baik, dan menyelamatkan seseorang (? ) Dari menghabiskan waktu yang tidak efektif untuk proyek-proyek buntu.
Dan jika artikel saya bermanfaat untuk Anda, Anda juga dapat memotivasi saya secara finansial untuk artikel selanjutnya, di bawah artikel ini harus ada tombol "donasi" untuk keperluan ini.