Beberapa tahun yang lalu, saya sempat tertarik dengan pembelajaran mesin dan analisis data, bahkan menulis seri pendek tentang pencelupan saya di dunia yang menakjubkan ini, dari sudut pandang seorang pemula yang lengkap.
Seperti yang sering terjadi saat mempelajari sesuatu yang baru, saya sangat ingin membuat "sepeda" sendiri. Sayangnya, saya tidak tahu banyak tentang matematika dan pemrograman, jadi kumpulan data saya sendiri menjadi kandidat untuk peran "sepeda".
Lebih dari dua tahun telah berlalu sejak saat itu dan sekarang saya telah berkeliling untuk berbagi pengalaman kecil saya dengan Anda.
Dalam artikel ini, kami akan mempertimbangkan beberapa sumber potensial untuk mengumpulkan data sendiri (termasuk yang tidak terlalu populer), dan juga mencoba menemukan setidaknya beberapa manfaat dalam proses ini.

Daftar Isi:
Bagian I: Pendahuluan
Bagian II: Sumber Data
Bagian III: Apakah Bermanfaat?
Bagian IV: Kesimpulan
Bagian I: Pendahuluan
Dari bagian pengantar, Anda mungkin sudah menebak bahwa saya bukan ahli analisis data dan pembelajaran mesin. Saya hampir tidak bisa disebut pionir di bidang pencarian sumber data terbuka. Oleh karena itu, artikel ini bukan tentang praktik yang baik, tetapi tentang memuaskan "rasa gatal di tangan Anda" jika Anda memiliki ide untuk membuat kumpulan data Anda sendiri.
Saya meminta Anda untuk tidak menganggap artikel saya terlalu serius.
, « » , « » .
II:
.
. .
Kaggle. Kaggle .
, - , .
.
« » 2010- , - 2015 .
.
, , :

.
. , API .
, .
( ), .
, « » , :
,
. . .
. , .
. , . 2016 2020 GitHub.
, -, .
III: ?
. , .
, :
- Python ( ) . , - .
- , .
- . , . , , .
- , . , , «», . , , , .
- , - .
IV:
, «», , .
, , : « », .
.
- , .
