Ilmu Data, Kecerdasan Buatan, Pembelajaran Mesin: Cara Otodidak

Tidak semua orang dapat memiliki waktu dan uang untuk mendapatkan pendidikan penuh waktu di bidang Ilmu Data (DS, ilmu data), AI (Kecerdasan Buatan, Kecerdasan Buatan), ML (Pembelajaran Mesin, Pembelajaran Mesin). Kurangnya waktu dan uang adalah hambatan yang serius. Anda dapat mengatasi kendala tersebut dengan belajar mandiri. Tetapi bahkan di sini pun tidak sesederhana itu. Berhasil belajar sendiri membutuhkan disiplin, fokus, dan pilihan mata pelajaran yang tepat. Belajar mandiri di bidang yang dipilih, dengan pendekatan yang tepat, dapat dengan bebas dipadukan dengan kehidupan biasa atau dengan belajar di lembaga pendidikan. Namun di beberapa bidang pengetahuan, seperti DS, AI, ML, sangat sulit untuk mulai belajar sendiri. Namun, percayalah pada kata-kata saya, kesulitan sepadan dengan apa yang Anda dapatkan sebagai hasilnya.Kunci sukses dalam belajar mandiri terletak pada belajar dengan kecepatan Anda sendiri.







Dalam materi ini, saya ingin berbicara tentang bagaimana Anda dapat bertindak untuk seseorang yang ingin memperoleh pengetahuan secara mandiri di bidang DS, AI, dan ML. Menerapkan metode pengajaran yang disarankan di sini dapat membawa kemajuan yang baik dalam mempelajari hal-hal baru. Di sini, sebagai tambahan, saya akan membagikan tautan ke sumber daya yang saya gunakan, dan yang tanpa keraguan saya siap rekomendasikan kepada orang lain.



Pelajari beberapa disiplin matematika



Matematika, bahkan jika seseorang tidak menyukainya, sangat penting dalam bidang yang kita minati. Saya pikir aman untuk mengatakan bahwa mereka yang membaca ini sudah memiliki sebagian pengetahuan matematika yang mereka peroleh di sekolah. Ini adalah dasar yang baik, tetapi ini tidak cukup untuk seseorang yang ingin berkembang di bidang DS, AI, dan ML. Yaitu, di sini Anda perlu mempelajari matematika sedikit lebih dalam daripada yang dilakukan di sekolah, Anda harus mempelajari beberapa hal dari statistik, aljabar, dan disiplin matematika lainnya. Saya akan mengumpulkan daftar sumber daya matematika yang berguna untuk DS, tetapi ini telah dilakukan untuk saya di artikel ini . Dan mereka melakukannya dengan sangat baik.



Belajar memprogram



Jika Anda baru memulai belajar mandiri, jangan langsung mempelajari cara menulis kode untuk tujuan pembelajaran mesin. Sebaliknya, ada baiknya mempelajari konsep pemrograman dasar yang tidak terikat pada domain apa pun. Pelajari apa itu pemrograman, biasakan diri Anda dengan berbagai jenis kode yang ada, pahami cara menulis program dengan benar. Ini sangat penting karena saat Anda menguasai pemrograman, Anda akan mempelajari banyak ide dasar yang akan membantu Anda dengan baik sepanjang karier DS Anda.



Jangan terburu-buru, jangan berusaha keras untuk segera mempelajari sesuatu yang sulit. Seberapa baik Anda memahami dasar-dasarnya akan berdampak pada seluruh karier profesional masa depan Anda. SiniAnda dapat menemukan video tutorial yang sangat bagus yang memperkenalkan Anda pada pemrograman dan ilmu komputer. Yaitu, mereka mengetahui hal terpenting yang perlu Anda pahami. Luangkan waktu untuk pertanyaan ini dan cobalah untuk memahami semua yang Anda pelajari.



Pilih satu bahasa pemrograman dan lakukan dengan benar



Ada banyak bahasa pemrograman yang digunakan oleh orang-orang di bidang DS, AI, dan ML. Paling umum digunakan di sini adalah Python, R, Java, Julia dan SQL. Bahasa lain dapat digunakan di area ini, tetapi yang telah saya daftarkan digunakan lebih sering daripada yang lain karena suatu alasan:



  • Mereka mudah dipelajari. Jika Anda mengalokasikan cukup waktu untuk mempelajarinya dan menunjukkan ketekunan serta keteguhan dalam belajar, maka Anda dapat mencapai kesuksesan tertentu dengan cukup cepat.
  • , , .
  • , .
  • , , , DS, AI ML.
  • β€” .


Tidak ada salahnya mempelajari berbagai bahasa pemrograman. Dan, pada kenyataannya, berguna untuk mengetahui lebih dari satu bahasa. Tetapi ketika belajar program, Anda tidak perlu terburu-buru. Anda perlu mencoba belajar, dalam jangka waktu tertentu, hanya satu bahasa, jika tidak, Anda bisa menjadi sangat bingung. Oleh karena itu, yang terbaik adalah mempelajari bahasa satu per satu, memberi perhatian khusus pada mekanisme mereka yang akan berguna bagi Anda dalam pekerjaan Anda. Saya sarankan memilih Python sebagai bahasa pertama Anda. Ini adalah bahasa yang cukup sederhana yang bahkan dapat dimengerti oleh seorang pemula. Selain itu, saya akan merekomendasikan agar Anda terlebih dahulu mempelajari pemrograman umum dengan Python, dan kemudian mempelajari alat Python khusus untuk analisis data.



Belajar mengumpulkan data



Lebih sering daripada tidak, tidak ada yang akan memberi Anda data yang dirancang khusus untuk Anda, dan terkadang Anda mungkin tidak memiliki data sama sekali. Tetapi bagaimanapun juga, Anda perlu menemukan cara untuk mengumpulkan data yang akan Anda gunakan. Organisasi tempat Anda bekerja mungkin memiliki sistem pengumpulan data yang baik. Jika demikian, ini merupakan nilai tambah yang besar bagi Anda. Jika organisasi Anda tidak memiliki sistem seperti itu, maka Anda harus mencari cara untuk mengumpulkan data. Tetapi kami tidak berbicara tentang data apa pun, tetapi tentang informasi berkualitas tinggi yang dengannya Anda dapat bekerja secara produktif, untuk mencapai tujuan Anda. Pengumpulan data tidak secara langsung terkait dengan "penggalian data", dengan analisis yang mendalam. Pengumpulan data adalah langkah kerja yang mendahului analisis.



Data terbuka yang dapat digunakan secara gratis dapat ditemukan di banyak tempat di Internet. Terkadang, data yang Anda butuhkan dapat dikumpulkan dari situs web menggunakan teknik web scraping. Scraping web adalah keterampilan data scientist yang sangat penting, jadi saya sangat meminta semua orang yang akan bekerja di bidang DS, AI, dan ML untuk menguasai keterampilan ini. Berikut panduan bagus untuk web scraping.



Data juga dapat disimpan dalam database, sehingga pengetahuan dasar tentang administrasi database dan keterampilan dalam berinteraksi dengan database akan sangat berguna bagi Anda. Secara khusus, pengetahuan tentang SQL sangat penting di sini. Pelajari SQL di sini .



Belajar mengolah data



Apa yang akan saya bicarakan di sini sering disebut sebagai Data Wrangling. Proses ini termasuk membersihkan data yang ada. Ini menggunakan analisis eksplorasi data dan penghapusan semua yang tidak perlu darinya. Proses ini juga mencakup penataan data, membawanya ke bentuk yang dapat Anda kerjakan. Tahap bekerja dengan data ini adalah yang paling sulit dan paling melelahkan. Data yang Anda temukan dalam proses pembelajaran sudah disiapkan untuk dianalisis. Tetapi data yang Anda temui di dunia nyata dapat sepenuhnya mentah. Jika Anda benar-benar ingin menjadi ilmuwan data, Anda perlu menemukan data yang sebenarnya dan mencari cara agar terlihat layak.



Data nyata dapat ditemukan hampir di semua tempat. Misalnya - aktifKaggle . Platform hebat ini memiliki data dari banyak perusahaan di seluruh dunia. Pengolahan data primer adalah kegiatan yang sangat membosankan, tetapi jika dilakukan secara rutin dan terus menerus, lambat laun Anda akan menyadari bahwa itu juga kegiatan yang sangat menarik. Berikut adalah beberapa perkuliahan yang bagus tentang pengolahan data primer.



Belajar untuk memvisualisasikan data



Jika Anda adalah pakar DS, AI, atau ML dan berpengalaman dalam bisnis Anda, jangan lupa bahwa apa yang tampak jelas bagi Anda mungkin sama sekali tidak dapat dipahami orang lain. Jangan berharap mereka, misalnya, dapat menarik kesimpulan dengan melihat kolom angka. Pembelajaran memvisualisasikan data diperlukan agar hasil karya Anda dapat digunakan oleh pakar dari bidang lain. "Visualisasi data" biasanya disebut sebagai proses penyajian data dalam bentuk grafik. Penyajian data seperti itu akan memungkinkan untuk mendapatkan manfaat darinya bahkan bagi mereka yang tidak memiliki pengetahuan khusus di bidang DS, AI dan ML.



Ada banyak cara untuk memvisualisasikan data. Karena kita adalah programmer, metode utama visualisasi data kita harus menulis kode yang sesuai. Ini cepat dan tidak memerlukan pembelian alat khusus. Saat menulis kode untuk visualisasi data, Anda dapat menggunakan banyak pustaka gratis dan sumber terbuka yang dibuat untuk bahasa pemrograman yang kami gunakan. Misalnya, ada pustaka semacam ini untuk Python. Ini adalah Matplotlib, Seaborn dan Bokeh. Berikut adalah video tutorial di Matplotlib.



Cara lain untuk memvisualisasikan data adalah dengan menggunakan alat sumber tertutup. Misalnya - Tableau... Ada banyak dari alat-alat ini di luar sana dan mereka bisa memberi Anda hasil yang cukup bagus, tetapi mereka tidak gratis. Tableau adalah salah satu alat yang paling umum, dan saya sering menggunakannya. Saya akan menyarankan siapa pun yang terlibat dalam analisis dan visualisasi data untuk mempelajari Tableau. Berikut adalah panduan yang bagus untuk alat ini.



Kecerdasan buatan dan pembelajaran mesin



AI dan ML dapat dianggap sebagai subbagian dari DS karena mereka didorong oleh data. AI dan ML adalah teknologi yang didasarkan pada mesin pengajaran untuk berperilaku serupa dengan perilaku manusia. Untuk ini, data yang disiapkan secara khusus digunakan, dikirim ke mesin. Model komputer dapat mengajarkan banyak hal tentang kemampuan manusia. Untuk melakukan ini, mereka dilatih dan dibimbing ke hasil yang diinginkan. Dalam hal ini, "mesin" dapat dianggap sebagai anak kecil yang sama sekali tidak memiliki pengetahuan. Anak-anak ini secara bertahap diajari untuk mengidentifikasi objek, berbicara. Mereka belajar dari kesalahan mereka dan, saat mereka belajar, mulai memecahkan tugas yang diberikan kepada mereka dengan lebih baik. Ini halnya dengan mobil. 



Teknologi AI dan ML adalah yang menghidupkan mesin menggunakan berbagai algoritme matematika. Umat ​​manusia masih belum mengetahui batas kemampuan teknologi yang terus meningkat ini. Saat ini, teknologi AI dan ML banyak digunakan untuk memecahkan masalah kognitif. Ini adalah deteksi dan pengenalan objek, pengenalan wajah dan ucapan, pemrosesan bahasa alami, deteksi spam, dan deteksi penipuan. Daftar ini dapat dilanjutkan untuk waktu yang sangat lama.



Kisah yang lebih mendetail tentang AI dan ML layak dipublikasikan secara terpisah. Sementara itu, saya dapat merekomendasikan video ini mengenai pertanyaan umum tentang penerapan teknologi tersebut. Tapi disini- Jam tutorial video tentang pembelajaran mesin. Dengan mempelajari video-video ini, Anda bisa memperoleh pengetahuan ML yang cocok dengan tingkat pemula atau bahkan menengah. Anda akan mempelajari tentang banyak algoritme pembelajaran mesin yang ada, cara kerjanya, dan cara menggunakannya. Setelah itu, Anda harus memiliki pengetahuan yang cukup untuk mulai membuat model ML sederhana Anda sendiri. Anda dapat membaca tentang cara melakukannya di sini .



Jelajahi Cara Memublikasikan Model ML Secara Online



Ada alat yang memungkinkan Anda untuk memublikasikan model ML di Internet. Ini memungkinkan Anda memberi mereka akses ke semua orang. Untuk mempublikasikan model di Internet, Anda memerlukan pemahaman yang baik tentang proses pengembangan web. Intinya adalah bahwa "menerbitkan model" berarti membuat halaman web (atau sekelompok halaman) yang memungkinkan Anda untuk bekerja dengan model di browser. Selain itu, Anda perlu mempertimbangkan fakta bahwa frontend proyek, antarmukanya, harus bertukar data dengan backend, dengan bagian server proyek, tempat model itu sendiri berada. Untuk membangun proyek seperti ini, Anda harus dapat membuat API sisi server dan menggunakan API ini di aplikasi front-end.



Jika Anda berencana untuk menerbitkan model di cloud, jika Anda akan menggunakan teknologi Docker, Anda memerlukan pengetahuan yang baik tentang bidang komputasi awan dan DevOps.



Faktanya, ada banyak cara untuk menyebarkan model di Internet. Saya akan menyarankan untuk memulai dengan mempelajari bagaimana melakukan ini menggunakan kerangka kerja web Flask berbasis Python. Berikut tutorial yang bagus tentang ini.



Temukan seorang mentor



Belajar mandiri memang bagus, tetapi tidak ada yang lebih baik daripada belajar dari para profesional. Faktanya adalah bahwa dengan pendekatan ini, apa yang digunakan dalam kenyataan berasimilasi, dan inilah cara belajar melalui praktik. Banyak hal yang hanya bisa dipelajari melalui latihan. Coaching memiliki banyak kelebihan, tetapi harus diingat bahwa tidak setiap mentor dapat memberikan pengaruh yang signifikan pada karir atau kehidupan Anda. Inilah mengapa sangat penting menemukan mentor yang baik.



Misalnya, Anda dapat mencoba menyelesaikan masalah ini menggunakan platform Notitia AI .... Di sini, siswa diberi pembimbing pribadi yang memberikan kontribusi pribadi dan profesional untuk pengembangan siswa. Mentor membawa mereka yang ingin belajar dari tingkat pemula hingga ahli di bidang DS, AI, dan ML. Notia AI juga merupakan platform paling terjangkau dari jenisnya.



Hasil



Ingatlah bahwa mempelajari kursus, membaca artikel, dan menonton video tidak akan menjadikan Anda seorang ilmuwan data. Anda harus disertifikasi oleh lembaga khusus. Selain itu, beberapa lowongan membutuhkan kualifikasi pendidikan tertentu. Investasikan waktu untuk belajar mandiri, dapatkan sertifikasi atau dapatkan kredensial pendidikan Anda dan Anda akan siap untuk pekerjaan nyata.



Menurut Anda apa yang perlu diketahui dan dapat bercita-cita menjadi ahli yang berharga di bidang kecerdasan buatan atau pembelajaran mesin?






All Articles