
Untuk pencarian spesialis TI, skema seperti itu belum dapat diterapkan secara khusus, karena area ini khusus, dan di sini perekrut menggunakan alat lain. Sedangkan selebihnya, ini cukup topikal, terutama bila ada lebih dari seratus responden yang mengisi lowongan.
Alexander Barabash memberi tahu kami tentang cara kerja layanan dan apa logika petugas personel. Secara formal, dia adalah direktur GoRecruit, tetapi pada saat yang sama dia terkait langsung dengan pengembangan.
REM AI-. Awtor (https://habr.com/ru/company/leader-id/blog/521378/), iPavlov (https://habr.com/ru/company/leader-id/blog/522624/) OpenTalks.AI (https://habr.com/ru/company/leader-id/blog/523448/).
- Apa itu GoRecruit, bagaimana cara kerjanya?
- Ini adalah sistem untuk mendukung keputusan personel berdasarkan analisis data dari resume dan sumber terbuka, termasuk jejaring sosial. Ini menghitung peringkat pelamar yang melamar profesi tertentu, mengurangi biaya tenaga kerja perekrut.
Perbedaan mendasar dari analog adalah bahwa untuk berpartisipasi dalam penilaian, pelamar harus menanggapi lowongan dan secara mandiri mengunggah resume-nya ke sana atau masuk melalui profil di jejaring sosial. Menurut saya, ini logika yang sangat penting. Beberapa layanan menawarkan alat pencarian dingin untuk pencari kerja: mereka mengambil data terbuka dari profil orang yang tidak menaruh curiga, yang terkadang bertentangan dengan kebijakan media sosial. Itu tidak benar. Kami mengambil data hanya setelah otorisasi (yaitu izin pengguna), melengkapinya dengan data dari resume dan sumber terbuka seperti Federal Bailiff Service, pangkalan Kementerian Dalam Negeri dan Kantor Pajak. Tugas akhir dari sistem ini adalah untuk memperkaya data tentang pelamar dengan membuat laporan terperinci untuk departemen personalia dan personel keamanan.
Di antara informasi lainnya, laporan ini berisi peringkat yang menggambarkan keberhasilan yang diharapkan dari kandidat tertentu dalam lowongan yang dipilih. Perekrut memutuskan apa yang harus dilakukan selanjutnya dengan peringkat ini.

- Bagaimana Anda menjelaskan lowongan untuk perbandingan? Dan di mana kecerdasan buatan?
- Faktanya, kecerdasan buatan, yang begitu sering dibicarakan sekarang, adalah metode ekstrapolasi data statistik. Tetapi untuk mengekstrapolasi sesuatu, Anda perlu memiliki informasi awal yang cukup. Untuk bisnis besar, di mana ada data statistik tentang pergerakan personel, kami membangun model lowongan berdasarkan data ini menggunakan jaringan saraf.
Faktanya, kami menganalisis informasi tentang karyawan perusahaan yang sukses dalam posisi tertentu.Hasilnya, peringkat kandidat dalam laporan akan dihitung berdasarkan pengalaman di perusahaan tersebut (berdasarkan perbandingan dengan orang lain yang pernah bekerja di posisi serupa di perusahaan ini).
Untuk usaha kecil dan menengah, di mana data statistik tidak cukup untuk membangun model, kami menggunakan sistem pakar. Model matematis sistem ini didasarkan pada pendapat ahli dari spesialis, yang menggantikan jalannya pemikiran manusia dalam pengambilan keputusan. Pendekatan ini dibenarkan jika bisnis tidak memiliki statistiknya sendiri. Seiring waktu, kami mengembangkan model ini - lakukan penyesuaian sesuai kebutuhan.
- Jika kita berbicara tentang model jaringan saraf, bagaimana "kesuksesan" seseorang dinilai dalam posisi ini atau itu?
- Dan ini adalah salah satu seluk-beluk pekerjaan kami. Kriteria ini berbeda dari perusahaan ke perusahaan. Pilihan paling sederhana adalah status pekerjaan setelah jangka waktu tertentu. Misalnya, jika seseorang masih bekerja di posisi ini setahun setelah bekerja, dia dapat dikatakan berhasil, karena tujuan akhirnya adalah menemukan orang yang tidak bermasalah yang akan bekerja lama di perusahaan.
Perusahaan yang lebih maju memiliki KPI SDM internal. Kami menganggapnya sebagai dasar - kami menganggap orang-orang sukses dengan indikator, misalnya, di atas 70%. Kami memilih data yang tepat tentang pergerakan personel dan melatih model matematika untuk setiap profesi secara terpisah.
- Apa batasan penerapan pendekatan ini?
- Tidak ada batasan keras. Tetapi ini adalah metode statistik. Jelas bahwa semakin banyak data (semakin kaya sampel), semakin akurat ramalannya, yaitu. kami akan mengatakan lebih tepatnya seberapa sukses kandidat itu nantinya. Oleh karena itu, solusinya bekerja paling baik untuk beberapa profesi massal. Kami belum siap memberikan rekomendasi untuk posisi tinggi atau unik.
- Di mana sistem mengambil proses pencarian orang?
- Kami tidak terlibat dalam pencarian. Kami menempati ceruk yang berbeda - kami memberikan penilaian ketika kami telah menerima banyak tanggapan untuk suatu lowongan dan perlu memutuskan siapa yang akan dihubungi untuk wawancara.
: . 600 . 5 , 50 , , , , .Dan sistem kami memberikan jawaban dalam 5 detik: itu menghitung peringkat dan peringkat 600 resume oleh itu. Anda dapat segera melanjutkan ke tahap berikutnya - mengundang untuk wawancara atau mengirim tugas tes, tergantung pada bagaimana keputusan personel dibuat di dalam perusahaan.
Faktanya, ini adalah filter awal yang paling memakan waktu dalam rantai tindakan yang terkait dengan pengambilan keputusan personel. Membandingkan tiga orang itu satu hal. Tetapi tidak mungkin untuk mengingat dan membandingkan 600 resume bersyarat - ini di atas kemampuan fisik seseorang. Setelah membaca selusin saja, Anda akan melupakan apa yang terjadi pada awalnya. Psikolog kami suka mengulangi bahwa otak manusia mengingat dan dapat dengan cepat menyimpan di kepala sekitar 7-10 parameter. Oleh karena itu, pertanyaan besarnya adalah seberapa baik perekrut akan mempelajari 600 resume secara manual dalam seminggu.
- Bagaimana tepatnya rating ini dibangun? Data apa yang Anda ambil dari resume Anda?
- Kami menggunakan pendekatan gabungan - kami menggabungkan metode rekayasa ontologis dengan jaringan saraf. Sistem mengekstrak makna semantik dari teks resume, yang kita perlukan untuk penghitungan peringkat selanjutnya. Di mana orang tersebut bekerja sebelumnya, jabatan apa, jabatan apa yang dia pegang, apakah dia istirahat dari pekerjaan, keberhasilan apa yang dia raih dan fungsi apa yang dia lakukan, jenis pendidikan apa yang dia terima, apakah profesinya sesuai dengan profil pendidikan, dll.
Juga, jika itu penting, kami menyoroti usia, jenis kelamin, dan informasi tambahan lainnya - segala sesuatu yang akan dilihat oleh petugas SDM reguler saat membaca resume. Masing-masing item ini adalah parameter. Biasanya perekrut membandingkannya, kami hanya membuat algoritme perbandingan ini.
- Sumber informasi tambahan apa yang Anda gunakan?
- Selain basis Kementerian Dalam Negeri, FSSP, dll. Yang disebutkan di atas, kami sekarang menggunakan jejaring sosial VKontakte. Kami juga memiliki perkembangan untuk Facebook dan Twitter, tetapi VKontakte adalah sumber utamanya. Ketika kami membuat model untuk membuat keputusan personel untuk posisi operator PC untuk pusat multifungsi, kami menemukan bahwa sekitar 97% kandidat memiliki profil di jejaring sosial ini. Ngomong-ngomong, klien pada saat itu meragukan apakah mungkin untuk memperkaya profil dengan data dari VKontakte, tetapi indikator 97% meyakinkannya.
- Apa yang sebenarnya membuat sistem Anda tertarik dengan profil jejaring sosial Anda?
- Pertama-tama, kami mengambil teks yang diterbitkan seseorang di halamannya untuk menentukan profil psikologisnya.

Contoh kata kunci untuk menilai psikotipe dari studi gabungan University of Pennsylvania dan Cambridge
ini adalah semacam data preprocessing. Kami mengevaluasi ciri-ciri kepribadian berdasarkan kata dan frasa yang digunakan dalam postingan (Anda dapat membaca lebih lanjut tentang teknik serupa yang digunakan untuk menganalisis postingan di Facebook di sini (pdf) dan di sini ).
Menggunakan tipologi Myers-Briggs, kami mengaitkan seseorang dengan salah satu dari 16 psikotipe.Informasi ini juga mempengaruhi peringkat akhir: orang dari psikotipe yang sama sekali berbeda cocok untuk profesi yang berbeda.
Selain itu, kami tentu saja tertarik dengan informasi dari profil tersebut. VKontakte memberikan sekitar 70 parameter - apa yang ditulis seseorang tentang dirinya di halaman: usia, jenis kelamin, pendidikan, preferensi, anak-anak, dll.
- Berapa banyak pos yang dapat dievaluasi sistem untuk satu orang? Bagaimana jika hanya foto kucing yang diposting di jejaring sosial?
- Sistem tidak menawarkan keajaiban - sistem berperilaku seperti perekrut biasa.
Katakanlah seorang kandidat melamar pekerjaan tetapi tidak menulis apa pun di resumenya. Kami (seperti perekrut) melihat data terbuka - katakanlah tidak ada juga di sana. Bisa jadi tidak ada profil di jejaring sosial itu sendiri, atau kosong.
. , , .Ini adalah logika umum dalam membuat keputusan personel. Jika Anda tidak melihat informasi tentang kandidat dan tidak dapat memeriksanya dengan sumber terbuka, Anda pergi ke resume berikutnya.
Saat membandingkan dua orang - dengan kekayaan pengalaman yang telah terbukti, pendidikan dan pengetahuan yang baik, atau semacam penyamaran, kemungkinan besar Anda akan memilih orang yang lebih Anda ketahui.
Sistem kami menafsirkan logika manusia di sini. Kekurangan data juga merupakan informasi yang menjadi ciri seseorang dengan cara tertentu, tetapi, biasanya, digunakan dengan peringkat rendah.
- Akibatnya, dari sudut pandang sistem, kandidat ideal adalah orang yang secara terbuka “menyebarkan hidupnya” di jejaring sosial?
- Tidak. Media sosial hanyalah tambahan, dan data dasar diperoleh dari resume.
- Apakah Anda menganalisis teks artikel di Habré atau kode di GitHub untuk lebih memperkaya profil Anda?
- Tidak. Ini terutama sumber daya untuk orang-orang TI, dan kami tidak memiliki fokus seperti itu. Di segmen ini, ada alat lain yang disesuaikan untuk pencarian dan penilaian spesialis TI.
- Apakah ada faktor yang, dari sudut pandang sistem, secara jelas dikreditkan ke kandidat sebagai plus atau minus?
- Inilah fitur unik GoRecruit: tidak ada faktor seperti itu. Semua data yang dikumpulkan mempengaruhi keputusan akhir. Namun untuk setiap profesi, di setiap perusahaan tingkat pengaruh dari masing-masing faktor tersebut akan berbeda-beda.
Arti dari model matematis terletak pada kenyataan bahwa parameter ini berubah tergantung pada bagaimana pelatihan berlangsung - data apa yang digunakan untuk ini.
- Selama mengerjakan model, ratusan resume pasti telah berlalu di depan mata Anda. Dapatkah Anda mengidentifikasi ciri khas dari generasi?
- Mungkin tidak, kecuali satu. Semakin tua seseorang, semakin kaya latar belakangnya. Biasanya, seiring bertambahnya usia, jalur kariernya mulai dilacak dan secara umum ada lebih banyak informasi tentang dirinya.
Tetapi saya dapat mencatat fitur lain: resume sebagai format jauh lebih beragam daripada yang terlihat pada pandangan pertama. Meskipun terdapat templat seperti HeadHunter, orang menulis hal yang sangat berbeda pada resume dan dalam susunan kata yang sangat berbeda. Dan di sini kita mengalami masalah dalam mengidentifikasi makna semantik, karena semua algoritme sebagian bergantung pada struktur resume. Ini adalah tugas yang menantang dan menantang.
- Anda telah mengajukan permohonan akselerator Archipelago 20.35... Apa yang ingin Anda dapatkan darinya?
- Saya pikir ini adalah kesempatan yang menarik untuk pengembangan produk kami secara keseluruhan ke segala arah. Berdasarkan apa yang saya baca tentang Archipelago, acara ini menawarkan peluang multi arah, jadi kami tidak menganggap acara tersebut sebagai sesuatu yang sepihak - mencari investor atau hal lain. Di sini kami menunggu solusi dari masalah pengembangan kami, kontak baru, promosi produk dan bahkan akan mencari klien. Bersama.
- Siapa di timmu? Perekrut, pengembang, ahli matematika?
- Kami memiliki tim matematikawan, programmer dan psikolog - orang-orang di persimpangan ilmu teknis dan kemanusiaan (psikologi dan matematika), ahli di bidang Big data, kecerdasan buatan (pembelajaran mesin).