Saya baru saja selesai mengadakan proses perekrutan pertama sejak bergabung dengan Royal Mail sebagai kepala bagian data science, dan telah menerima beberapa kandidat ke dalam tim. Tapi sepanjang pengalaman menggeluti perekrutan data scientist bertahun-tahun, sering kali informasi yang saya cari tidak ada dalam CV yang dikirim kandidat.
Sepertinya banyak data scientist tidak tahu kriteria apa yang dicari oleh para manajer, sehingga tidak mencantumkan informasi tersebut di CV. Manajer perekrutan seperti saya jadi menghadapi dilema, antara harus menolak banyak kandidat (yang mungkin saja sebenarnya sangat berpotensi), atau menambahkan tahap wawancara via telepon untuk mendapat informasi lebih detail.
Dua skenario di atas punya kelebihan dan kekurangan, dan sama-sama tidak ideal. Jadi saya berpikir untuk mencoba menulis langsung hal-hal yang perlu ada dalam CV seorang data scientist ideal. Harapan saya, tulisan ini bisa memunculkan diskusi menarik dan membantu meningkatkan kualitas proses perekrutan, juga meningkatkan kualitas CV di kalangan komunitas data science.
Latar belakang pendidikan
Hal pertama yang saya cari dari CV seorang data scientist adalah pendidikan yang kuat di jurusan matematis. Sekarang ini sebarang orang mengaku sebagai data scientist asal bisa menggunakan machine learning untuk membangun produk.
Menurut saya, data scientist sejati adalah orang yang memahami detail teknis di balik algoritme machine learning, dan paham alasan memilih satu algoritme ketimbang lainnya. Mereka bisa memilih algoritme yang tepat untuk suatu masalah spesifik dan bisa merancang fitur-fitur yang paling sesuai untuk algoritme tersebut.
Karena itu saya perlu kualifikasi eksternal yang tervalidasi, seperti gelar sarjana atau yang setara. Saya ingin hal ini ada di halaman pertama CV (atau setidaknya disebutkan dalam pernyataan personal di awal).
Pengalaman riset independen
Data science adalah kegiatan riset, di mana kita selalu berhadapan dengan masalah yang solusinya tidak kentara dan keberhasilannya tidak terjamin. Bila tidak demikian, namanya bukan data science sungguhan. Saya menerapkan framework Lean Startup milik Eric Ries ke dalam tim data science di Royal Mail untuk memfasilitasi inovasi di tengah banyak ketidakpastian.
Ketika membaca CV, saya ingin ada bukti yang bisa meyakinkan bahwa kandidat tersebut mampu menjalankan riset independen. Bukti paling mudah dilihat adalah gelar PhD atau MSc yang mencakup proyek riset.
Kesalahan terbesar di bagian ini adalah kandidat berkata bahwa ia pernah mendapat MSc atau PhD di suatu subjek (misalnya MSc bidang ilmu komputer, atau PhD dalam statistika) dan hanya menyebutkan nama universitasnya. Padahal yang saya butuhkan adalah detail tentang kegiatan riset itu dan keberhasilannya. Saya lebih berminat pada judul dan rangkuman tesis daripada nama universitas.
Bila hasil riset itu unik dan sukses, saya akan lebih percaya terhadap kemampuan riset si kandidat. Tentu saja caranya bukan dengan melampirkan tesis ke dalam CV. Justru bagaimana ia merangkum aspek-aspek penting riset (konteks, pendekatan, hasil, dan keunikan) ke dalam paragraf singkat bisa menjadi indikator penting akan kemampuan komunikasi tertulis yang ia miliki.
Saya juga mempertimbangkan alternatif yang setara dengan pengalaman riset (misalnya pengalaman kerja sebagai research scientist atau data scientist). Tapi idealnya alternatif ini disebutkan dalam pernyataan personal, sementara contoh proyek risetnya dicantumkan dalam bagian CV yang relevan (misalnya bagian pengalaman kerja).
Kemampuan programming
Hal berikutnya yang saya cari adalah bukti kemampuan programming. Para pelamar sering mengaku menguasai 101 bahasa pemrograman, padahal pada kenyataannya hanya satu atau dua bahasa saja yang mereka gunakan secara rutin. Kriteria kunci yang dicari manajer adalah pengalaman dalam minimal satu bahasa dari masing-masing tipe berikut:
- Bahasa tingkat tinggi untuk rapid prototyping, seperti Python atau R.
- Bahasa tingkat rendah untuk deployment, misalnya Java, C++, C#, dan lain-lain.
- Bahasa scalable/big data seperti Scala atau Spark.
Saya ingin ketiganya ada dalam data scientist senior, dua pertama ada di data scientist pada umumnya, sementara data scientist junior minimal harus menguasai yang pertama (R atau Python).
Kesalahan lain dalam CV adalah mencantumkan daftar bahasa pemrograman tanpa indikasi keahlian atau pengalaman. CV yang paling baik tidak hanya berisi daftar bahasa dan jumlah tahun pengalaman (contohnya: Java [6 tahun]), tapi juga menjelaskan bahasa apa saja yang digunakan dalam setiap proyek data science di bagian pengalaman kerja.
Poin plus untuk kandidat adalah menyebutkan proyek open source yang pernah mereka ikuti, atau memberi tautan ke hasil kerja yang tersedia di ranah publik (misalnya GitHub). Dengan begitu saya bisa melihat sendiri kemampuan coding mereka lewat internet.
Dampak di dunia nyata
Untuk kandidat data scientist di posisi senior, saya akan mempertimbangkan pengalaman data science di dunia nyata. Saya frustrasi bila dalam CV sama sekali tak tercantum dampak nyata yang pernah diberikan oleh kandidat. Manajer jadi bertanya-tanya mengapa perusahaan harus merekrut kandidat tersebut, sebab tidak ada indikator ROI (return on investment).
Jarang sekali kandidat menyebutkan hal terpenting yang saya cari: apa dampak nyata yang pernah mereka hasilkan?
Beberapa kandidat fokus pada siapa atasan mereka, sebagian fokus pada ketepatan/kerumitan model yang mereka buat, sementara sisanya hanya menyebutkan tipe proyek yang mereka kerjakan. Jarang sekali kandidat menyebutkan hal terpenting yang saya cari: apa dampak nyata yang pernah mereka hasilkan? Mengapa saya harus mempekerjakan dan menggaji mereka?
Saya tidak peduli bila mereka berada langsung di bawah CEO, atau bila model machine learning mereka 99,9 persen akurat. Yang benar-benar ingin saya ketahui adalah perbedaan apa yang mereka buat di perusahaan mereka sebelumnya.
Penting untuk diingat bahwa meskipun semua model yang dibuat salah, beberapa model tetap bisa berguna. Modelmu boleh saja hanya punya akurasi enam puluh persen, asalkan dapat meningkatkan salah satu aspek bisnis (contoh: menurunkan churn rate) dan menghasilkan nilai bisnis yang nyata (contoh: meningkatkan penghasilan tahunan sebanyak Rp60 miliar).
Prinsip saya adalah selalu mulai dengan model sesederhana mungkin, serta baru mengoptimalkan atau menambah kompleksitas bila dibutuhkan—prinsip penting dalam lingkungan komersial. Ini persis seperti cara kerja Lean Startup, dan saya terapkan dalam tim data science saya.
Alasan prinsip ini adalah karena pengoptimalan dan/atau peningkatan kompleksitas model biasanya akan sampai pada titik diminishing return. Kuncinya adalah mengetahui kapan modelmu cukup bagus untuk memberi dampak bisnis nyata, menerapkannya, merealisasikan hasilnya, lalu move on ke masalah penting lain.
Idealnya, di bagian pengalaman kerja, saya ingin melihat beberapa pernyataan tentang dampak nyata—setidaknya satu per jabatan data science yang pernah ia pegang. Ini akan membuat saya yakin bahwa si kandidat punya nilai komersial dan layak diinvestasikan, karena ada nilai ROI yang jelas. Lagi-lagi, kemampuan merangkum aspek kunci proyek (konteks, pendekatan, dan dampak) dalam satu paragraf menjadi indikator penting kemampuan komunikasi tertulis.
Pengalaman coaching, mentoring, dan line management
Untuk jabatan data scientist yang lebih senior, saya mencari kandidat dengan pengalaman coaching, mentoring, dan line management. Jika si kandidat sudah beroperasi dalam level senior, saya ingin ini dicantumkan di kolom pengalaman kerja.
Kandidat perlu memberi detail tentang berapa banyak data scientist yang mereka pimpin, berapa lama, serta kemampuan apa saja yang mereka latih/bimbing. Mencantumkan kursus pelatihan manajemen formal, coaching, dan mentoring yang pernah mereka ikuti bisa menjadi bonus.
Saya akan terkesan bila, misalnya, si kandidat pernah menjadi manajer atau mentor data scientist yang sangat baik dalam bekerja, atau butuh bimbingan untuk berkembang, kemudian ia cantumkan konteks, pendekatan, dan hasil bimbingan itu. Mampu merangkum ini ke dalam satu paragraf adalah pertanda kemampuan komunikasi tulis yang baik.
Saya berharap kandidat yang akan menempati jabatan data scientist senior pernah mengikuti beberapa kursus pelatihan dan berpengalaman membimbing atau memimpin setidaknya satu orang. Ini akan membuat saya percaya bahwa dia juga siap mengatur dan membimbing para pegawai tetap yang sudah ada.
Kemampuan teknis yang luas dan dalam
Berikutnya, saya ingin mengetahui seberapa luas dan dalam kemampuan teknis si kandidat, terutama di CV data scientist senior. Luas di sini bisa ditunjukkan dari variasi masalah yang pernah mereka kerjakan (misalnya masalah prediksi, pengoptimalan, simulasi, dan lain-lain). Tapi saya juga ingin ada bukti kedalaman teknis di CV dan itu jarang saya temukan.
Salah satu contoh bagus yang pernah saya lihat adalah ketika kandidat mencantumkan algoritme atau library yang pernah ia sumbangkan dalam proyek open-source. Memprogram algoritme seperti ini tidak hanya butuh kemampuan coding, tapi juga pengetahuan mendalam tentang cara kerja library itu sendiri.
Contoh lain misalnya bila ada kandidat yang mampu menjelaskan mengapa ia memilih suatu algoritme dalam proyek, bukan lainnya. Bila ia bisa menjelaskan pilihan tersebut berdasarkan asumsi di balik tiap algoritme serta karakteristik data dan masalah yang dihadapi, artinya ia tidak sekadar menggunakan library, tapi paham mengapa pilihannya adalah algoritme terbaik untuk masalah spesifik itu.
Akreditasi eksternal, seperti status sertifikasi (Chartered Mathematician, Chartered Scientist, Chartered Statistician, dan lain-lain) juga merupakan cara yang baik untuk menunjukkan kualitas keahlian si kandidat.
Alat dan proses
Saya juga akan mencari pengalaman para kandidat menggunakan Agile dalam CV. Saya ingin mengetahui kapan dan di mana mereka bekerja sesuai framework Agile, dan idealnya framework (Scrum, Kanban, dsb) serta alat (JIRA, Assembla, dsb) apa yang mereka gunakan.
Saya mencari pengalaman Agile apa pun, tapi jika si kandidat pernah menggunakan Kanban dan/atau pendekatan penelitian bersifat Hypothesis-Driven dalam setidaknya satu proyek data science, itu akan menjadi nilai bonus.
Saya juga ingin mengetahui pengalaman bekerja di berbagai lingkungan berbeda (Linux, Windows, Hadoop, Cloud, dsb) dan pengalaman menggunakan best practice seperti version control (misalnya Git) dan dokumentasi (misalnya Wiki).
CV terbaik biasanya mencantumkan aspek-aspek tersebut di bawah tiap proyek dalam kolom pengalaman kerja, juga menulisnya lagi dalam daftar terpisah yang disertai tahun pengalaman yang bersangkutan.
Pola pikir terbuka
Pola pikir terbuka dan komitmen untuk terus belajar adalah hal yang vital, terutama untuk data scientist, karena bidang ini terus berubah. Saya selalu menyarankan anggota tim saya meluangkan waktu setiap minggu untuk belajar sesuatu yang baru. Tentu saja ini mengurangi kapasitas kerja tim, tapi saya menganggapnya sebagai investasi, sebab saya tahu bahwa belajar terus-menerus akan mendatangkan manfaat.
Kemauan belajar biasanya bisa dilihat dari keikutsertaan dalam MOOC atau kursus pelatihan lainnya, konferensi, dan workshop. Kuncinya adalah mencantumkan tanggal acara-acara tersebut untuk menunjukkan bahwa kamu menghadirinya secara reguler.
Soft skill
Terakhir adalah hal yang penting, terutama untuk jabatan data scientist senior. Saya menginginkan adanya soft skill seperti manajemen stakeholder, kemampuan memengaruhi manajer senior, dan kemampuan presentasi untuk audiens bisnis atau nonteknis. Pengalaman mengikuti pelatihan resmi dan mentoring juga baik untuk dicantumkan.
CV terbaik juga menunjukkan stakeholder atau rekan sulit yang harus dihadapi dan diatur oleh si kandidat untuk menyelesaikan proyek yang mereka tulis di kolom pengalaman kerja. Kuncinya ada pada menceritakan bagaimana cara mengatasi stakeholder yang sulit tersebut.
Rangkuman
Secara singkat, CV data scientist ideal berisi semua informasi di atas yang disajikan dengan cara singkat dan jelas, menunjukkan bahwa si kandidat memiliki kemampuan komunikasi tertulis yang baik. Pelamar kerja tidak perlu takut memiliki CV yang panjang. Saya akan dengan senang hati membaca CV setebal lima halaman bila berisi informasi berguna dan relevan, terutama bila CV itu bisa membuat proses wawancara jadi lebih singkat.
Kamu tidak perlu takut melamar bila tidak memenuhi semua kriteria. Untuk jabatan permanen, manajer perekrutan seperti saya tidak masalah menerima kandidat yang punya satu atau dua kelemahan.
Saya ingin orang yang bisa bergabung dan berkontribusi untuk tim, sambil terus belajar dan berkembang. Pembelajaran terus-menerus adalah hal yang sangat penting, dan saya selalu mendorong tim data scientist saya untuk melakukannya. [tia/ap]