
Як шукати Data Science-фахівців на Kaggle
Всі вже напевно чули, що крутий рекрутер має вміти шукати кращих кандидатів через GitHub чи StackOverflow. Але ж не всі спеціальності використовують ці платформи однаково? Чи викладають датасаєтисти код нейромереж на Гітхаб або чи питають вони на Стековерфлоу, як відрізнити котика від песика? А як щодо окремого майданчика, де можна робити все це одночасно та на якому зібрані тільки machine learning фахівці? Цей майданчик називається Kaggle.
Kaggle — це міжнародна платформа для проведення змагань з машинного навчання. Тут новачки можуть перейняти досвід та набити руку у вирішенні практичних завдань в ML, а досвідчені фахівці перевіряють свої сили в змаганнях з кращими фахівцями планети та отримують нові цікаві ідеї для роботи.
Цей майданчик фінансує Google, а змагання проводять великі світові компанії, такі як General Electrics, Intel, Deloitte та урядові організації. Це щось на кшталт Олімпійський ігор чи Чемпіонату світу з футболу для фахівців з машинного навчання. Зібрати всі золоті медалі та опинитися в першій десятці лідерів тут не менш престижно.
Як і в справжній Олімпіаді, тут є свої дисципліни, в яких змагаються учасники, і в кожній з них дійсно можна отримати золоті, срібні та бронзові медалі.
Всього нині є 4 дисципліни:
- Нагороди за перемоги у змаганнях. Залежно від кількості учасників призових місць може бути багато.
- Нагороди за кращі набори даних. Підготовка та збір даних — це теж велика робота та вимагає майстерності датасаєнтиста.
- Нагороди за кращий відкритий код. На Kaggle люди публікують код відкрито, як на Гітхабі, та інші, менш досвідчені, ML-фахівці можуть вчитися з його допомогою, використовувати його в своїй роботі.
- Нагороди за участь в обговореннях. А тут Каггл більше схожий на інший популярний ресурс, Стековерфлоу, де люди діляться думками, відповідають на питання та обговорюють проблеми, оцінюють відповіді один одного.
Отримуючи нові медалі в різних дисциплінах, учасники заробляють також і нові спортивні титули, які можна побачити у їхніх профілях (за кожну дисципліну титул заробляється окремо):
- Новачок — надається за реєстрацію,
- Учасник — присуджується за заповнення профілю, запис на змагання, перший коментар та перший запуск коду на сайті,
- Експерт — присуджується за певну кількість бронзових медалей в дисципліні,
- Майстер* — присуджується за певну кількість срібних та мінімум одну золоту медаль (для змагань та наборів даних) за дисциплінами,
- Гросмейстер — присуджується за певну кількість золотих медалей в дисципліні.
*Учасник рівня «Майстер» в декількох дисциплінах – це як мінімум міцний мідл, який уміє вирішувати основні завдання ML-фахівця
Поглянемо, як це виглядає на сторінці учасника Каггл:
Список титулів та медалей кожного учасника одразу видно, ви легко зможете оцінити його досягнення з першого погляду на сторінку.
Корисною інформацією будуть дані про локацію кандидата, його поточне місце роботи та посилання на його соцмережі, профіль на Гітхабі, сайт тощо.
Щоб скористатися кнопкою зв’язку, вам знадобиться як мінімум титул учасника — це простіший спосіб зв’язатися з людиною, ніж шукати його через соцмережі. Але варто враховувати, що для отримання титулу вам знадобляться деякі технічні навички або допомога когось з учасників платформи.
Також багато користувачів заповнюють розділ біографії на сайті, який знаходиться трошки нижче на сторінці. Там може бути корисна інформація про їхній досвід, спеціалізації, освіту чи навіть прямі контактні дані.
Але не завжди потрібну інформацію вдається дізнатися з розділу біографії. Зараз пошук machine learning-фахівців стає все більш вузьконаправленим, вам часто потрібні люди зі специфічним досвідом: обробкою зображень, NLP, роботою з аудіо тощо. В такому випадку вам допоможуть детальні описи титулів.
Натиснувши на назву кожного з титулів, ви побачите, за що його присудили. Це, безумовно, не так зручно, як перелік проєктів на Linkedin, але корисну інформацію теж можна отримати:
- Для змагань є назва та короткий опис змагання, з якого часто можна зрозуміти, в якій сфері учасник вміє вирішувати завдання,
- Для наборів даних є опис, за яким зрідка можна одразу зрозуміти сферу діяльності учасника,
- Для відкритого коду пишеться назва архіву, назва змагання для якого створювався цей код, а також досить часто зручні та інформативні теги, в яких пишуть сфери та використані технології,
- Для обговорень дають переглянути, за які безпосередньо повідомлення учасник отримав нагороди: за щось важливе чи за вдалий мем з котиком, – а також за достатньої кваліфікації можна визначити, з якої сфери це обговорення.
Тепер, коли ви знаєте, як «читати» сторінку користувача на Kaggle, розглянемо, як знайти потрібних вам користувачів серед решти учасників.
Як і в багатьох інших випадках, на допомогу вам приходить так званий «X-ray search» через Google, або, простіше кажучи, пошук по сайту kaggle.com з використанням потрібних ключових слів:
- По-перше, нам знадобиться пошук по сайту: site:kaggle.com,
- Далі нам потрібно виділити саме сторінку користувача. Оскільки за посиланням це зробити неможливо, використовуватимемо текст, який є тільки на сторінці: “Contact User”,
- І насамкінець нам потрібно звузити пошук тільки до користувачів, які вказали в локації Україну: “Ukraine”.
- В результаті отримуємо такий пошуковий рядок для Google:
site:kaggle.com “Contact User” “Ukraine”
Звісно, ви можете модифікувати пошук та додати свої ключові слова так, як вважаєте за потрібне. Наприклад, одразу шукати сторінки, де зустрічається слово “master”, щоб знайти тільки досвідчених користувачів.
Як бачите, Kaggle — це такий корисний сайт для просунутого пошуку кандидатів, як і GitHub чи StackOverflow. Він заточений тільки під одну спеціальність, що досить зручно, адже ви точно знаєте, кого тут знайдете. Як і в будь-якому просунутому пошуку, у сайта є своя специфіка, в яку потрібно буде пірнути, перш ніж перейти до пошуку кандидатів. Але розібравшись, ви зможете відкрити для себе нове джерело талановитих фахівців.