26.03.2020

      Как искать Data Science-специалистов на Kaggle

      Все вы наверное слышали, что крутой рекрутер должен уметь искать лучших кандидатов через GitHub или StackOverflow. Но ведь не все специальности используют эти платформы в равной мере? Выкладывают ли датасаэнтисты код нейросетей на гитхаб или спрашивают ли они на стековерфлоу, как отличить котика от собачки? А как на счёт отдельной площадки, где можно делать все это одновременно и на которой собраны только machine learning специалисты? Эта площадка называется Kaggle.

      Kaggle - это международная платформа для проведения соревнований по машинному обучению. Тут новички могут перенять опыт и набить руку в решении практических задач в ML, а опытные специалисты проверить свои силы в соревновании с лучшими умами планеты и почерпнуть новые интересные идеи для работы.
      Саму площадку финансирует Google, а соревнования проводят крупные мировые компании вроде General Electrics, Intel, Deloitte и правительственные организации. Это что-то вроде Олимпийских игр или Чемпионата мира по футболу для специалистов по машинному обучению. Собрать все золотые медали и оказаться в первой десятке лидеров тут не менее престижно.
      Как в настоящей Олимпиаде, тут есть свои дисциплины, в которых соревнуются участники, и в каждой из них действительно можно зарабатывать золотые, серебряные и бронзовые медали. 

      Всего дисциплин на текущий момент 4:
      ● Награды за победы в соревнованиях. В зависимости от количества участников призовых мест может быть много.● Награды за лучшие наборы данных. Подготовка и сбор данных - это тоже большой труд и требует мастерства датасаенстиста.● Награды за лучший открытый код. На Kaggle люди публикуют код открыто, как на Гитхабе, и другие, менее опытные, ML-специалисты могут учится с его помощью, использовать его в своей работе.● Награды за участие в обсуждениях. А тут Каггл больше похож на другой популярный ресурс, Стэковерфлоу, где люди делятся мнениями, отвечают на вопросы и обсуждают проблемы и оценивают ответы друг друга.

      Зарабатывая новые медали в разных дисциплинах, участники зарабатывают также и новые спортивные титулы, которые отображаются в их профилях (на каждую дисциплину титул зарабатывается отдельно):
      ● Новичок - присуждается за регистрацию,● Участник - присуждается за заполнение профиля, запись на соревнование, первый комментарий и первый запуск кода на сайта,● Эксперт - присуждается за определенное количество бронзовых медалей в дисциплине,● Мастер - присуждается за определенное количество серебряных и минимум одну золотую медаль (для соревнований и наборов данных) по дисциплинам,● Гроссмейстер - присуждается за определенное количество золотых медалей в дисциплине.
      *Участник уровня “Мастер” в нескольких дисциплинах - это как минимум крепкий миддл, который хорошо умеет решать основные задачи ML-специалиста.

      Давайте посмотрим, как это выглядит на странице участника Каггл:

      Illustration

      Список титулов и медалей каждого участника сразу на виду, вы легко сможете оценить его достижения при первом взгляде на страницу.
      Полезной информацией будут данные про локацию кандидата, его текущее место работы и ссылки на его соцсети, профиль на Гитхабе, сайт и т.п.
      Чтобы воспользоваться кнопкой для связи, вам понадобится как минимум титул участника - это более простой способ связаться с человеком, чем искать его через соцсети. Но стоит учитывать, что для получения титула вам понадобятся некоторые технические навыки или помощь кого-то из существующих участников платформы.
      Также многие пользователи заполняют раздел биографии на сайте, который отображается чуть ниже на странице. Там может быть полезная информация об их опыте, специализации, образовании или даже прямые контактные данные.
      Но не всегда нужную информацию удается узнать из раздела биографии. Сейчас поиск machine learning-специалистов становится все более узконаправленным, вам часто нужны люди со специфическим опытом: обработкой изображений, NLP, работой с аудио и т.п. В таком случае вам помогут детальные описания титулов.

      Нажав по названию каждого из титулов, вы увидите за что он был присужден. Это, безусловно, не так удобно, как перечень проектов на linkedin, но полезную информацию тоже можно почерпнуть:
      ● Для соревнований пишется название и краткое описание соревнования, из которого часто можно понять, в какой сфере участник умеет решать задачи,● Для наборов данных дается описание, по которому изредка можно понять сферу деятельности участника,● Для открытого кода пишется название архива, название соревнования для которого создавался этот код, а также довольно часто удобные и информативные тэги, в которых пишут сферы и используемые технологии,● Для обсуждений дают просмотреть, непосредственно за какие сообщения участник получил награды: по делу или за удачный мем с котиками, - а также при достаточной квалификации можно определить, из какой сферы это обсуждение.
      Теперь, когда вы знаете, как “читать” страницу пользователя на Kaggle, давайте разберемся, как собственно найти нужных вам пользователей среди всех остальных участников. 

      Illustration

      Как и во многих других случаях, на помощь вам приходить так называемый “X-ray search” через Google, или, проще говоря, поиск по сайту kaggle.com с использованием нужных ключевых слов:
      ● Во-первых, нам понадобится сам поиск по сайту: site:kaggle.com,● Далее нам нужно выделить именно страницу пользователя. Так как по ссылке это сделать невозможно, будем использовать текст, который есть только на этой странице: "Contact User",● И наконец нам нужно сузить поиск только до пользователей, которые указали в локации Украину: "Ukraine".

      В результате получаем такую поисковую строку для гугла:

      site:kaggle.com "Contact User" "Ukraine"

      Естественно, вы можете модифицировать поиск и добавлять свои ключевые слова так, как посчитаете нужным. К примеру, сразу искать страницы, где встречается слово “master”, чтобы найти только опытных кагглеров.

      Как видите, Kaggle - это такой же полезный сайт для продвинутого поиска кандидатов, как и GitHub или StackOverflow. Он заточен только под одну специальность, что довольно удобно, ведь вы точно знаете, кого тут найдете. Как и при любом продвинутом поиске, у сайта есть своя специфика, в которую нужно будет вникнуть, прежде чем приступить к поиску кандидатов. Но разобравшись, вы сможете открыть для себя новый источник талантливых специалистов.

      Команда ITExpert