Как найти и нанять Data Scientist специалиста

Создание новых программных приложений дает компаниям возможность получать огромную прибыли, а также помогает улучшить нашу жизнь.

Вот несколько удивительных примеров из практики компаний, которые наняли для создания своих программных продуктов:

  • Лицо, пол, возраст, система распознавания - программа машинного обучения
  • MyTime - веб-приложение для планирования и оплаты
  • Обучающее решение для китайского рынка - приложение для планирования занятий и электронного обучения

Наука о данных быстро становится одним из самых востребованных навыков в мире по простой причине: хороший специалист по данным может принести организации огромную пользу.

Истерия по поводу больших данных стала глобальной, и теперь компании собирают безумные объемы данных. Все, что мы делаем сейчас, записывается, измеряется и сохраняется в надежде получить полезную информацию о поведении клиентов.

Но теперь компании быстро понимают, что простого сбора и хранения данных недостаточно. Преимущество получают не организации с наибольшим объемом данных, а те, которые могут извлечь из этих данных верные выводы.

По этой причине специалисты по обработке данных могут быть разницей между компанией, получающей огромную выгоду от своих потоков данных, и ничего не получающей. В мире, управляемом данными, это может означать жизнь или смерть организации. Очень важно нанять подходящего специалиста по данным.

Какой Специалист по данным хороший?
Науку о данных можно рассматривать как работу по «превращению необработанных данных в понимание, понимание и знания» ( Wickham & Grolemund, 2016 ). Аналитики данных, статистики и количественные аналитики выполняют схожие роли с упором на разные навыки.

Data Scientist: должностные инструкции
Вы часто будете встречать термины «специалисты по данным» и «инженеры данных», которые используются как синонимы. Их работа заключается в извлечении информации из разнообразных и обширных наборов данных. Выводы, которые они получают, помогают предприятиям принимать более правильные решения.

Специалисты по обработке данных используют методы интеллектуального анализа данных. Их работа включает статистический анализ, кроме того, им может потребоваться построение эффективных прогнозных моделей. Специалистам по данным могут потребоваться алгоритмы машинного обучения для создания систем рекомендаций или автоматизированных систем оценки.

В зависимости от вашего проекта им может потребоваться использовать такие технологии, как искусственный интеллект (AI), для построения систем принятия решений или классификации. Возможно, им потребуется возглавить группу аналитиков данных или группу специалистов по анализу данных.

Роли и обязанности, которые следует учитывать при подборе Data Scientist
Независимо от того, являетесь ли вы стартапом или руководителем ИТ-отдела на предприятии, у вас есть конкретные цели в рамках проекта по науке о данных. Вам нужен специалист по данным, чтобы взять на себя определенные обязанности:

  • Работа с заинтересованными сторонами для понимания бизнес-требований;
  • Сотрудничество с руководителями отчетности MIS, бизнес-аналитиками и статистиками для определения технических требований проекта в области науки о данных;
  • Определение схемы и подхода к проекту разработки программного обеспечения для обработки данных;
  • Установление показателей и процесса измерения для оценки успеха проекта;
  • Руководство работой по анализу и визуализации данных;
  • Выбор и использование подходящих моделей машинного обучения для эффективной системы обработки данных;
  • Повышение качества конвейера данных;
  • Внедрение эффективных инструментов анализа данных и разработка программ для этого, когда это применимо;
  • Ведущие усилия по оптимизации программ для анализа данных;
  • Общение со всеми соответствующими заинтересованными сторонами;
  • Сотрудничество с вашей большой командой, включая архитекторов инфраструктуры, бизнес-аналитиков, руководителей проектов, тестировщиков и инженеров DevOps;
  • Руководство командой по анализу данных;
  • Управление ожиданиями заинтересованных сторон и отчетность о статусе проекта.

НАВЫКИ И КОМПЕТЕНЦИИ, НА КОТОРЫЕ СЛЕДУЕТ ОБРАТИТЬ ВНИМАНИЕ ПРИ ПРИЕМЕ НА РАБОТУ СПЕЦИАЛИСТОВ ПО ДАННЫМ
Давайте теперь поговорим подробнее о процессе найма. Возможно, вы размещали объявления о вакансиях в LinkedIn и других сайтах / приложениях. Благодаря помощи рекрутеров и менеджеров по найму вы могли получить резюме кандидатов в области науки о данных. Пришло время подумать над соответствующими вопросами на собеседовании, чтобы найти нужных ит специалистов.

Эта работа требует уникального сочетания навыков. Знаменитая диаграмма Венна, составленная Дрю Конвеем для этих навыков, - хороший визуальный способ их понять.

Какие навыки следует ожидать от опытного специалиста по данным? Помимо степени бакалавра в области компьютерных наук, информационных технологий или смежных областях, вам следует обратить внимание на следующее:

1. Технические навыки, которые вам нужны у специалистов по обработке данных или инженеров по данным
Вам нужны специалисты по данным со следующими основными техническими навыками:

  • Глубокие знания алгоритмов и методов машинного обучения, например, Naïve Bayes, Decision Forests и т.д .;
  • Большой опыт работы с одним или несколькими из следующих языков программирования, ориентированных на анализ данных, таких как Python , R, Julia и т.д.;
  • Хорошее знание языков программирования общего назначения, таких как Java , JavaScript и т.д.;
  • Глубокие знания в области глубокого обучения и нейронных сетей;
  • Хорошее знакомство с популярными отраслями искусственного интеллекта, такими как обработка естественного языка (NLP), компьютерное зрение и т.д.;
  • Хорошее знание инструментов для анализа данных, таких как MatLab, NumPy и т.д.;
  • Глубокое знание SQL или других языков запросов, таких как Hive, Pig и т.д.;
  • Хороший опыт работы с популярными системами управления реляционными базами данных (СУБД), такими как Oracle, MySQL, PostgreSQL и т.д.;
  • Отличное знание баз данных NoSQL, таких как MongoDB, HBase, Cassandra и т.д.;
  • Достаточный опыт работы с фреймворками с открытым исходным кодом, такими как Hadoop;
  • Глубокие знания в области инструментов расширенной аналитики, таких как SAS;
  • Опыт работы с Apache Spark, популярными системами распределенной обработки больших данных с открытым исходным кодом;
  • Знакомство с популярными инструментами визуализации данных, такими как Tableau, D3.js, GGplot и т.д.;
  • Опыт применения методов прогнозного моделирования, таких как регрессионный анализ;
  • Хорошее знание статистики, включая навыки распределения, статистического тестирования и т.д.;
  • Отличное знание Microsoft Excel.

2. Общие навыки программирования, необходимые для проекта по науке о данных
При приеме на работу специалистов по данным и инженеров по обработке данных вам потребуются следующие общие навыки программирования:

  • Общие навыки программирования и написания сценариев, необходимые программисту;
  • Отличное знание популярных платформ облачных вычислений, таких как Amazon Web Services (AWS), Google Cloud Platform или Microsoft Azure;
  • Опыт разработки RESTful API ;
  • Хорошие знания в области устранения уязвимостей безопасности приложений;
  • Глубокие знания в области разработки масштабируемых приложений .

3. Навыки программной инженерии
Проекты в области науки о данных также требуют значительных навыков разработки программного обеспечения. Когда вы нанимаете специалистов по обработке данных, обратите внимание на следующее:

  • Хорошее знание жизненного цикла разработки программного обеспечения и методологий разработки;
  • Глубокое знание популярных шаблонов архитектуры программного обеспечения ;
  • Хорошее знание различных видов тестирования, таких как функциональное тестирование, A / B-тестирование, тестирование производительности, тестирование безопасности и т.д.;
  • Хороший опыт работы с инструментами, процессами и практиками DevOps;
  • Достаточное знакомство с процессами и практиками DevSecOps;
  • Экспертиза кода;
  • Хорошие знания методов и практик предотвращения дефектов программного обеспечения;
  • Отличное знание лучших практик, используемых в проектах по разработке программного обеспечения.

4. Компетенции, на которых следует сосредоточиться при приеме на работу специалистов по обработке данных
Реальные проекты в области науки о данных связаны с множеством сложностей. Они привлекают много внимания, и это проекты с высокими ставками. Выполнение таких проектов требует гораздо большего, чем просто технические навыки. При приеме на работу специалистов по обработке данных вам потребуются следующие компетенции:

  • Стремление к совершенству: проект по науке о данных должен приносить ощутимые результаты, т. Е. Заинтересованные стороны бизнеса должны иметь возможность собирать практические идеи. Высококачественные системы анализа данных должны хорошо служить своим конечным пользователям. Это требует стремления к совершенству со стороны команды специалистов по анализу данных. Специалист по данным, который возглавляет такую команду, должен продемонстрировать эту страсть.
  • Обязательства: проекты в области науки о данных обычно имеют строгие сроки. Они часто имеют сложную сферу применения, кроме того, они должны соответствовать строгим целям качества. Команда специалистов по анализу данных столкнется с несколькими проблемами. Команда должна успешно ориентироваться в них и соответствовать целям проекта. Специалист по данным должен продемонстрировать приверженность проекту и целям организации.
  • Сотрудничество. Специалист по анализу данных будет работать с заинтересованными сторонами бизнеса, руководителем отчетности MIS, статистиками, архитекторами программного обеспечения, программистами, тестировщиками, инженерами DevOps и архитекторами инфраструктуры. Эта роль требует регулярного взаимодействия с разнообразным набором заинтересованных сторон, управления их ожиданиями и достижения результатов.
  • Коммуникационные навыки: проекты в области науки о данных, как правило, имеют множество сложностей. Такие проекты более сложны, чем обычные проекты разработки программного обеспечения, а сложные проекты требуют большего взаимодействия. Специалистам по обработке данных необходимо эффективно общаться с широким кругом заинтересованных сторон. Это поможет всем быть на одной волне.
  • Лидерство: сложности в проекте по науке о данных часто создают неопределенность. В таких обстоятельствах ясность - ключ к успеху. Успешные лидеры прорезают шум и вносят ясность в свою команду.

Вы будете соревноваться со многими компаниями за лучших кандидатов, обладающих всеми этими качествами. Вот 7 советов, которые помогут вам определить подходящих специалистов по данным и успешно привлечь их к работе в вашей организации.

1. РАЗРАБОТАЙТЕ ОТЛИЧНУЮ СИСТЕМУ НАЙМА
«Система» - ключевое слово здесь. Компании обнаруживают, что в среднем могут потребоваться сотни приложений, чтобы найти подходящего кандидата на должность в области науки о данных. Это потребует гораздо большего внимания, чем просто составление списка вакансий и проведение нескольких собеседований, чтобы понять это правильно.

Вам понадобится система, которая может:
  • Привлекать подходящих кандидатов для подачи заявки
  • Эффективно отсеивать не тех кандидатов
  • Определять самых талантливых претендентов
  • Убеждать своих лучших людей присоединиться к вашей команде

Эффективную систему найма можно представить как воронку. Сотни кандидатов попадают в верхнюю часть воронки, и каждый шаг процесса исключает неправильных кандидатов, сохраняя при этом как можно больше хороших.

Лучше всего начать с технических знаний. Чтобы стать великим специалистом в области данных, требуется гораздо больше навыков, но математическое и статистическое мастерство не подлежит обсуждению. Это может быть домашнее тестирование для ваших абитуриентов. Тест должен точно проверить навыки, которые потребуются вашему нанимателю как члену вашей команды.

На следующем этапе воронки найма вы будете различать хороших и хороших кандидатов. Необходимы технические навыки, но, что наиболее важно, они должны иметь возможность заставить данные работать на ваш бизнес. Вам потребуются творческие методы, чтобы раскрыть эти навыки.

Это не обязательно должно быть утомительное традиционное интервью. Это может быть день решения проблем с вашей командой. Пригласите всех, кто сдал экзамен на дом. После целого дня, посвященного решению проблем и общению, вы должны лучше понять, кого выбрать. Наука о данных - это чрезвычайно совместная работа, поэтому вся ваша команда должна участвовать в процессе принятия решений.

Наконец, вы должны предложить работу. Этот шаг должен быть выполнен правильно при найме специалистов по данным. Помните, вы стремитесь к лучшему. Вам следует позаботиться о том, чтобы ваше предложение было максимально привлекательным и не выглядело высокомерным.

2. СОЗДАЙТЕ ШИРОКУЮ СЕТЬ КАДРОВ
Как только вы продумаете свою воронку найма, вам нужно начать вовлекать в нее людей. Хорошие кандидаты из очевидных мест, таких как хорошие технические школы, будут завалены предложениями об интервью. Это прекрасные источники поиска талантов, но не единственные.

Наука о данных - это маленький мир. Один из хороших способов встретить потенциальных сотрудников, которых вы иначе не нашли бы, - это нетворкинг. Неоценимое значение будет иметь установление связи с отдельными лицами из других компаний, работающих в этой области. Любой в вашей сети, скорее всего, представит вас очень положительно.

Если у вас проблемы с поиском людей, обладающих всеми этими навыками, не волнуйтесь. Если кандидат не обладает всеми необходимыми техническими навыками, он все равно может подойти. Если у кого-то есть талант к коммуникации и аналитическому мышлению, обучить его конкретным техническим навыкам, таким как R или Python, не будет проблемой.

3. ИСПОЛЬЗУЙТЕ ОБЪЕКТИВНЫЕ МЕТОДЫ, ЧТОБЫ ИЗБЕЖАТЬ ПРЕДВЗЯТОСТИ
Бессознательная предвзятость - проблема, с которой приходится сталкиваться каждому IT рекрутеру. Как ни странно, некоторые из этих предубеждений, похоже, разделяют даже самые современные алгоритмы найма, призванные избежать этого. С учетом конкурентоспособности науки о данных это просто преувеличено. Если не установить флажок, это может снизить ваши шансы на успешный набор.

Некоторые распространенные предубеждения включают предвзятость соответствия, предвзятость красоты, а также эффект ореола. Чтобы справиться с ними, вам понадобятся объективные методы оценки кандидатов в вашем процессе. Это могут быть тесты, которые вы придумали заранее, чтобы измерить навыки, которые вы ищете, и на результаты которых не повлияют ваши эмоции.

4. НЕ СТРЕЛЯЙТЕ СЕБЕ В НОГУ
Есть много классических ошибок собеседования, которые повторяет рекрутер за рекрутером. Это может привести к ложным отрицаниям (случайный отказ от хорошего кандидата) и ложным срабатываниям (предложение работы не тому кандидату). И то, и другое вредно для вашего бизнеса. Это могут быть такие вещи, как:

  • Просить респондентов решить «игрушечные» задачи, которые на самом деле не демонстрируют реальных способностей
  • Странные вопросы на собеседовании, у которых нет цели (мы все слышали такие, например: «Если бы вы были фруктом, каким бы вы были и почему?»)
  • Выглядят высокомерно, предвзято или грубо
  • Требование бесплатной работы
  • Слишком личные вопросы
Вы можете передернуться от некоторых из них или подумать, что они очевидны, но подобные вещи случаются на собеседованиях каждый день. Работа рекрутеров в области науки о данных уже сложна - не отталкивайте хороших кандидатов, делая что-то глупое.

5. НАЙДИТЕ ПОДХОДЯЩЕГО СПЕЦИАЛИСТА ПО ДАННЫМ
Многие компании не осознают, что существует два разных типа специалистов по обработке данных.

  • Специалисты по обработке данных, которые предоставляют людям информацию
  • Специалисты по данным, которые занимаются машинами

Это две очень разные профессии и требуют разных навыков
Первый тип будет анализировать бизнес-данные и предлагать идеи и идеи для представления лицам, принимающим бизнес-решения. Результаты должны быть представлены таким образом, чтобы их могли понять нетехники. Такие специалисты по данным будут глубоко изучать наборы данных, чтобы найти идеи и представить их в виде историй, графиков и диаграмм.

Специалисты по обработке данных второго типа могут анализировать один и тот же набор данных, но преследуют совершенно разные цели. Это будут машиночитаемые отчеты, которые можно будет загружать в другие бизнес-системы компании для получения автоматизированных ответов. Вещи как:

  • Рекомендации по продукту
  • Размещение рекламы или таргетинг
  • Покупка или продажа акций

Этот тип специалистов по обработке данных требует отточенных статистических навыков и навыков программирования, чтобы создавать модели, которые позволяют делать прогнозы и принимать решения в режиме реального времени.

6. СДЕЛАЙТЕ СВОЙ ПРОЦЕСС СОБЕСЕДОВАНИЯ ПРИВЛЕКАТЕЛЬНЫМ
Помните, что хорошие специалисты по данным очень востребованы. Наука о данных настолько конкурентоспособна, что вам нужно найти подходящего кандидата и убедить его, что ваша фирма - лучший вариант. Весь процесс найма должен быть рекламой того, насколько велика ваша компания.

Тесты, собеседования и другие части вашего процесса должны отражать то, как кандидаты на самом деле будут работать в вашей фирме. (Если это плохая реклама, возможно, вашей фирме нужен сдвиг в культуре!)

7. УБЕДИТЕСЬ, ЧТО ВАМ ДЕЙСТВИТЕЛЬНО НУЖЕН СПЕЦИАЛИСТ ПО ДАННЫМ НА ПОЛНУЮ СТАВКУ
Нанять специалистов по данным сложно - поэтому я пишу эту статью. Итак, вам нужно спросить себя: действительно ли вам нужен полный рабочий день?

На самом деле вы ищете систему, которая принимает ваши бизнес-данные и возвращает вам ценные и действенные идеи. В зависимости от вашего типа бизнеса есть большая вероятность, что вам не понадобится штатный специалист по данным.

Нехватка навыков обработки и анализа данных привела к тому, что некоторые крупные компании предлагают услуги аналитики и нанимают специалистов по данным . Они могут создавать системы, которые вы ищете, и помогать вам в их обслуживании, без привлечения специалистов по данным в свою команду. Возможно, стоит проверить.

В наши дни профессиональный Data Scientists (или их команда) может означать разницу между процветающей компанией и уходящей в тень компанией. Максимально использовать свои данные - это уже не выбор, а необходимость. Следуйте этим советам и убедитесь, что процесс поиска не будет слишком болезненным!
HR Блог для IT рекрутера в Телеграм
Хочешь всегда получать новые статьи, бесплатные материалы и полезные HR лайфхаки! Подписывайся на нас в Telegram! С нами подбор ит персонала становится проще ;)
Хотите найти талантливого сотрудника?
Оставьте заявку и получите в подарок список вопросов для сбора рекомендаций на кандидата