Вопросы на собеседовании по машинному обучению

Стратегии собеседования (и возникающие вопросы на собеседовании) меняются в зависимости от того, подбирает ит рекрутер специалистов по обработке данных, инженеров по машинному обучению или другую связанную должность.

Эти вопросы будут полезны как для самих ит рекрутеров, так и кандидатов, которые планируют начать поиск работы и хотят подготовиться к собеседованию по машинному обучению.

В этот список входят общие вопросы собеседований для должностей, связанных с машинным обучением, а также для должностей в области науки о данных, поэтому возьмите то, что вам нужно, и оставьте то, что вам не нужно. Он по-прежнему даст вам представление о типах вопросов на собеседовании по машинному обучению, которые вы можете ожидать, и о том, как вы можете полностью подготовиться к интервью.

1. КАК БЫ ВЫ ПОДОШЛИ К ПОНИМАНИЮ ТОГО, КАКИЕ ОШИБКИ ДОПУСКАЕТ АЛГОРИТМ?
Этот вопрос касается демонстрации ваших навыков решения проблем, помимо выявления ошибки в первую очередь, поэтому сосредоточьте внимание на действенных шагах. Он исходит от Джейсона Дэвиса, генерального директора и соучредителя Simon Data, поставщика платформы данных о клиентах (CDP). Вот почему это нравится Дэвису: «Я хочу видеть, что они думают о проблеме с разных сторон. В Simon Data ключевой частью нашего предложения является партнерство с нашими клиентскими брендами, которое помогает им решать сложные бизнес-задачи. Нам нужен кандидат, который рассмотрит, плохи ли данные или есть ли в алгоритме какие-либо непредвиденные предубеждения, которые мы можем устранить, но правильный кандидат также подумает, не ограничиваясь технической проблемой, и спросит, правильно ли мы моделируем бизнес. проблема для конкретного клиента ».
Итог: для подобных вопросов сосредоточьтесь на действии, например, на том, какие дальнейшие шаги вы предпримете для решения проблем, и вы не сойдете с пути.

2. КАКИЕ СПЕЦИАЛИСТЫ ПО ДАННЫМ ИЛИ СТАРТАПЫ, ОСНОВАННЫЕ НА НАУКЕ О ДАННЫХ, ВАМ БОЛЬШЕ ВСЕГО НРАВЯТСЯ И ПОЧЕМУ?
Даже если вы начинаете заниматься машинным обучением, вы должны быть в курсе тенденций и громких имен в отрасли. Этот вопрос определяет, насколько вы погружены в [науку о данных, машинное обучение, чем бы вы ни занимались], так что как лучше подготовиться? Имейте наготове несколько имен (вроде ваших любимых влиятельных лиц).

Вопрос для собеседования исходит от Ягоды Вичорек, менеджера по персоналу ResumeLab, которая использует его при найме специалистов по данным, но она часто задает аналогичный вопрос и инженерам по машинному обучению. «Что хорошего в этом вопросе, так это то, что он позволяет [нам] направить микроскоп [на] мотивацию кандидата стать специалистом по данным и лучше понять, действительно ли он увлечен этой областью», - говорит она. «Если они могут назвать 2-3 специалистов по данным / стартапов, подпитываемых наукой о данных, из головы, тогда вы поймете, что нашли настоящее золото».
Итог: проведите исследование, узнайте громкие имена, выберите любимых. К вашему сведению, нет неправильного ответа, если вы будете в курсе отраслевых тенденций!

3. ПРИВЕДИТЕ МНЕ ПРИМЕР ТОГО, КАК ВЫ ИСПОЛЬЗОВАЛИ АНАЛИЗ ДАННЫХ ДЛЯ ИЗМЕНЕНИЯ ПОВЕДЕНИЯ. КАКОВО БЫЛО ВЛИЯНИЕ И ЧТО БЫ ВЫ СДЕЛАЛИ ИНАЧЕ, ОГЛЯДЫВАЯСЬ НАЗАД?
Этот вопрос исходит от Мелани Тантингко, RVP из People Ops в Sisense, аналитической платформе для бизнеса и специалистов по данным. «Большинство людей используют данные для оценки решений - я прошу данные, чтобы сделать их лучше и изменить подход в будущем», - говорит Тантингко. «Мне также нравится видеть, размышляют ли наши собеседники и хотят ли они стать лучше и совершенствоваться».
Итог: всегда есть возможности для улучшения. Вы не идеальны (как и ваша работа!), Поэтому не бойтесь сосредоточиться на том, как вы могли бы добиться большего в следующий раз.

4. ПОЧЕМУ ВЫ ИСПОЛЬЗУЕТЕ ЭТОТ АЛГОРИТМ?
Сьюзан Шу Чанг, специалист по обработке данных из Bell, говорит, что по мере прохождения процесса вам следует ожидать таких вопросов: «Почему?». «Я [обычно задаю это] в ответ на то, что кандидат мог упомянуть в качестве ответа в тематическом исследовании науки о данных. Им нужно обосновать это [и показать], что они знают все за и против, а не просто предлагают это, потому что это звучит круто».
Итог: есть много вариантов подхода к проблеме - вам нужно показать, что вы можете критически относиться к той, которую решите использовать.

5. ПОЧЕМУ БИЗНЕС ДОЛЖЕН ВОЛНОВАТЬСЯ?
Еще одно от Чанга (которое, как она признает, является крутым) фокусируется на том, можете ли вы показать, что понимаете более широко общую картину. «Оптимизация веб-сайта с помощью машинного обучения может быть прекрасной задачей, но хороший ответ - не потому, что это делают все остальные», - говорит Чанг. «Это может быть что-то вроде« сократить расходы на звонки в службу поддержки, поскольку веб-сайт может лучше решать проблемы клиентов» - мы хотим, чтобы люди знали, для чего они используют машинное обучение, и понимание более глубокой цели может позволить им чтобы лучше решать проблемы машинного обучения».
Итог: никогда не упускайте из виду общую картину.

6. КАК ВЫ ОБЩАЕТЕСЬ КАК С ТЕХНИЧЕСКОЙ, ТАК И С НЕТЕХНИЧЕСКОЙ АУДИТОРИЕЙ?
Серхио Моралес Эскивель, специалист по анализу данных из компании Growth Acceleration Partners (GAP), задает вопросы о стиле общения каждый раз, когда он берет на себя собеседование на роль машинного обучения. Зачем? «Я ищу не только кандидатов, которые хотят поделиться своими знаниями и взаимодействовать с другими в рамках нашей аналитической практики, но также тех, кто ценит роль прозрачности и прямого общения в решении проблем, обсуждении альтернативных решений и представлении результатов и идей коллегам. и другие заинтересованные стороны », - говорит Эскивель. «Активное распространение нашего процесса ... может привести нас к мысли, к которой мы бы не пришли в одиночку».
Итог: если вы не можете донести свою работу до людей за пределами вашей команды, вы должны начать работать над этим прямо сейчас. И в процессе собеседования, убедитесь, что вы четко сформулировать, каким образом вы бы общаться внутри и снаружи (в том числе, как они отличаются).

7. ОБЪЯСНИТЕ ЭТАПЫ ПОСТРОЕНИЯ ДЕРЕВА РЕШЕНИЙ.
Вичорек также задает этот вопрос соискателям в области науки о данных каждый раз, когда она проводит интервью. Хотя вы можете проходить собеседование не на работу в области науки о данных, а скорее на что-то более начальное, вам все равно следует ожидать вопроса на собеседовании с машинным обучением, который сосредоточен на том, как вы принимаете решения или какие процессы вы используете. Зачем? «Это помогает мне понять их процесс принятия решений», - говорит Вечорек. То, как вы ответите на этот вопрос - и сможете ли вы его четко объяснить и обрисовать - даст интервьюерам представление о том, как вы будете работать в команде (или руководить ею).
Итог: когда дело доходит до машинного обучения и анализа данных, вам нужно знать, как принимать обоснованные решения. Подумайте о способах, которые вы делали наиболее успешно в прошлом, и будьте готовы использовать их для иллюстрации вашего процесса.

8. КАКОВА ЦЕЛЬ A / B ТЕСТИРОВАНИЯ?
Вичорек добавляет этот вопрос в смесь, которую она описывает как «тест на общие знания». Для этого и всех собеседований по машинному обучению и науке о данных убедитесь, что вы знаете лучшие практики в своей области. Вас спросят о них.
Итог: знайте общие области машинного обучения и / или науки о данных, а также каковы текущие стандарты, а также почему они являются стандартами.

9. ПОЧЕМУ ОЧИСТКА ДАННЫХ ИГРАЕТ ЖИЗНЕННО ВАЖНУЮ РОЛЬ В АНАЛИЗЕ?
И последнее, но не менее важное: Вичорек предлагает кандидатам то, что она называет «тестом на технические знания», как этот вопрос. Макс Бабич из SpdLoad поддерживает этот подход, объясняя (по крайней мере, для ролей в области науки о данных), что «большинство вопросов на собеседовании связаны с математикой». Убедитесь, что вам хорошо знакомы новые технические навыки, особенно те, которые указаны в описании должности, и ожидайте подробных вопросов по ним.
Итог: Да, технические знания имеют значение, но если у вас есть навыки (например, знания Python ), у вас все в порядке.

10. РАССКАЖИТЕ МНЕ О ТОМ, ДЛЯ ЧЕГО БЫЛ СОЗДАН ЭТОТ НАБОР ДАННЫХ В РАМКАХ АНАЛИТИЧЕСКОГО ПРОЦЕССА.
Esquivel любит этот вопрос, потому что он заставляет кандидатов задуматься о недостатках данных - важной части набора навыков. Говорит Эскивель: «Легко указать и понять, что измеримые структурные атрибуты данных, с которыми мы работаем, часто коррелируют с высокими показателями производительности модели. Однако гораздо менее интуитивно понятно объяснять, как социальный и культурный контекст, в котором был создан набор данных, может привести к моделям, которые воспроизводят предубеждения или полагаются на выводы, исключительные для этого контекста, что приводит к циклам отрицательной обратной связи, неправильному взвешиванию выборки и оценке , а также неожиданные или даже недействительные результаты при применении к другому или большему контексту ».
Итог: отвечая на вопросы по аналитическому процессу, не думайте только о положительных результатах, но также учитывайте отрицательные последствия (или, по крайней мере, возможные недостатки).

11. МАШИННОЕ ОБУЧЕНИЕ - ЭТО НАУКА ИЛИ ИСКУССТВО?
Эскивел столкнулся с этим необычным вопросом, когда участвовал в серии собеседований по поводу машинного обучения. Вот почему это так, говорит он: «Интервьюеры были заинтересованы не столько в том, чтобы услышать, как это было сочетание того и другого, сколько в использовании вопроса в качестве трамплина для обсуждения важности следования строгим научным практикам и необходимости творчества как части аналитического процесса; интерпретировать данные, формулировать способы их использования, превращать результаты моделей в практические идеи и т. д.»
Итог: вам необходимо понять, насколько важны творческий подход и научные практики в вашей роли, и сформулировать, как они работают вместе. Это также отличная возможность поговорить о том, являетесь ли вы более творческим или научным, и о том, как вы работали над устранением этого дисбаланса, чтобы стать более разносторонним инженером по машинному обучению.

12. КОГДА ЛУЧШЕ ИСПОЛЬЗОВАТЬ TENSORFLOW [ИЛИ ДРУГУЮ БИБЛИОТЕКУ, ТЕХНОЛОГИЮ ИЛИ ПОДХОД]?
Когда дело доходит до машинного обучения (или даже собеседований по науке о данных для тех, кто хочет получить работу в C-Suite), ожидайте вопросов, которые проверят, насколько вы в курсе текущих технологий и тенденций. Сюда входят вопросы, связанные с библиотеками Python, такими как TensorFlow. Бабич, которому однажды пришлось нанять семь кандидатов наук в области науки о данных для трехмесячного проекта (то есть он провел более 100 собеседований), любит разбрасывать подобные вопросы между более математическими. «Мне очень нравятся вопросы о современных технологиях и подходах».
Итог: не бойтесь высказывать свое мнение, если вы можете его подкрепить.

13. ПРИВЕДИТЕ ПРИМЕР ПРОБЛЕМЫ, КОТОРУЮ ВЫ РЕШИЛИ (ИЛИ ПЫТАЛИСЬ РЕШИТЬ) С ПОМОЩЬЮ МАШИННОГО ОБУЧЕНИЯ.
Стормоен (основатель Mobibi, упомянутый выше) любит этот вопрос за его простоту. Его совет? «Сделайте это личным - [покажите] свою страсть, самостоятельный [подход], творческое мышление».
Итог: Да, даже машинное обучение или работа с данными требует энтузиазма. Покажи немного свою.

14. ОЖИДАЙТЕ ТЕХНИЧЕСКИЕ ВОПРОСЫ ПО ФРЕЙМВОРКАМ И МОДЕЛЯМ МАШИННОГО ОБУЧЕНИЯ, А ТАКЖЕ НЕКОТОРЫЕ КОНЦЕПТУАЛЬНЫЕ ВОПРОСЫ.
Стормоен говорит, что вам следует «убрать свои фреймворки и распространенные модели машинного обучения, например PCA, регрессию и кластеризацию». Вы также должны быть в состоянии «продемонстрировать понимание общих стеков машинного обучения у облачных провайдеров (AWS, Azure или GCloud), например, с помощью AWS - S3 buckets или RDS + lambda + AWS ML и т. д.»
Или воспользуйтесь этим советом Аллена Лу, бывшего стажера по машинному обучению в Google, который в недавнем посте на Quora изложил вопросы собеседования при приеме на работу по машинному обучению, которые он решал, чтобы получить стажировку: «Общие вопросы будут сосредоточены на основных темах машинного обучения, таких как логистическая регрессия, SVM, наивный байесовский метод и т. д. Вас также, вероятно, спросят об основных принципах нейронных сетей, таких как полносвязные уровни, функции активации и плюсы / минусы глубокое обучение (больше скрытых слоев)».
Однако Google не остановился на технических вопросах. (Зачем им?) Как и в вопросах, связанных с принятием решений, которые мы упоминали ранее, Google также любит немного концептуально. Лу говорит: «[Y] вы можете ожидать некоторых концептуальных вопросов, таких как компромисс смещения и дисперсии, различные функции потерь, переоснащение / регуляризация и т. д.»
Итог: опять же, технические вопросы собеседования будут разными, но лучший способ подготовиться к ним - это просмотреть все основные темы машинного обучения, которые вы изучили, чтобы вы чувствовали себя комфортно, говоря о них.

15. CURVEBALL: ПРОБЛЕМА НЕМЕЦКИХ ТАНКОВ
Совет: внимательно прочтите этот «вопрос». Его часто использует Пит Сосновски, соучредитель и руководитель отдела кадров Zety для отбора кандидатов, и это немного… сложно. Вот как это работает (Сосновский выделил ключевые шаги ниже): «Сколько танков выпустили немцы?» - спросили союзники во время Второй мировой войны. И вопрос остался бы без ответа, если бы не тот факт, что немцы (зная свою страсть к «боеприпасам») любили последовательно нумеровать свои танки, покидая завод. Итак, теперь у нас есть неизвестное количество танков, которые последовательно пронумерованы от 1 до N. Возьмите случайную выборку обнаруженных танков (№ 12, 37, 52…) и просмотрите их порядковые номера; затем используйте свои навыки анализа данных, чтобы оценить N (общее количество резервуаров) по этим наблюдаемым числам».
«Ответ на этот вопрос не поможет силам союзников на данном этапе, но он определенно позволит нам увидеть мыслительный процесс кандидата на машинное обучение», - говорит Сосновский. «Это вопрос типа технической задачи, но способ подход к ней (выбранный метод и само решение) позволяет нам выявлять кандидатов с наибольшим потенциалом».
HR Блог для IT рекрутера в Телеграм
Хочешь всегда получать новые статьи, бесплатные материалы и полезные HR лайфхаки! Подписывайся на нас в Telegram! С нами подбор ит персонала становится проще ;)
Хотите найти талантливого сотрудника?
Оставьте заявку и получите в подарок список вопросов для сбора рекомендаций на кандидата