Разработчик инфраструктуры машинного обучения в Яндекс.Такси

by @yojob
Разработчик инфраструктуры машинного обучения в Яндекс.Такси

Требования

  • Опыт разработки на C++, владение STL.
  • Знание и понимание классических алгоритмов и структур данных.
  • Опыт многопоточного и сетевого программирования.
  • Опыт работы с базами данных (у нас богатый выбор: MongoDB, Redis, YT, PostgreSQL).
  • Опыт разработки под Linux.
  • Если у вас не хватает опыта в чем-то из перечисленного — не беда. Нам важны ваш энтузиазм и готовность заполнить пробелы в своих знаниях.

Задачи

  • Реализация удобной схемы обновления и версионирования моделей в продакшне.
  • Создание возможности проводить внутренние A/B-эксперименты с разными ML-моделями.
  • Поддерживать использование CatBoost, XGBoost и других необходимых нам библиотек машинного обучения.
  • Построение своей базы данных реального времени с информацией о поездках, с заранее посчитанными факторами и характеристиками пользователей и водителей.
  • Построение взаимодействия со сторонними источниками данных, например, «ГеоПоиском», «Яндекс.Погодой», API «Яндекс.Карт» по построению маршрутов.
  • Реализация полноценного режима деградации: «Яндекс.Такси» продолжает быстро расти, и нам нужно быть готовыми к существенному увеличению нагрузки.
  • Проектирование архитектуры и дизайна сервиса с учетом продуктовых требований.

Условия

  • ДМС, пожалуй, лучший на рынке: для сотрудников бесплатный, для членов семьи «Яндекс» компенсирует 80% стоимости страхового полиса.
  • Завтраки и полдники в офисе, компенсация питания в ближайших кафе и ресторанах.
  • Беспроцентная ссуда на покупку или ремонт жилья.
  • Частичная компенсация обучения иностранному языку.
  • Поездки на специализированные конференции в качестве как слушателей, так и докладчиков.
  • Мощная команда специалистов, с которой можно расти.

Дополнительно

С каждым днем мы решаем всё больше прикладных задач, наше проникновение в различные сферы бизнеса и наше влияние на них растет, также растет и использование нашего сервиса машинного обучения: Machine Learning as a Service (MLaaS).

Прямо сейчас MLaaS существует в виде двух реализаций: первая написана на C++ и нужна для продакшн-задач с высокими требованиями к производительности, вторая написана на Python и служит для быстрого прототипирования, а также для проектов с небольшим количеством запросов в секунду (RPS). У нас много требований к этим сервисам, мы хотим их улучшать и развивать.

Откликнуться

Резюме на почту cv_taxi@yandex-team.ru

Также укажите, что узнали о вакансии в телеграм-канале Your Job

November 14, 2018