Today

Data Scientist Middle+

Remote | 270 - 300 т.р. Гросс

🔎Data Scientist Middle+ ❇️ |агентство TopSelection

💰Зарплата: 270-300К руб/мес.Гросс
🎯Локация/гр.: Россия
🕰Срок проекта: 3 месяца +
📄Оформление: только ИП
🏛Проект: Крупная ритейл компания.

Обязательные требования:
- Опыт работы от 4-х лет в аналогичной роли;

Алгоритмы и структуры данных:
- Умение оценивать сложность алгоритмов;
- Знание алгоритмов и структур данных из стандартного курса; - Знаком с оценкой производительности стандартных библиотечных структур данных;
- Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах.

Теория вероятности и математической статистики:
- Предельные теоремы и умение их применять;
- Опыт проверки гипотез, знание бутстреп и A/B-тестов, а так же снижение дисперсии и выявление причинно-следственных связей.

Машинное обучение (ML):
- Понимание ML-алгоритмов и подходов;
- Умение эффективно адаптировать их для решения задач при необходимости;
- Умение строить модели из стандартных компонентов;
- Понимание последовательности этапов разработки ML-решений и готовность вносить изменения в проектную архитектуру;
- Понимание какие бизнес-метрики для модели нужно мониторить;
- Умение предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками;
- Умение докатить простую модель в пилот, имплементировать метод по статье, встроить компонент в существующий пайплайн.
- Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее).

Операции с моделями (MLOps):
- Умение разово зафиттить модель, по запросу проверить, жива ли она, обновить и развернуть какое-либо необходимое ПО в кластере;
- Умение версионирования моделей, данных и мониторинг работы моделей, качества данных.

SQL:
- Простые запросы (выборки, группировки, оконные функции);
- Опыт оптимизации запросов.

Программирование и инженерия:
- Умение перевести идеи в чистый код, который будут и исполнять, и читать;
- Умение пользоваться git'ом;
- Умение писать тесты;
- Способность разбираться в чужом коде и эффективно его дебажить;
- Базовое понимание всех компонентов архитектуры.

Работа с БД и большими данными (DB & BD):
- Промышленный опыт работы с несколькими системами;
- Знание внутреннего устройства систем, используемых в работе;
- Опыт оптимизации вычислений/запросов транзакции/ACID/Индексов.

-Умение декомпозировать понятные задачи;
- Самостоятельно находить решение или использовать существующие подходы для понятных задач.
Дополнительные стек и требования

Задачи:
- Разработка кода и тестов на python, участие в командной разработке, участие в код-ревью;
- Проработка и изменение дизайна существующих компонентов при необходимости;
- Подготовка и валидация обучающих выборок данных для внедрения и сопровождения математических моделей продуктов больших данных;
- Расчет результатов АБ-тестов, дизайн АБ-тестов;
- Внедрение современных методов машинного обучения и анализа данных в продуктах больших данных;
- Разворачивание моделей и сервисов в контуре компании (hadoop/k8s/airflow);
- Написание запросов на SQL, оптимизация запросов (spark, в частности);
- Предлагать идеи для улучшения модели/подхода;
- Предлагать прокси-метрики и функции потерь, связанные с бизнес-метриками;
- Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных;
- Техническая реализация data-science решений на продуктах департамента;
- Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных;
- Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных.

📲 Как откликнуться:
Отправляйте своё резюме @AllaDemHR