Data Scientist (КЦ) Middle, удаленно, РФ
- Умеет оценивать сложность алгоритмов
- Знает алгоритмы и структуры данных из стандартного курса
- Знает оценку сложности структур из для стандартной библиотеки
- Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах ТВиМС
- Предельные теоремы и умение их применять проверка гипотез бутстреп A/B-тесты variance reduction causal inference ML
- Понимает ML-алгоритмы и методы в области.
- Эффективно адаптирует их для решения задач при необходимости.
- Строит модели из стандартных компонент.
- Понимает шаги жизненного цикла ML-разработки и их взаимодействие в проекте, при необходимости изменяет существующий дизайн.
- Понимает, какие бизнес-метрики для модели нужно мониторить
- Может предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками
- Может докатить простую модель в пилот имплементировать метод по статье встроить компонент в существующий пайплайн
- Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее). MLOps
- Разово может зафиттить модель, по запросу проверить, жива ли она, обновить развернуть какое-либо необходимое ПО в кластере версионирование моделей, данных мониторинг работы моделей, качества данных SQL
- Простые запросы (select'ы/группировки и т.д.)
- Окна Оптимизация запросов Engineering
- Переводит идеи в чистый код, который будут и исполнять, и читать
- Способен разбираться в чужом коде и эффективно его дебажить Базовое понимание всех компонентов архитектуры
- Использование лучших практик разработки DB&BD
- Промышленный опыт работы с несколькими системами
- Знание внутреннего устройства систем, используемых в работе оптимизация вычислений/запросов транзакции/ACID/
- Индексы Other Может декомпозировать понятные задачи
- Самостоятельно находит решение или использует существующие подходы для понятных задач
- Разработка кода и тестов на python, участие в командной разработке, участие в код-ревью - Проработка и изменение дизайна существующих компонент при необходимости
- Подготовка и валидация обучающих выборок данных для внедрения и сопровождения математических моделей продуктов больших данных
- Расчет результатов АБ-тестов, дизайн АБ-тестов
- Внедрение современных методов машинного обучения и анализа данных в продуктах больших данных
- Разворачивание моделей и сервисов в контуре х5 (hadoop/k8s/airflow)
- Написание запросов на SQL, оптимизация запросов (spark, в частности)
- Предлагает идеи для улучшения модели/подхода
- Предлагает прокси-метрики и функции потерь, связанные с бизнес-метриками
- Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных.
- Техническая реализация data-science решений на продуктах департамента.
- Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных.
- Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных.
✅Если вам интересна данная позиция и у вас есть необходимый опыт - пишите и присылайте резюме сюда: https://t.me/Ekaterina_helps_you_bot
💡Наш канал с полезным контентом: https://t.me/GO_TO_IT_chatroom
✅ Канал с вакансиями: https://t.me/GO_TO_IT_jobs