Инфраструктура
November 11, 2024

Data Scientist (КЦ) Middle, удаленно, РФ

ID 001-015

✅ Грейд: Middle

✅ Формат работы: удаленно

✅ Локация: Рф

Что мы ожидаем от кандидата

- Умеет оценивать сложность алгоритмов

- Знает алгоритмы и структуры данных из стандартного курса

- Знает оценку сложности структур из для стандартной библиотеки

- Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах ТВиМС

- Предельные теоремы и умение их применять проверка гипотез бутстреп A/B-тесты variance reduction causal inference ML

- Понимает ML-алгоритмы и методы в области.

- Эффективно адаптирует их для решения задач при необходимости.

- Строит модели из стандартных компонент.

- Понимает шаги жизненного цикла ML-разработки и их взаимодействие в проекте, при необходимости изменяет существующий дизайн.

- Понимает, какие бизнес-метрики для модели нужно мониторить

- Может предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками

- Может докатить простую модель в пилот имплементировать метод по статье встроить компонент в существующий пайплайн

- Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее). MLOps

- Разово может зафиттить модель, по запросу проверить, жива ли она, обновить развернуть какое-либо необходимое ПО в кластере версионирование моделей, данных мониторинг работы моделей, качества данных SQL

- Простые запросы (select'ы/группировки и т.д.)

- Окна Оптимизация запросов Engineering

- Переводит идеи в чистый код, который будут и исполнять, и читать

- Пользуется git'ом

- Пишет тесты

- Способен разбираться в чужом коде и эффективно его дебажить Базовое понимание всех компонентов архитектуры

- Использование лучших практик разработки DB&BD

- Промышленный опыт работы с несколькими системами

- Знание внутреннего устройства систем, используемых в работе оптимизация вычислений/запросов транзакции/ACID/

- Индексы Other Может декомпозировать понятные задачи

- Самостоятельно находит решение или использует существующие подходы для понятных задач

Обязанности

- Разработка кода и тестов на python, участие в командной разработке, участие в код-ревью - Проработка и изменение дизайна существующих компонент при необходимости

- Подготовка и валидация обучающих выборок данных для внедрения и сопровождения математических моделей продуктов больших данных

- Расчет результатов АБ-тестов, дизайн АБ-тестов

- Внедрение современных методов машинного обучения и анализа данных в продуктах больших данных

- Разворачивание моделей и сервисов в контуре х5 (hadoop/k8s/airflow)

- Написание запросов на SQL, оптимизация запросов (spark, в частности)

- Предлагает идеи для улучшения модели/подхода

- Предлагает прокси-метрики и функции потерь, связанные с бизнес-метриками

- Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных.

- Техническая реализация data-science решений на продуктах департамента.

- Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных.

- Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных.

✅Если вам интересна данная позиция и у вас есть необходимый опыт - пишите и присылайте резюме сюда: https://t.me/Ekaterina_helps_you_bot

💡Наш канал с полезным контентом: https://t.me/GO_TO_IT_chatroom

✅ Канал с вакансиями: https://t.me/GO_TO_IT_jobs