Backend
March 16
ID 3468. Software Engineer
Ставка: рассмотрим ваши ставки. Рекомендуемая 50 $/h (*указывайте в форме ставку с налогами)
Локация: любая (кроме РФ/РБ, Аравийский полуостров, Египет, Иран, Ирак, Левант и Турцию, Украина, Северная Корея)
Требования
- Более 5 лет опыта промышленной разработки бэкенд-систем и API на Python.
- Опыт проектирования и эксплуатации распределённых микросервисов (масштабируемость, маршрутизация, кэширование, обработка отказов).
- Практический опыт работы с AWS и опыт интеграции внешних API моделей (сегодня мы преимущественно обращаемся к фундаментальным моделям через Bedrock).
- Опыт промышленной эксплуатации сервисов в Kubernetes (вы будете отвечать за развёртывание и эксплуатацию приложений; инфраструктура кластера поддерживается платформой).
- Опыт работы с CI/CD (требуется знание GitHub Actions).
- Понимание IAM и основ безопасности в облаке (принцип наименьших привилегий, служебные роли).
- Понимание логирования и наблюдаемости (структурированные журналы, метрики, трассы) и умение проектировать конвейеры для последующего анализа.
- Опыт работы с Terraform или другими инструментами инфраструктуры как кода (IaC).
- Опыт работы с интеграцией GenAI и LLMs (Bedrock, маршрутизация API, выбор моделей).
- Опыт работы с конвейерами обработки изображений и документов (OCR, предобработка изображений, распознавание технических чертежей).
- Опыт работы с паттернами оркестровки выводов (асинхронные работники, батчинг, оркестровка GPU) или знакомство с нагрузками на GPU.
- Знакомство с инструментами жизненного цикла ML (MLflow, регистры моделей, трекинг экспериментов).
- Опыт работы с сервисами реального времени и пакетной обработки выводов, хранилищами признаков или опытом использования производственной среды SageMaker.
Краткое описание задач:
- Проектировать и разрабатывать микросервисы и API для интеграции генеративного искусственного интеллекта (GenAI) с моделью Bedrock от AWS.
- Создавать масштабируемые стратегии маршрутизации запросов, кэширование и очереди для вывода (способность выдерживать всплески нагрузки).
- Реализовывать CI/CD и механизмы наблюдения за состоянием конвейеров вывода (логирование, метрики, оповещения).
- Развёртывать и эксплуатировать сервисы в Kubernetes (развёртывание, выкатка, проверка здоровья; администрирование кластера обеспечивается платформой/SRE).
- Интегрировать сервисы с AWS и обеспечивать правильные разрешения доступа (IAM) для межсервисного взаимодействия.
- Сотрудничать с учеными по данным и инженерами машинного обучения (они отвечают за обучение моделей; вы за интеграцию в производство).
- Формировать производственные практики эксплуатации вывода (детали задач дежурства будут уточняться; ожидается поддержка реакций на инцидент на уровне службы).
Тип работ: outstaff / fulltime
Допустимый часовой пояс (UTC): GMT+1 (+- 4 часа)
Для рассмотрения специалиста необходимо заполнить форму