DEV
July 21

Senior Backend Developer

🆔DEV-583

📝 Краткое описание

  • Грейд: Senior
  • Ставка: 1 650 руб/ч
  • Локация: Любая
  • Длительность проекта: 12 месяцев
  • Краткое описание: интеграция LLM API, разработка RAG-систем, чат-ботов, настройка инфраструктуры и оптимизация вызовов LLM.

🎯 Требования (стек)

  • Глубокая экспертиза в Python: asyncio, threading, multiprocessing, профилирование памяти/CPU-bound задач.
  • Уверенное владение FastAPI + Pydantic v2 (асинхронная архитектура).
  • Опыт работы с базами данных: PostgreSQL, Redis, MongoDB — проектирование схем, индексация.
  • Контейнеризация: Docker, Docker Compose; базовое понимание Kubernetes.
  • Опыт настройки очередей сообщений: RabbitMQ, Kafka; Celery — retry-логика, dead-letter очереди.
  • Навыки быстрого прототипирования интерфейсов (HTMX/Bootstrap/Streamlit).
  • Способность быстро собирать MVP за короткое время.
  • Самостоятельность в постановке задач и выборе архитектурных решений.

Будет плюсом:

  • Работа с LLM API (OpenAI, Claude), кастомизация промптов.
  • Построение RAG-систем: выбор векторных БД и графов знаний.
  • Работа с ML-инфраструктурой: TorchServe, Triton Inference Server.
  • Знание MLOps инструментов: MLflow, Weights & Biases.

📌 Описание вакансии

О проекте: разработка решений на основе LLM, интеграция внешних API, создание чат-ботов и интеллектуальных систем.
Описание роли: интеграция LLM API, настройка RAG-систем, прототипирование интерфейсов, оптимизация вызовов и инфраструктуры.
Основные задачи:

  • Интеграция сторонних LLM API (OpenAI, Claude, DeepSeek) и кастомизация промптов.
  • Построение систем Retrieval-Augmented Generation (RAG).
  • Разработка чат-ботов и ассистентов с цепочками вызовов, памятью, fallback-механизмами.
  • Оптимизация стоимости вызовов LLM, работа с streaming и function calling.
  • Создание прототипов MVP интерфейсов (HTMX/Bootstrap/Streamlit).
  • Настройка инфраструктуры: интеграция API, настройка кешей, очередей.
  • Работа с векторными БД (FAISS, Pinecone) и графами знаний.
  • Внедрение квантования моделей и fallback на локальные модели GPT.
  • Мониторинг метрик и логирование работы систем.

📩 Присылайте CV + данные по кандидату:
● ФИО
● Страна + Город
● Дата рождения
● Грейд
● Ставка
● Дата, с которой готов приступить к работе
● Оценить требования ДА/НЕТ, в соответствии с наличием опыта
● Все требования с ответом "ДА" должны иметь отражение в CV кандидата

Вопросы и предложения ➡️ @Pro_test_Studi. Указать 🆔 запроса.