Опыт работы

Точка - Создание собственной LLM / Автовалидатор LLM / обучение RAG

Сделал валидацию LLM-моделей и делаю alignment в R&D отделе Точки.
Разработал ML System Design моделей валидации ответа LLM: постановка задачи, сбор натуральных и синтетический данных, обучение и схема валидации LLM-модели, деплой деплой-LLM.
Обучил e5 на задачах классификации и NER на синтетических данных, собранных с помощью API OpenAI и проверенных с помощью G-Eval и копирайтеров. Имплементировал разные функции потерь: diceloss, focal-loss, weighted-CEL, что позволило увеличить ROC-AUC с 0.8 до 0.9
Обучил Starling-7b с помощью ORPO метода.

Сбер - обучение GIgaChat / Reward-модели NLP Data Scientist

Сделал модель для генерации СМС с номера 900, для пушей с продуктов Сбера, а также генерацию email`ов для рассылки писем. личить качество генерации модели с map = 0.47 до map = 0.76.
Сделал pre-train с помощью p-tuning и сделал sft с помощью LoRA (loralib) анализ, что позволило выбрать оптимальную модель. Обучал модели на задаче классификации (BCE, CEL), ранжирования (PairWise-loss, ListWise-loss)
Разработал модель ранжирования (Reward-Model) для генеративной модели (GigaChat), что помогло уве-
Обучал GigaChat для генерации email`ов с помощью p-tuning и LoRA.
Работал с такими моделями как: GigaChat, FRED-T5, ruGPT-3.5, SBERT, также проводил их качественный
Разработал пайплайн дообучения модели на основе метода-RLHF для более качественного инференса модели

Газпром ИД - NLP / RecSys Research NLP Researcher Engineer

Проводил исследования в области Recommendation Systems и NLP, предлагая SOTA-решения для нашей платформы.
Делал собственные бенчмарки над внутренними данными для определения более подходящей языковой модели.
Построил адаптивный алгоритм предобработки данных для будущих языковых моделей и алгоритмов, работающих с текстом
Выполнил задачу Topic Modeling с помощью нейросетевых подходов (BertTopic, CTM, LDA)- Работал с LLM и мультимодальными моделями (MiniGPT-4, T5, BART, BLIP2, QWEN-VL) Стек технологий: PyTorch, SentenceTransformers, Transformers, hyperopt, BertTopic, CTM, PostgreSQL

DSM Group - Machine Learning Engineer / Data Analyst

Автоматизировал бизнес задачи внутри компании путём решения NLP задач и задач матчинга, что позволило сократить расходы на 30%
Работал с базой данных PostgreSQL (JOIN, Оконные функции), предобработка большого массива данных (23 млн строк)
Проводил обучение эмбеддингов корпусов слов на основе TF-IDF, FastText, BM25+, BERT, LaBSE, SBERT, RoBERT
Использовал косинусную близость для формирования тестовой выборки (FAISS)
Обучал и перебирал модели машинного обучения, а также нейросетевые алгоритмы (catboost, xgboost, sklearn, pytorch)

Karpov/Courses - Ментор студентов StartML

Менторил студентов Karpov/Courses, объясняя им Classic ML, Deep Leaning и математическую статистику, помогал решать задачки по DS, проводил мок-интервью и проводил их до первого оффера.