September 2
Опыт работы
Точка - Создание собственной LLM / Автовалидатор LLM / обучение RAG
- Сделал валидацию LLM-моделей и делаю alignment в R&D отделе Точки.
- Разработал ML System Design моделей валидации ответа LLM: постановка задачи, сбор натуральных и синтетический данных, обучение и схема валидации LLM-модели, деплой деплой-LLM.
- Обучил e5 на задачах классификации и NER на синтетических данных, собранных с помощью API OpenAI и проверенных с помощью G-Eval и копирайтеров. Имплементировал разные функции потерь: diceloss, focal-loss, weighted-CEL, что позволило увеличить ROC-AUC с 0.8 до 0.9
- Обучил Starling-7b с помощью ORPO метода.
Сбер - обучение GIgaChat / Reward-модели NLP Data Scientist
- Сделал модель для генерации СМС с номера 900, для пушей с продуктов Сбера, а также генерацию email`ов для рассылки писем. личить качество генерации модели с map = 0.47 до map = 0.76.
- Сделал pre-train с помощью p-tuning и сделал sft с помощью LoRA (loralib) анализ, что позволило выбрать оптимальную модель. Обучал модели на задаче классификации (BCE, CEL), ранжирования (PairWise-loss, ListWise-loss)
- Разработал модель ранжирования (Reward-Model) для генеративной модели (GigaChat), что помогло уве-
- Обучал GigaChat для генерации email`ов с помощью p-tuning и LoRA.
- Работал с такими моделями как: GigaChat, FRED-T5, ruGPT-3.5, SBERT, также проводил их качественный
- Разработал пайплайн дообучения модели на основе метода-RLHF для более качественного инференса модели
Газпром ИД - NLP / RecSys Research NLP Researcher Engineer
- Проводил исследования в области Recommendation Systems и NLP, предлагая SOTA-решения для нашей платформы.
- Делал собственные бенчмарки над внутренними данными для определения более подходящей языковой модели.
- Построил адаптивный алгоритм предобработки данных для будущих языковых моделей и алгоритмов, работающих с текстом
- Выполнил задачу Topic Modeling с помощью нейросетевых подходов (BertTopic, CTM, LDA)- Работал с LLM и мультимодальными моделями (MiniGPT-4, T5, BART, BLIP2, QWEN-VL) Стек технологий: PyTorch, SentenceTransformers, Transformers, hyperopt, BertTopic, CTM, PostgreSQL
DSM Group - Machine Learning Engineer / Data Analyst
- Автоматизировал бизнес задачи внутри компании путём решения NLP задач и задач матчинга, что позволило сократить расходы на 30%
- Работал с базой данных PostgreSQL (JOIN, Оконные функции), предобработка большого массива данных (23 млн строк)
- Проводил обучение эмбеддингов корпусов слов на основе TF-IDF, FastText, BM25+, BERT, LaBSE, SBERT, RoBERT
- Использовал косинусную близость для формирования тестовой выборки (FAISS)
- Обучал и перебирал модели машинного обучения, а также нейросетевые алгоритмы (catboost, xgboost, sklearn, pytorch)