July 23, 2023
Урожай опенсорсных LLM 🤖
🏦Вот и Сбер выкатил в открытый доступ свой ruGPT-3.5 под лицензией MIT с разрешением использования для коммерческих целей. Утверждают, что никаких подвохов, как в LlaMa 2 нету (а они там все же есть).
У модельки 13 миллиардов параметров, 90% обучающей выборки на русском языке, 10% - на английском. Также можно дообучать на своих данных.
Модель лежит в основе GigaChat, который уже довольно давно после релиза недоступен, там всё что-то допиливают. Это хорошо, потому что в первые дни работал ужасно, меня совсем не впечатлило, особенно при работе с кодом.
👉🏻Можно поиграться в Colab (но качество будет хуже).
Больше конкуренции по моделькам - всем хорошо 🌚