July 23, 2023

Урожай опенсорсных LLM 🤖

🏦Вот и Сбер выкатил в открытый доступ свой ruGPT-3.5 под лицензией MIT с разрешением использования для коммерческих целей. Утверждают, что никаких подвохов, как в LlaMa 2 нету (а они там все же есть).

У модельки 13 миллиардов параметров, 90% обучающей выборки на русском языке, 10% - на английском. Также можно дообучать на своих данных.

Модель лежит в основе GigaChat, который уже довольно давно после релиза недоступен, там всё что-то допиливают. Это хорошо, потому что в первые дни работал ужасно, меня совсем не впечатлило, особенно при работе с кодом.

👉🏻Можно поиграться в Colab (но качество будет хуже).

Больше конкуренции по моделькам - всем хорошо 🌚

PythonTalk в Telegram

Чат PythonTalk в Telegram

Предложить материал | Поддержать канал