August 26, 2023

Релизы нейросеток 🤖

Аж 2 громких опенсорс релиза от компании, которую нельзя называть 🌚

1️⃣ Моделька SeamlessM4T, которая умеет распознавать речь, преобразовывать её в текст и переводить на около 100 языков. И ещё создавать из текста речь на 35 языках.

🐍Код на Python открыт, ещё можно скачать набор данных для перевода, который содержит 270 часов записи речи и соответствующие ей тексты.

Прикольно, что моделька может распознавать, когда говорящий переходит с одного языка на другой и корректно это переводит.

👉🏻Демо работы в виде веб-сервиса можно попробовать здесь.


2️⃣ Моделька Code Llama (тоже опенсорсная), которая умеет исправлять и дополнять код на Python, C++, Java, PHP, Typescript, C# и Bash. Ну и писать код по текстовым запросам, конечно.

👾Разработчики заверяют, что модель демонстрирует лучшие результаты в сравнении с общедоступными LLM. Её тоже немного кастрировали, поэтому она, например, не будет писать код для взлома.

Доступно несколько вариантов, меньший из которых можно будет запустить на системе с одним графическим процессором.

🐍Код тут.

PythonTalk в Telegram

Чат PythonTalk в Telegram

Предложить материал | Поддержать канал