В OpenAI представлена Audio API, которая позволяет генерировать аудио из текста и распознавать его.
Embeddings (векторные представления текста) обычно используют для измерения связанности текстовых строк ...
YandexGPT (YaLM 2.0) — это большая языковая модель нового поколения. Она разработана и обучена компанией «Яндекс» на десятках миллионов текстов из интернета, а также на тысячах ответов, подготовленных AI-тренерами. Нейросеть способна обрабатывать запросы пользователей и отвечать на них в текстовом виде или голосом от лица «Алисы».