August 5, 2019

Команда из России запустила в США стартап Dasha. Голосовой ИИ запинается, вздыхает и делает паузы, как человек

Разработчики Dasha представили разговорный ИИ, который делает голоса роботов похожими на человеческие. Гендиректор компании считает, что через несколько лет люди будут больше разговаривать с машинами, чем друг с другом.

Нью-йоркский стартап Dasha привлек в стартовом раунде финансирования $2 млн, сообщает TechCrunch. Инвесторами выступили RTP Ventures и RTP Global. До недавнего времени компания работала в относительной скрытности, отмечает издание.

Dasha использует механизм преобразования текста, который позволяет моделировать особенности живой человеческой речи, рассказывает гендиректор и соучредитель стартапа Владислав Чернышов. К примеру, ИИ способна воспроизводить прерывистое дыхание, запинки, паузы и изменение высоты голоса.

Технология также обучена определять, с человеком какого пола она говорит, что будет полезно в сфере здравоохранения, считают в компании.

По словам Чернышова, Dasha «в несколько раз сложнее и лучше, чем [Google] Dialogflow, [Amazon] Lex, [Microsoft] Luis или [IBM] Watson». Кроме того, ИИ способен переучиваться, осваивать новые модели речевого поведения в режиме реального времени и «исправлять ошибки по мере их появления».

В команду стартапа входят 16 разработчиков, из которых все в разное время выходили в финал или полуфинал ACM ICPC — международной студенческой олимпиады по программированию. Они уверены, что сейчас нужно развивать моделирование речи ИИ, чтобы технология смогла обеспечить естественное взаимодействие между человеком и машиной.

«В какой-то момент мы будем разговаривать с роботами гораздо больше, чем друг с другом. У вас дома будут роботы, похожие на людей: ваш доктор, садовник, рабочий на складе. Рано или поздно разговорный ИИ заменит людей везде, где это позволяют технологии. И нам лучше быть первопроходцами, чем последними в этой области», — рассуждает Чернышов.

Пока Dasha сосредоточена на английском языке. При этом архитектура по большей части не зависит от языка, но требует большого количества данных, уточняют в компании.

Чернышов считает, что через несколько лет в мире будут работать 2-3 основные платформы голосового ИИ. «Через 5 лет будет очень странно вспоминать, что все компании пытались сами создать ИИ. Потому что станет очевидно — зачем тебе все это? Просто возьми Dasha — и строй что хочешь», — объясняет предприниматель.

Гендиректор компании прогнозирует, что в скором будущем около 60% бизнес-процессов будут автоматизированы с помощью ИИ. «В 2018 году только в США 30 млн человек выполняли какие-то повторяющиеся задачи по телефону. Мы можем автоматизировать эти рабочие места уже сейчас или максимум через 2 года», — добавляет Чернышов.

Ранее ученые попросили признать ИИ создателем двух изобретений — контейнера для еды и сигнальной лампочки.

Источник