November 26, 2018

Siri, Алиса, познакомьтесь, это Furhat и AlterEgo и они будут работать с вами

Новые разработки в сфере голосовых консультантов.

С тех пор как Христиан Готлиб Кратценштейн в 1779 году создал прототип синтезатора речи прошло не мало времени. Но именно это изобретение стало одной из отправных точек гонки технологических разработок в области развития виртуальных ассистентов. И если бы сейчас этому талантливому современнику Ломоносова дали пообщаться с «Алисой» - он бы воскликнул что-то вроде «das ist fantastisch!» Наши современники воспринимают, подобные разработки значительно сдержаннее и с большой долей скепсиса –мы привыкли к технологическому буму.

Но не смотря на нашу «сытость» инновационными продуктами мы с уверенностью можем сказать, что сегодняшний уровень развития голосовых помощников далек от идеала. Осознание несовершенства продукта дает огромный стимул разработчикам продолжать движение к заветной цели. И как вы уже понимаете, каждый это движение осуществляет с разной скоростью и разными дорогами. В этом «забеге» большое количество участников и такие «марафонцы» как: GoogleAssistant, Siri, Amazon Alexa, Microsoft Cortana, Алиса – это пелатон забега. Но тем и хорош этот техно марафон, что присоединится к нему может любой и на любом этапе. Каждый может попытать счастье и даже постараться навязать свой характер игры.

Вы что-то сказали?

Один из таких «выскочек» был создан в стенах Массачусетского технологического института (MIT). Разработке было присвоено имя AlterEgo. Эта система позволяет «разговаривать» с цифровыми устройствами, не произнося при этом ни слова.

Принцип работы интерфейса построен на явлении субвокализации - мысленном проговаривании текста. Когда человек обдумывает предложение которое он желает произнести, мозг посылает мышцам определённые сигналы о том, что его нужно произнести. Эти самые нервно-мышечные сигналы и сканирует система. За непосредственное сканирование сигнала отвечает гарнитура, в которой вместо микрофона встроены электроды.

Гарнитура через канал Bluetooth соединена с компьютером который передает сканированную информацию на сервер, где уже установленное программное обеспечение интерпретирует сигналы в человеческую речь. Встроенные в туже гарнитуру наушники с костной проводимостью транслируют звук, во внутреннее ухо.

Автор проекта Арнав Капур, аспирант MIT Media Lab - подчеркивает, что интерфейс нельзя воспринимать как устройство для чтения мыслей - это нечто пограничное между мыслью и речью. Ядром системы разработчики называют нейронную сеть, а также процесс ее обучения интерпретации сигнала в слово. На сегодняшний день проект работает на уровне прототипов

Голос обретает лицо.

Второй новичок забега заявил о себе на WebSummit в Лиссабоне. Одним из явных недостатков голосовых помощников является их безликость. Побороться с этим вызвался амбициозный стартап Furhat Robotics. Разработчики решили, что искусственный интеллект без лица – это диссонанс и создали роботизированный бюст составляющими элементами которого является собственно голова и смарт –колонка голосового помощника.

В отличии от обычного статичного бюста, голова Furhat подвижна, в теменной части головы расположен проектор, который транслирует на переднюю прозрачную часть робота изображение человеческого лица. Furhat способен повторять значительный список человеческих эмоций. В основании робота встроена камера, которая следит за положением лица собеседника. Она отвечает за поддержание контакта с человеком и адекватного реагирования на происходящее.

Furhat весьма многолик. Разработчик предоставляет возможность использовать как уже готовые маски, так и создавать свои собственные. При смене маски персонаж будет меняться автоматически.

Стоимость продукта разработчики не указывают, объясняя это тем, что каждый Furhat индивидуален в своих навыках, и цена будет зависеть от варианта использования. Furhatrobotics утверждает, что сферы использования Furhat безграничны – вы можете задавать вопросы, проводить собеседования, тренировать навыки, играйте в игры или узнавайте что-то новое. Список возможных вариантов использования бесконечен.

Безусловно, эти стартапы внесут свою лепту в процесс эволюции голосовых ассистентов. Многие специалисты делают ставку на то, что именно «голосу» суждено стать фундаментом интерфейса приложений будущего.

Не забудьте подписаться на канал и поставить лайк! Мы в telegram: https://t.me/tech_wrld.

А так же, уважаемые подписчики! Наш канал нуждается в аудитории, мы просим вас порекомендовать наш канал своим друзьям и знакомым!