Год выбирали одно слово: как бывший менеджер «Яндекса» разрабатывал для «Сбера» семейство голосовых помощников
Одной из главных новинок, представленных на нашумевшей конференции обновленного «Сбера», стало семейство голосовых помощников и гаджеты под собственным брендом, в которых «живут» ассистенты. Кто стоял за разработкой нестандартного для «Сбера» направления, при чем здесь сериал «Теория большого взрыва» и зачем это нужно госбанку?
«Чей Крым?» — спрашивает глава SberDevices Константин Круглов у «Джой», виртуального ассистента «Сбера». «Честно говоря, я не эксперт в этом вопросе», — отвечает «Джой». «Каждый ассистент в своей манере, но соскакивает с таких тем. «Алиса» из «Яндекса» раньше говорила, что Крым ваш», — вспоминает он.
Именно Круглов стоит за созданием гаджетов и голосовых помощников «Сбера», представленных в октябре на широко обсуждаемой конференции госбанка. Он же до этого возглавлял разработку голосового помощника «Яндекса» «Алисы» и его первого устройства — умной колонки «Яндекс.Станции».
По словам Круглова, самая сложная задача в этом деле — обучить виртуальных ассистентов обходить острые темы: не ругаться матом, не комментировать геополитические конфликты или национальные вопросы. По его словам, «таких тем сотни тысяч» и на каждую нужно предусмотреть корректные ответы. «Спросить пользователи могут что угодно. Я однажды увидел поисковые запросы, и стало страшно жить, я тогда поседел», — рассказывает он.
Как бывший менеджер «Яндекса» убедил правление «Сбера» в том, что банку нужны голосовые ассистенты, и через что пришлось пройти его команде по пути к запуску?
Равнение на Алексу
В 2017 году Сбербанк утвердил новую стратегию, согласно которой за три года он должен трансформироваться в универсальную технологическую компанию и «конкурировать не с кредитными организациями, а с такими ИТ-гигантами, как Google, Amazon или Alibaba». Кроме того, в 2018 году глава госбанка Герман Греф объявил, что Сбербанк поменяет название на «Сбер», поскольку перерос понятие «банк».
В феврале 2019 года в Сбербанк пришел Константин Круглов, до этого три года проработавший в «Яндексе» директором по экспериментальным продуктам. В Сбербанке он получил должность директора департамента управления данными (SberData). «Мне показалось, что я смогу заниматься тем же самым, но на большем масштабе, — и я не ошибся», — объясняет он причины ухода из «Яндекса». В компании увольнение Круглова не комментируют.
Нанимали Круглова не для того, чтобы заниматься голосовыми помощниками, а на другую задачу. Придя в корпорацию, менеджер увидел, что у Сбербанка «есть все для создания ассистентов, но никто этим не занимается всерьез». По собственным словам, на заседании правления госкомпании он заявил, что может решить для банка более важную задачу и готов построить новый канал коммуникации с клиентом на базе виртуальных помощников и устройств на их основе.
Интерес потребителей к ассистентам растет, и их можно сделать основой нового канала взаимодействия — устройства с голосовыми помощниками могут предоставлять потребителю доступ к разным сервисам «Сбера». В качестве успешного примера такой системы он привел экосистему американской Amazon, у которой, как и у Сбербанка, нет поисковой страницы, но есть ассистент Алекса.
Круглов отказался раскрыть размер инвестиций, которые потребовались для разработки этих устройств, но отметил, что «сумма была большая, а срок окупаемости измеряется годами». Инвестиции только в разработку голосовых помощников топ-менеджер крупной IT-компании оценивает в десятки миллионов долларов. «Очень условно на создание «сферического помощника в вакууме» потребуются десятки программистов и несколько лет работы, в деньгах это $5-20 млн», — оценивает Александр Горный, сооснователь United Investors, в прошлом директор по стратегии и анализу Mail.Ru Group. Сложность подсчета инвестиций на такие разработки заключается в том, что они, как правило, базируются на уже существующих технологиях в компании, поясняют участники рынка. Например, у Сбербанка есть наработки ее «дочек» — Центра речевых технологий (занимается распознаванием речи) и VisionLabs (распознавание изображений, машинное обучение).
Помощники для Грефа
Круглов начал собирать команду и писать концепцию помощников и устройств, в которых помощники должны «жить». Какие именно гаджеты задумывались на этом этапе, менеджер не раскрывает. Итоговую концепцию правление Сбербанка одобрило в мае 2019 года. По словам Круглова, «было несколько итераций», после чего он получил «почти полную самостоятельность».
С главой Сбербанка Германом Грефом, который «активно участвует в работе», Круглов встречается раз в полтора месяца: «Смотрим и обсуждаем, что уже сделано, уточняем траекторию дальнейшего движения. Я показываю сделанное не только на слайдах. Первое время показывал микросхемы, напечатанные на 3D-принтере образцы, видеоролики. Сейчас проводим лайф-демо».
Под проект к концу 2019 года создали новую «дочку» — компанию SberDevices, которая изначально была подразделением внутри банка. Компания производит «умные» устройства: как говорится на сайте, «B2B- и B2C-девайсы для экосистемы с применением речевых технологий и виртуальным ассистентом на борту». Гендиректором стал Максим Малежин, который до этого был исполнительным директором блока «Технологии» отдела стратегии развития технологий Сбербанка. Круглов же возглавляет бизнес-юнит внутри «Сбера», который отвечает за развитие технологий. В этот юнит, помимо SberDevices, входят другие IT-структуры банка.
Круглов создавал команду с нуля. Сейчас в SberDevices работает более 600 человек. Часть людей перешла из структур самого банка, например из его IT-«дочки» «Сбертеха». «Я прошелся по банку, посмотрел, где есть экспертиза», — поясняет Круглов. Часть людей пришла «снаружи»: это в том числе бывшие сотрудники Mail.Ru Group, Тинькофф Банка, «Яндекса», «Лаборатории Касперского».
«Они на протяжении многих лет переманивают IT-сотрудников. Благодаря Сбербанку зарплаты [на рынке] сильно повысились», — говорит топ-менеджер одной из крупных IT-компаний.
Салют, Сбер
Изначально помощник должен был быть один, и одной из задач в процессе разработки было выбрать ему имя. «Название рождалось в муках, — вспоминает Круглов. — Устраивали множество встреч, штормили внутри, привлекали внешние креативные агентства». Постепенно пришли к мультиперсонажности — созданию не одного, а трех ассистентов с разными характерами. «Как ни странно, дать три имени оказалось проще», — говорит он.
Прототипами виртуальных ассистентов, которых назвали «Сбер», «Джой» и «Афина», стали три персонажа сериала «Теория большого взрыва» (Шелдон, Пенни, Леонард соответственно. — Forbes). Персонаж «Сбер» серьезный и похож на бренд. «Афина» — уважительная, правильная и про финансы. «Джой» — молодежная, болтливая и обращается на «ты». Позже они «чуть развились» и в финальные характеристики — библию персонажей — этот факт не вошел.
Год в Сбербанке придумывали споттер — слово для активации ассистентов. К нему предъявляется много требований. Слово-активатор должно просто произноситься, легко запоминаться, не быть сильно распространенным в обиходной речи и не являться частью популярных слов и выражений. Было много разных вариантов: Друг, Сбер и т. д.
Слово «Салют!» предложил Денис Филиппов — руководитель направления разработки речевых технологий, ассистентов и NLP. «Внутри офиса Сбербанка есть зона со стендом, на котором написано «привет» на разных языках. Он увидел «салют», и у него сработал триггер, — рассказывает Круглов. — Он мне написал в мессенджере, и я сразу загорелся». В итоге правление на голосовании из примерно 10 вариантов выбрало вариант «Салют!». По словам собеседника Forbes, знакомого с ходом голосования, это слово Грефу изначально не очень нравилось и он голосовал за «Сбер».
Укрощение Афины
Самый большой пласт работы — обучение помощников на базе бигдаты. При этом нужно соблюсти баланс между понятиями IQ (функциональными навыками ассистента) и EQ (способностью поддержать разговор с пользователем, вызвать эмоции, проявить эмпатию). Это соотношение всегда разное: у помощника Google, например, почти нет EQ-составляющей, а у Xiaomi, наоборот, больше развита как раз она. Круглов вспоминает, как сотрудники Xiaomi рассказывали ему, что один из пользователей болтал с их ассистентом 25 часов подряд.
Где-то нейронная сеть сама сочиняет ответ, а где-то берет фразу из огромных датасетов. И поскольку искусственный интеллект синтезирует фразу по своему усмотрению, есть большой риск, что он сочинит что-то неполиткорректное или оскорбительное, говорит Круглов. Он вспоминает, что однажды в процессе обучения ассистент начала сильно материться. Чтобы избежать подобных происшествий, наняли целую команду, которая провоцировала ассистентов и пыталась вывести их на некорректные ответы, а потом «фиксила эти баги». «Мы могли бы закрутить все гайки, но предпочли выявлять узкие места, чтобы зажимать свободу ответа на острые темы, при этом дать свободу для ответов в нечувствительных темах. Например, если спросить «Джой» не про политику, а про то, какое вино она предпочитает — белое или красное, то она разговорится», — объясняет менеджер.
Казус длинного ногтя
К финальному этапу разработки помощников концепция гаджетов, внутри которых их планировали поселить, сильно изменилась. От создания нескольких устройств пришлось отказаться, в случае с оставшимися — изменить последовательность вывода на рынок, говорит Круглов.
На первой продуктовой конференции «Сбера» в октябре 2020-го команда Круглова представила два гаджета собственной разработки. Умную приставку для телевизора под названием SberBox, которую можно использовать как геймпад (2990 рублей по предзаказу и 3550 рублей в рознице), и внешне похожее на планшет устройство SmartPortal — по словам Круглова, первый смарт-дисплей в России (устройство еще не поступило в продажу). SberBox и SberPortal обозначают нижнюю и верхнюю границу продуктовой линейки, объясняют в «Сбере»: SberBox массовый и доступный, SberPortal — с качественной акустикой американского производителя Harman/Kardon.
Это первые гаджеты, которые корпорация выпускает на рынок под собственным брендом. До этого компания разрабатывала только продукты для внутренних нужд, а в начале 2020 года начала продавать ТВ-приставку для онлайн-кинотеатра Okko под брендом Smart Box, не ассоциирующимся со «Сбером», стоимостью 2990 рублей. В разработке еще несколько устройств. Банк не раскрывает каких.
Договариваться о производстве поехали в Китай и на Тайвань. Выбирали среди фабрик «первого эшелона», которые производят гаджеты для Google и Facebook. Контракты подписали с двумя фабриками в Китае: Pediatron, где выпускают SberBox и SmartBox, и еще одной, где делают SberPortal (ее название не раскрывают). «Для фабрик это вполне обычный проект, если не считать того, что мы взяли на себя разработку и всего софта, и электроники. Как правило, к ним приходят только с продуктовым видением, а все остальное они берут на себя», — говорит Круглов.
Производство запустили незадолго до начала пандемии. В январе и феврале все фабрики из-за введенного карантина встали, поэтому процесс затянулся. Но Сбербанк еще до обозначенных событий успел открыть в Китае, в Шэньчжэне, представительство SberDevices, поэтому процесс восстановили, как только это стало возможным. Сотрудники компании лично контролировали сборку и выпуск устройств. «По фотографиям нельзя такие вещи принимать: их надо и увидеть лично, и даже понюхать», — объясняет Круглов.
Первые тестовые образцы SberBox вышли с фабрики с маленькими царапинами на шнуре HDMI. Китайская команда «Сбера» несколько недель «пропадала на производстве, следя за каждым сантиметром сборочной линии», чтобы понять, откуда они взялись. Выяснилось, что шнур случайно царапали работники. Дело в том, что во многих странах Азии у людей, не занятых в сельском хозяйстве, есть традиция носить довольно длинные и ухоженные ногти — как символ занятости в секторе высоких технологий или сервиса, объясняет менеджер.
После этого инцидента сотрудников фабрики попросили стричь ногти покороче. «У нас свои традиции — выпускать продукт без поцарапанных шнурков», — резюмирует Круглов.
В планах компании — выпускать миллионы новых устройств ежегодно. «Мы хотим быть лидерами в России: нам предстоит конкурировать с технологичными гигантами», — утверждает топ-менеджер SberDevices. Впрочем, другие участники рынка к таким амбициям «Сбера» относятся скептически. «Им до Google как до Луны. И до «Яндекса» тоже не близко. Это просто способ рекламы», — говорит близкий к «Яндексу» собеседник Forbes. «Сбер», как и «Яндекс», управляет только своей внутренней экосистемой, в отличие от Siri или Google, которые управляют операционными iOS и Android в целом, рассуждает руководитель агентства Content Review Сергей Половников. «Поэтому ставить помощников Сбербанка и «Яндекса» в один ряд — это как сравнивать троллейбус и автобус», — заключает он.
Давай голосом
Опрос Forbes по итогам конференции показал, что рынок невысоко оценил инновационную составляющую новинок «Сбера». Но Круглов настаивает, что в каждом продукте есть свои ноу-хау.
На самой конференции он особенно подчеркивал, что при использовании ассистентов данные пользователя защищены — «Афина» слушает только слово «Салют», да и эту функцию пользователь может отключить, а также закрыть камеры на любых выпущенных «Сбером» устройствах. Любые данные «хранятся надежно, как банковская тайна», утверждал он. «Микрофон либо прослушивает речь и звуки все время, либо не слушает совсем. Микрофон не умеет включаться за несколько секунд до того, как человек произнесет слово «Салют». Поэтому он, конечно, будет находиться в режиме постоянного прослушивания», — парирует технический директор Qrator Labs Артем Гавриченков. Но юридически это не нарушает права пользователей, отмечает Гавриченков: как правило, при приобретении устройства в пользовательском соглашении указывается, что фрагменты речи могут быть отосланы на серверы компании-производителя с целью улучшения распознавания речи. «Но для чего еще далее ее будет использовать компания — вопрос к ее добросовестности», — заключает он.
Люди не очень понимают, зачем покупать устройства с голосовыми помощниками, считает собеседник Forbes в одной из крупных IT-компаний. «Например, колонки. Пока покупают любители попробовать новое. И те, у кого есть деньги», — считает он. Согласно опросу агентства Mindshare, в котором приняли участие 1600 россиян в конце 2019 года, популярность голосовых помощников велика, но реальных пользователей в России пока немного. Используют голосового помощника «Алису» всего 18,4% респондентов, но знают о ней 96% ответивших. Google Assistant используют 6,3% участников исследования, а знают о нем 67%, Siri используют 5,1% опрошенных, знают о ней 61%. В основном их используют для поездок на такси, показал опрос.
Продажи устройств интернет-вещей, к которым относятся и умные колонки, принесли «Яндексу» в третьем квартале 2020 года 827 млн рублей, следует из отчета компании — это в три раза больше, чем в третьем квартале прошлого года. Особенно сильно в общение с ассистентами вовлекаются владельцы умных домов: для многих взаимодействие через голос с телевизором, светом и прочими бытовыми вещами — самый частый сценарий использования умной колонки, говорит представитель Mail.ru Group Сергей Лучин. Статистику продаж гаджетов с помощниками в компании не раскрывают.
«Вряд ли новые продукты и сервисы приведут «Сберу» новых пользователей, но они могут привязать крепче уже существующих, заставить их пользоваться новыми возможностями экосистемы», — говорил Forbes бывший гендиректор ГК «Связной/Евросеть» Александр Малис. — Можно ли сказать, что они первые в России создали такую масштабную экосистему? Да, конечно. Но пока ее только показали на презентации».
Данных о продаже устройств пока нет: SberPortal поступит в продажу к концу 2020 года, SberBox доступен пока по предзаказу.