Голосовые тренды 2021: как речевые AI-технологии меняют жизнь и бизнес | Умные чат-боты и голосовые ассистенты для сложных бизнес-задач
  • Время чтения: 8 минут

  • Автор: Елена Ефимова

Голосовые тренды 2021: как речевые AI-технологии меняют жизнь и бизнес 

Впервые эта статья была опубликована на РБК 

Пандемия затормозила развитие многих бизнесов и целых индустрий, но только не сферу разговорного искусственного интеллекта. Глобальный рынок голосовых технологий ежегодно растет на 17,2%, говорят аналитики Meticulous Research. Ожидается, что к 2025 году его объем достигнет $26,8 млрд. По данным Just AI и Canalys, на конец 2020 года в мире будет 400 млн умных колонок и экранов, в России — более 1 млн. Доля владельцев смарт-колонок в США, по прогнозам eMarketer, по итогам 2020 года перешагнет порог в 83 млн, а в 2021 году рост лишь немного замедлится. Растущее покрытие населения смарт-устройствами увеличивает и аудиторию голосовых ассистентов — только у нас в стране, по оценке Just AI, это 52 млн пользователей. О том, как голосовые технологии изменят жизнь и бизнес уже в 2021 году, рассказывает Кирилл Петров, управляющий директор Just AI. 

 

К содержанию ↑

Изменения в интерфейсах 

Идет новая технологическая волна изменений в интерфейсах. В свое время визуальные, а позднее тач-интерфейсы изменили характер взаимодействия человека с компьютерами и машинами в целом, сформировали новые привычки и требования к коммуникации с пользователями. Сегодня то же самое происходит с разговорным UX (user experience, опыт пользователя) — вскоре он будет дополнять привычные интерфейсы практически везде, где происходит наше взаимодействие с цифровым миром. Но и это не все. Разговорные технологии будут развиваться и станут все чаще использоваться в коммуникациях между клиентом и бизнесом — на естественном языке. Например, разговорный UX будет использоваться службами поддержки крупных компаний, а также администраторами и офис-менеджерами в небольших компаниях.   

 

К содержанию ↑

Рост конкуренции 

Производителей умных колонок на российском рынке в 2020 году стало больше, а действующие игроки вывели новые модели своих девайсов. Так, Mail.ru начал продавать умную колонку «Капсула» со встроенным голосовым ассистентом Маруся, а Яндекс анонсировал Станцию Макс и сотрудничество с целым рядом производителей Smart TV. 

 

На рынок голосовых ассистентов и умных устройств вышел и Сбер, представив на умную ТВ-приставку, первый в России умный экран и первое в мире семейство голосовых ассистентов. Сбер встроил в продукты основные сервисы своей новой экосистемы, а также создал бизнес-модель для доступа независимых разработчиков к созданию навыков для этой экосистемы. Российский рынок умных колонок еще далек от насыщения, но борьба за потребителя развернулась острая. И это означает две вещи: нас ждут все более интересные сервисы и устройства, а цены на умные колонки постепенно пойдут вниз. 

 

К содержанию ↑

Ставка на экраны 

В сегменте умных колонок смарт-дисплеи занимают значимую долю. По данным Strategy Analytics, в 3 квартале 2020 года в мире было продано 9,5 млн умных экранов — это 26% от всего объема продаж колонок и на 21% больше, чем в 3 квартале 2019 года. 

 

Экран позволяет реализовать более сложную механику голосовых навыков и тем самым сделать голосовые сервисы более удобными, интересными, иммерсивными и при этом раскрыть потенциал монетизации голосового продукта. Навык для умного экрана позволяет управлять тем или иным сервисом голосом, но — в отличие от колонки — держать перед глазами множество дополнительных параметров. Это открывает новые возможности в области голосовой коммерции, видеошопинга, игр. Кроме того, в умные экраны, например, Сбера, встроена технология распознавания лиц с использованием искусственного интеллекта, а ассистентом можно управлять как с помощью голоса, так и жестов. 

 

В России продажи умных экранов только стартовали, и первым представленным устройством в категории стал SberPortal. Премиальное качество новинки и ее высокая цена оставляют свободную нишу для других игроков и более доступных моделей. 

 

К содержанию ↑

Мультимодальный подход 

Суть мультимодального подхода — в синергии визуального и голосового интерфейсов, а также тач-интерфейса, управления жестами или пультом, как в случае с умными ТВ-приставками. Тренд на мультимодальность будет усиливаться, а контент создаваться с учетом различных вариантов взаимодействия с ним пользователя. 

 

Интероперабельность 

На мировом рынке появились кейсы, когда в одном устройстве работают несколько голосовых ассистентов. Так, пользователь Facebook Portal может активировать собственного ассистента Facebook или Alexa от Amazon. 

 

Подобные кейсы скоро придут и в Россию. Возможно, это будет формат ассистентов первого и второго уровня: когда основной голосовой ассистент условно «передает слово» другому виртуальному помощнику, давая ему возможность отвечать на узкоспециализированные вопросы. Например, это может быть комбинация универсального и банковского или медицинского ассистентов. 

 

К содержанию ↑

На каждый день и все случаи жизни  

В конце 2020 года Just AI провел телефонный роботизированный опрос с использованием собственного движка NLU (natural language understanding, понимание естественного языка), а также технологий распознавания речи от Яндекс.Cloud и Тинькофф. Мы сделали 42 000 звонков пользователям популярных Android / iOS приложений и получили 1 600 анкет. Опрос охватил жителей Москвы, Петербурга, Новосибирска, Ростова-на-Дону, Нижнего Новгорода, Екатеринбурга, Казани, Красноярска и других городов страны. 

 

Выяснилось, что пользователей голосовых ассистентов стало больше. 77% опрошенных в 2020 году когда-либо пользовались голосовыми ассистентами, в 2019 году эта цифра составляла 71%. 

 

В 2020 году голосовых помощников стали использовать чаще. 32% опрошенных сказали, что пользуются ассистентами ежедневно, в 2019 году их доля составляла 29%. Несколько раз в неделю ассистентами пользуются 38% респондентов, раз в неделю или реже – 31%.

 

Доля пользователей голосовых помощников в умных колонках увеличилась с 2% до 6%. с 4% до 11% выросла аудитория, использующая ассистентов в навигаторе в машине. 

 

За год кейсы применения голосовых ассистентов стали разнообразнее. Люди стали чаще искать и включать музыку с помощью голосовых ассистентов, такая практика выросла с 4% до 7%. Самый частый запрос – это поиск и ответы на вопросы, к нему прибегают 37% респондентов. Нужно отметить, что опыт российских пользователей вполне отражает общемировую картину применения голосовых ассистентов.

 

К содержанию ↑

В мобильных приложениях 

Голосовой интерфейс станет следующим эволюционным шагом в развитии мобильных приложений. в Voicebot провели опрос и выяснили, что более 45% американских пользователей хотели бы видеть голосовых ассистентов в своих любимых приложениях. Voice-ассистенты внутри мобильных приложений помогут пользоваться приложением в смартфоне более нативно – не только с помощью стандартных тапов и привычных элементов визуального UX, но и с помощью голоса. 

 

По сути, один из первых примеров голосовой app-навигации в России — это Олег от «Тинькофф банка». Сбер вывел на рынок сразу трех голосовых помощников, и все они доступны не только на девайсах, но и в мобильном приложении банка. Вместе с тем, на рынке появляются решения для встраивания голосового интерфейса в мобильные приложения, так что можно предположить, что примеру крупных банков последует и другой бизнес.

 

К содержанию ↑

В Smart TV  

Большинство новых телевизоров с функцией Smart TV, которые продаются в России, в том числе эконом-класса, уже оснащены голосовым помощником, пусть и с усеченным функционалом. Однако телевизоры как платформа для вовлечения зрителей в экосистему явно представляют интерес для компаний-разработчиков. 

 

Сбер выпустил демократичную по стоимости приставку SberBox, которая обыгрывает форм-фактор телевизора и дает возможность использовать все преимущества мультимодальности, а Яндекс расширяет присутствие в сегменте дорогих ТВ-приставок с Алисой и начал сотрудничество с производителями телевизоров. Это стратегический шаг в направлении очень внушительного рынка: по оценкам М.Видео, за первые 9 месяцев 2020 года было продано более 5 млн телевизоров, 60% из которых — Smart TV

 

К содержанию ↑

В носимых устройствах

Развитие голосовых ассистентов и рост числа и популярности wearables — умных аксессуаров и устройств, которые можно взять с собой (часов, фитнес-браслетов, наушников, очков и т.д.) — являются взаимодополняющими трендами. Аналитики Voicebot сообщают, что в США использование голосовых помощников в наушниках выросло на 103% с 21,5 млн пользователей в 2018 году до 43,7 млн в 2020 году. 

 

Есть и более экстравагантные примеры применения технологии в носимых устройствах: в январе на международной выставке потребительской электроники CES 2021 была представлена защитная маска от Binatone с поддержкой голосовых помощников.

 

К содержанию ↑

Живая речь 

Развиваются технологии machine learning и мощности GPU — синтезируемая речь становится более совершенной: технологии уже сегодня позволяют имитировать голос и речь диктора гораздо более естественно, чем раньше, повторяя эмоции, тональность и индивидуальные особенности речи первоисточника. Качество синтеза растет и доступ к этому качеству появится у большего числа разработчиков.

 

Голосовые ассистенты уже способны различать пользователей и выдавать индивидуализированный контент. Так, в 2020 году Алиса от Яндекса научилась понимать, кто говорит с ней — взрослый или ребенок, и отвечать им по-разному. 

 

К содержанию ↑

Экосистемы 

Операторы метаассистентов стали создавать экосистемы для разработчиков, магазины навыков — делиться доходами от монетизации по аналогии со сторами мобильных приложений. Такой путь, который уже выбрали Яндекс и Сбер, формирует новый сегмент стартапов — разработчиков голосовых навыков.

 

В то же время производители умных устройств стали активно сотрудничать со смежными бизнесами. Например, это интеграции смарт-колонок с приложениями для управления медиапроигрыванием или онлайн-кинотеатрами, как у «Капсулы» от Mail.ru с сервисом Wink от «Ростелекома». 

К содержанию ↑

Голосовые технологии в КЦ 

Полная замена операторов колл-центров роботами с искусственным интеллектом — достаточно сложное решение, но интерактивное голосовое меню с технологией NLU на первой линии можно реализовать достаточно быстро. Глобальный рынок IVR в 2020 году оценивают в $1 млрд и прогнозируют ему ежегодный рост в 5,6%.

 

Еще в прошлом году Альфа-Банк представил голосового робота для корпоративных клиентов. Вслед за крупными компаниями тренд на голосовых бизнес-ассистентов подхватит средний и малый бизнес. Голосовые помощники будут адаптированы к бизнес-задачам и интегрированы с внутренними системами, такими как CRM. 

 

К содержанию ↑

Голосовые игры 

Новые типы устройств помогли голосовым интерфейсам проникнуть и в гейм-индустрию, где стал зарождаться тренд на голосовые игры. Гиганты рынка, такие как Disney Plus, начали сотрудничество с производителями смарт-дисплеев. Разработчики умных экранов не менее заинтересованы в кооперации с геймдев-компаниями — для них это означает выход на новую аудиторию пользователей. 

 

Игры всегда были драйверами технологических инноваций — от тач-интерфейса до видеокарт. А сегодня разработчики, за счет голоса глубже погружая пользователей в сюжет игры, могут делать контент совершенно нового типа, когда игровой процесс завязан одновременно на голосовом, тач- и геймпад-управлении.

 

Исследуя возможности новейших платформ и новые ниши применения разговорного AI, мы в Just AI в 2020 году выпустили игры «Хранитель слов» и «Мир Лавкрафта» для умного дисплея Google Nest Hub и русскоязычную версию «Хранителя слов» для ТВ-приставки SberBox и экрана SberPortal. 




Рынок умных колонок и голосовых ассистентов. Прогнозы и тренды

Перейти

Что нового можно делать в JAICP

Перейти
Спасибо за заявку!

Наш менеджер скоро свяжется с вами.

Спасибо за заявку!

Ждите тестовый звонок

Отлично!

Вы подписались на видеоподкаст «Conversations with…». Теперь вы первым узнаете о выходе нового эпизода!