10
Анастасия Сахарова
Проводники в разговорном ИИ: как нейросети улучшают голосовых помощников и чат-ботов

В последние пару лет искусственный интеллект (ИИ) все чаще применяется для решения прикладных задач. И диалоговые системы тут не остались в стороне. Благодаря нейросетям чат-боты и голосовые помощники достигают невиданного до этого уровня персонализации. В этой статье мы рассмотрим, зачем большие языковые модели (LLM) интегрируются в технологии диалогового ИИ, и какие перспективы открываются в этой сфере с их появлением.
В отчете Juniper Research говорится, что уже к концу 2023 года чат-боты на базе LLM будут обрабатывать до 70% разговоров с клиентами
Из этой статьи вы узнаете:
- Что не так с разговорным ИИ и зачем ему нейросети
- Где LLM-модели могут улучшить разговорный ИИ
- Ограничения технологии
- Будущее такого союза
Что не так с разговорным ИИ и зачем ему нейросети?
Люди всегда стремились создать идеального собеседника, который все понимает, отвечает на любые вопросы, проявляет эмпатию и обладает богатым словарным запасом. Но диалоговые интерфейсы до недавнего времени имели ограниченный функционал. Чаще всего пользователи взаимодействовали с разговорным ИИ в своих смартфонах, умных колонках и автомобилях.
Краткий список функций, к которым обращались обычные пользователи, ограничен погодой, музыкой, новостями и развлечениями
Без внедрения LLM голосовым помощникам не хватало нескольких функций, чтобы стать полноправными собеседниками для человека — они не учитывали историю взаимодействия, выдавали заранее прописанные ответы и чаще всего выполняли только простые задачи: «расскажи новости», «поставить колыбельную», «включи свет», «уточни условия доставки».
Сегодня с развитием технологий ИИ мы приближаемся к решению этих задач. Появление LLM-моделей может стать большим шагом в улучшении качества диалоговых систем – более естественная речь у AI-ассистентов, создание персонализированных ответов на основе истории сообщений, контекстные подсказки для операторов и многое другое. Расскажем, какое будущее ждет голосовых помощников и чат-ботов на базе нейросетей, и как они изменят наш пользовательский опыт.
Где LLM-модели могут улучшить разговорный ИИ?
Диалоговые системы на базе LLM имеют огромный потенциал для развития. Технологии машинного обучения позволяют создавать голосовых или текстовых помощников с более высокой точностью распознавания и понимания речи, и улучшают их способность к общению с людьми. Поскольку такие модели можно поступательно дообучить после взаимодействия с пользователями — сфера их применения здесь может быть очень широкой. Рассмотрим некоторые кейсы:
Более осмысленное общение
Одно из преимуществ ChatGPT — возможность вести полноценный диалог с пользователем. До недавнего времени такие голосовые помощники, как Алиса или Маруся, предоставляли информацию по запросу, а если и общались с пользователями, то делали это в ограниченном формате и по определенным правилам. Пользователям часто казалось, что такие виртуальные ассистенты до конца их не понимают.
Чат-боты первого поколения, с которыми сталкивались корпоративные пользователи, не оправдывали их ожиданий. 4 из 5 клиентов прекращали общение с ботом, если его ответы не отвечали их персональным потребностям
Чат-боты и виртуальные помощники на базе LLM могут сохранять контекст беседы на протяжении всего разговора. Более того, они умеют генерировать подробные и персонализированные ответы. Например, такой чат-бот сможет объяснить понятие ядерной физики как взрослому человеку, так и ребенку, учитывая их бэкграунд.
Одна из причин, по которой возможен такой естественный диалог — нейросети обучались на больших массивах данных, которые были созданы людьми. Используя этот опыт, ИИ-модели способны имитировать реальный разговор: подстраиваться под пользователя с учетом особенностей речи, манеры изложения и контекста диалога.
Лучшее понимание намерений пользователей
Еще одна полезная функция —- умение проводить предиктивную аналитику с учетом опыта прошлого взаимодействия. Другими словами — предугадывать действия пользователя или его запросы. К примеру, можно использовать информацию из профиля клиента или учитывать историю поиска на сайте компании. Зная намерения клиента, чат-боты и голосовые помощники соответствующим образом адаптируют свои ответы. В клиентском обслуживании ИИ может создавать сценарии звонков для голосовых ассистентов, писать электронные письма или сообщения для чат-ботов — и все это с учетом потребностей конкретного человека.
Пример внедрения: IBM Watson Assistant – платформа для создания чат-ботов клиентской поддержки. Использование сервиса позволяет создавать виртуальных ассистентов, которые понимают контекст диалога и умеют симулировать полноценное общение с пользователем. При этом точность ответов достигает 95%
Используя модели машинного обучения, он может обрабатывать запросы и выполнять предполагаемые действия пользователя посредством симулированных разговоров. Он также понимает контекст клиента, поэтому при необходимости может передать клиента агенту-человеку. Конечно, еще одним преимуществом является его способность быть доступным 24 часа в сутки 7 дней в неделю с точным уровнем ответов на вопросы в 95%.
Кроме того, ChatGPT может предоставить компаниям ценную информацию о предпочтениях и поведении клиентов, что позволит им лучше адаптировать свои услуги и продукты к своей целевой аудитории. Уже сейчас клиентский сервис — одна из самых перспективных областей для использования нейросетей. Благодаря им разговорные интерфейсы будут работать быстрее и точнее, что, несомненно повысит удовлетворенность клиентов, а, значит — и прибыль брендов.
Предиктивность пригодится не только в продажах. Например, в психологическом консультировании.
Исследования показывают, что некоторые люди предпочитают взаимодействовать именно с психологическими чат-ботами, а не с терапевтами, потому что общение с ними гарантирует отсутствие дискриминации по социальному признаку
Психологические чат-боты существовали и до появления нейросетей, но с ними они смогли нарастить свою функциональность. Такой чат-бот или голосовой помощник может отслеживать настроение пациента и имитировать полноценный диалог, как будто бы это настоящий психолог. Конечно, при серьезных проблемах человеку понадобится настоящий специалист, но помочь справиться с легким беспокойством или тревогой такой чат-бот вполне может.
Пример такого чат-бота — психолог Сабина 2.0 на базе ChatGPT. Пользователь может выбрать методику, стилистику, проблему и даже персонажа, с которым будет общаться
Психологические чат-боты могут найти свое место и в бизнесе, где важно контролировать ментальное здоровье сотрудников. Они могут считывать ранние признаки стресса или усталости и давать рекомендации для улучшения состояния. Тем более их советы могут быть основаны на научных исследованиях и опыте работы реальных психологов.
Индивидуальный подход в обучении
Сколько раз каждый из нас сталкивался со скучными уроками или лекциями? Кажется, ChatGPT может существенно изменить подходы в образовании. И речь идет не только о том, что нейросети могут помочь написать реферат или сделать домашнее задание. Чат-боты на базе LLM будут полезны в создании персональных сценариев обучения.
Например, для школьников стандартный курс ИИ может переработать в интерактивную викторину, которую проведет голосовой помощник. Для сотрудников выполнит онбординг или коучинг в формате захватывающего квеста. Даже база знаний для персонала благодаря чат-боту с ИИ может стать удобным инструментом для быстрого получения информации по любому вопросу.
И даже в классической схеме, где студенты используют ChatGPT как шпаргалку — возможны вариации. Может быть, что в будущих коллоквиумах преподаватели в качестве одного из заданий предложат улучшить ответы ИИ-бота.
Персональный бизнес-ассистент
В век глобализации команды могут быть распределены не только физически. Как клиенты, так и сами сотрудники говорят на разных языках. ChatGPT знает много языков и может переводить документы и данные за короткий промежуток времени. Это идеально подходит для компаний, которые сталкиваются с многоязычностью. Кроме того, чат-боты на базе ИИ могут трансформировать документы в другие форматы, делать саммари встреч, расшифровывать видео- и аудиозаписи. Это значительно экономит время и снижает риск влияния человеческого фактора.
Пример, чат-бот на базе LLM может стать незаменимым помощником для медицинской клиники. За одну минуту проанализировать расписание и занятость врачей во внутренней базе и записать пациента в удобное ему время без привлечения человека.
В конце концов, ChatGPT улучшит личную эффективность. Если голосового помощника на базе нейросетей интегрировать во внешние системы, он сможет очень многое. Например, поможет спланировать встречи, напомнит о предстоящих событиях и даже даст советы по составлению расписания.
Интеллектуальный помощник дома
Уже сейчас активно используются голосовые помощники для управления умным домом, но с ИИ они смогут еще больше. Понимая естественный язык, чат-боты на основе ChatGPT могут быстро определять намерения пользователя, даже если команда дана не четко.
Например, для фраз «Готовься к вечеринке» или «Я устал и хочу спать», чат-бот изменит настройки климатического оборудования, сценарии освещения и музыкального сопровождения совершенно по-разному.
Кстати, Сбер уже встроил своего чат-бота GigaChat в свои умные устройства с помощником Салют
Голосовые помощники могут учиться в ходе разговоров с пользователями. Это позволяет им лучше понять их намерения и давать точные ответы. Пользователи смогут создавать напоминания для, к примеру, голосовой колонки. Например, когда нужно полить растения или выключить свет. В конце концов, уже давно велись разговоры, что смарт-устройства станут для одиноких пожилых людей полноценными собеседниками, а не только помощниками по дому. Кажется, с приходом эры нейросетей, это действительно произойдет.
Ограничения технологии
Но все ли так гладко с интеграцией LLM в разговорный ИИ? Через API многие компании уже встраивают ChatGPT в свои разговорные решения. Да, LLM-модели открывают большие возможности для персонализации, но даже самые передовые из них выдают ошибки и неточности.
Часто это связано с тем, что ChatGPT подтягивает информацию не в режиме реального времени. Например, модель, обученная на данных за 2020 год, не будет знать о последних разработках. Более того, для формирования ответов бот использует всю доступную информацию, часть которой может содержать ошибки и неточности. Такие ответы могут вводить в заблуждение или формировать ложные выводы. К примеру, это была одна из причин, по которой Департамент образования Нью-Йорка заблокировал использование ChatGPT в своих школах.
ChatGPT глупеет после общения с людьми. На данный момент явная причина, почему так происходит, неизвестна. Исследователи склоняются к двум подходам. Первый: ИИ общается с людьми, учится у них и поэтому работает хуже. Второй причиной называют снижение способностей у модели самими OpenAl
Диалоговый ИИ — это лишь одна из областей, которой помогают развиваться нейросети. У компаний появляется много возможностей для экспериментов с ChatGPT и расширения функционала своих разговорных решений. Многие страны говорят о необходимости правового регулирования ИИ для предотвращения дезинформации и случаев мошенничества. Работы по созданию стандартов ведутся, но технология слишком быстро распространяется.
Будущее такого союза
Разговорные решения на базе нейросетей представляют большой потенциал для улучшения нашего пользовательского опыта. Прогресс в области ИИ позволяет создавать функциональных и удобных AI-помощников, способных выполнять все более сложные задачи. У них улучшается понимание естественного языка, они могут считывать наши намерения и персонализировать ответы.
Увы, даже большие языковые модели не всегда способны правильно определить контекст диалога или проанализировать информацию для релевантного ответа. Для использования LLM в конкретном бизнесе, потребуется их дообучение на данных компании — каталогах товаров и услуг, статьях, сайте, клиентских базах. Этот процесс должен сопровождаться постоянным тестированием и мониторингом. Но, кажется, эти проблемы преодолимы. Некоторые компании уже интегрируют ChatGPT в своих чат-ботов и голосовых помощников. И это только вопрос времени, когда LLM станут неотъемлемой частью разговорного ИИ.