10 минут
Полина Конорова
Генеративный ИИ: хайп или окно возможностей?
Большинству компаний сегодня так или иначе интересен генеративный ИИ. Люди видят грандиозные перспективы, которые открывает новая технология, но есть и те, кто считает, что вокруг генеративного ИИ существует определенный «мыльный пузырь», связанный с переоценкой его способностей.
В рамках дискуссии на Conversations’23 эксперты из ведущих технологических компаний рассказали, чем «нейросетевой» хайп отличается от предыдущих многообещающих инноваций, обсудили то, как бизнес подходит к внедрению систем ИИ, обеспечивает их безопасную работу и находит новые кейсы применения, а также поделились планами по развитию экосистем вокруг LLM.
Участники дискуссии: Кирилл Петров, «Just AI», Илья Никаноров, «Яндекс», Владислав Тушканов, «Лаборатория Касперского». Максим Волошин, «SberDevices», Иван Иванов, «Альфа-банк».
Все начинается с хайпа
Кирилл Петров (Just AI): За последние десять лет появлялось и исчезало множество разных технологий, которые изначально воспринимались обществом очень воодушевленно. Вокруг них возникали конференции, стартапы, интеграции в крупный бизнес, а потом эти технологии неожиданно сходили на нет. Например, Metaverse. Сколько воздушных замков построил Цукерберг, а потом сам же уволил огромное количество людей. И даже несмотря на то, что гарнитура Meta Quest уже доступна всем желающим, немногие готовы принять эту инновацию.
Или другой пример — облачный гейминг. Apple и Google создавали свои огромные подразделения для развития этого направления, но уже давно об этом ничего не слышно. NFT – тоже очень бурная тема, которая сошла на нет. Последний год подобную звездную болезнь переживает генеративный ИИ.
Максим Волошин (SberDevices): Думаю, что можно сравнить появление ChatGPT с появлением iPhone в 2008 году: сначала появился инновационный смартфон, потом Apple запустила AppStore, а через пару лет остальной бизнес начал задумываться, какую пользу он может из этого извлечь. Все начинается с хайпа. На заре своего появления мобильные приложения были игрушками, а теперь, например, сложно представить банк без мобильного приложения. Бизнесу нужно время, чтобы понять, какой финансовый эффект он получит от инвестиций в ту или иную технологию. Адаптация происходит где-то за 2-3 года, и сейчас мы находимся в начале этой фазы.
Владислав Тушканов (Лаборатория Касперского): Я считаю то, что сейчас происходит с ChatGPT и другими LLM — это, безусловно, окно возможностей для бизнеса. Помню, будучи лингвистом, я занимался обработкой текстов, и когда требовалось суммаризировать текст, мне нужно было сделать очень много манипуляций, чтобы решить эту задачу: достать модель Pegasus или BART, побить baseline, бесконечно файнтюнить и т.д. Сейчас ты берешь LLM, загружаешь туда текст и получаешь результат. Можно делать диалоговых агентов, с которыми реально интересно общаться, можно просто с помощью промпта давать им какую-то индивидуальность, характер. Раньше все эти вещи были совершенно недостижимыми.
Кирилл Петров (Just AI): Кажется, что новая технология поменяет абсолютно все уже в ближайшие месяцы. Hо на самом деле ей предстоит пройти тернистый путь адаптации и внедрения, которое начнется с разных областей и займет время. Илья, что думаешь?
Илья Никаноров (Яндекс): За последние годы сильно увеличилась скорость принятия инноваций обществом. Сколько лет потребовалось разным прорывным технологиям, чтобы достичь 50% адаптации по населению в США? Персональным компьютерам потребовалось примерно 20 лет, интернету около 12, мобильным телефонам — где-то 6. Думаю, что адаптация AI-технологий может занять не более 3-х лет.
Возьмем, к примеру, self-driving автомобили, у них есть пять уровней автономности. L1, L2, L3, L4, L5. L1 – это просто обычный круиз-контроль, L5 – это полностью автономный автомобиль, не требующий вмешательства вообще. Сейчас мы находимся на уровне L4 – это высокая автономность. Этот путь self-driving прошел за 15 лет. Если провести параллель с искусственным интеллектом, то, думаю, сейчас он почти на уровне L2, то есть автономен, но требует нашего вмешательства. По общей формуле до уровня L3 нужно еще 5 лет, до L4 – 15 лет. Скорость адаптации невероятно высокая, и по этому косвенному признаку хайп – это сильная недооценка того, что происходит.
Одним из ключевых элементов хайпа является то, что технология и степень взрослости технологии не соответствуют той скорости, с которой ожидается ее массовое появление.
Заключительный пункт назовем – «все побежали, и я побежал». Объем внутренних и внешних инвестиций крупных компаний не сравним ни с Metaverse, ни одной другой хайповой технологией. Это косвенно подтверждает, что много умных людей довольно сильно верят в потенциал ИИ, не считая его очередным хайпом.
ИИ и галлюцинации
Кирилл Петров (Just AI): Сегодня уже не секрет, что ChatGPT и другие нейросети склонны к галлюцинациям. Разработчики решают эту проблему, но полностью устранить ее вряд ли удастся. Какие способы решения этой проблемы существуют? Ведь для бизнеса часто нужны какие-то детерминированные результаты, как можно ли полагаться на модели, когда мы не всегда уверены в том, что она генерирует на выходе?
Максим Волошин (SberDevices): Очень важно то, что человек дает модели на вход. Учитывая, что сегодня среди компаний получают широкое распространение базы знаний или поиск по документам, которые интегрируются с системами ИИ, риск галлюцинаций снижается. Есть кейсы, в которых проблема галлюцинаций стоит не так остро, например, генерация идей или определенных текстов. В этих случаях, наоборот, сильно ограничивать модель не нужно. Чего нельзя сказать про темы, связанные с медициной, здравоохранением и финансами. Хотя, и там снизить уровень галлюцинаций до 90-95% сейчас уже вполне реально.
Еще одна стратегия по уменьшению галлюцинаций заключается в том, чтобы в процессе обучения одна модель анализировала другую и проверяла генерируемые данные на предмет достоверности.
Учитывая, что сегодня среди компаний получают широкое распространение базы знаний или поиск по документам, которые интегрируются с системами ИИ, риск галлюцинаций снижается.
Кирилл Петров (Just AI): Кстати, вспомнил высказывание Джеффри Хинтона, отца-основателя ИИ, о том, что галлюцинации это колоссальное преимущество ИИ, которое можно считать воображением. Но если при запросе дать модели посмотреть на референс, то она начинает вести себя совершенно по-другому.
Максим Волошин (SberDevices): Да, многие недооценивают силу system prompting, за счет которого можно четко направлять модель по вашему запросу и снижать набор галлюцинации. Думаю, что это одна из самых важных вещей с точки зрения просвещения. Люди должны понимать, что они могут сильно улучшить результат выдачи, если правильнее сформулируют вопрос.
Безопасность систем ИИ
Кирилл Петров (Just AI): Следующий немаловажный вопрос касается безопасности: как мы можем быть уверенными, что наши данные не уйдут куда-то наружу. Несмотря на то, что некоторые разработчики пытаются дообучать open-source модели внутри компании, все самые мощные модели все равно оказываются только в облаках у вендоров. Можно ли работать с внешними моделями? Или единственный путь – строить свою модель с нуля силами внутренней команды. Какие варианты решения существуют?
Владислав Тушканов (Лаборатория Касперского): С одной стороны это достаточно сложный вопрос, а с другой – есть очень хороший пример того, как эта задача решалась раньше. Есть такое понятие, как облачный сервис. И очень многие компании вместо того, чтобы держать свою собственную вычислительную инфраструктуру, инфраструктуру хранения данных и т.д., используют YandexCloud, SberCloud и других облачных провайдеров. В этих случаях есть понятные меры безопасности, которые применяются к этим данным.
Зачастую эти меры безопасности могут быть даже лучше, чем сама компания может обеспечить для собственных дата-центров. Например, в случае с GPT-4 у большинства компаний нет экспертизы в поддержке больших вычислительных мощностей, эксплуатации больших языковых моделей. Эта проблема решается по аналогии с облачным провайдером.
Есть такое понятие, как облачный сервис. И очень многие компании вместо того, чтобы держать свою собственную вычислительную инфраструктуру, инфраструктуру хранения данных и т.д., используют YandexCloud, SberCloud и других облачных провайдеров. В этих случаях есть понятные меры безопасности, которые применяются к этим данным.
Но есть вещи, которые сложно контролировать, например, то, как и с какими нейросетями взаимодействуют сотрудники компании. Из-за того, что российские модели пока что не дотягивают по качеству до GPT-4, люди используют их реже зарубежных. И как узнать, что при общении с ИИ, они не направляют туда какие-то конфиденциальные данные? Встает вопрос о налаживании процесса обучения людей по использованию consumer-версий сервисов типа ChatGPT. Но при этом бизнес не хочет отставать от инновационного прогресса из-за подобных вопросов безопасности. Поэтому ищет способы имплементации этих ограничений через контроль тех сервисов, которые являются недоверенными, через специальные классы решений безопасности типа CloudX, Security Broker и так далее.
Шлюзы для маскирования данных
Кирилл Петров (Just AI): Мы знаем, что многие крупные международные компании, в частности, банки, запретили использование ChatGPT внутри организации. Увидев такую проблему, мы в Just AI решили реализовать инструмент наподобие шлюза, который маскирует данные таким образом, чтобы при работе с LLM сохранилась семантическая целостность. Плюс Jay Copilot – интерфейс, который заменяет внешние ИИ-интерфейсы, но разворачивается внутри компании. Насколько такой подход вообще применим, и есть ли у него будущее?
Владислав Тушканов (Лаборатория Касперского): Такой шлюз действительно полезная вещь, потому что страх того, что банки целиком отключат доступ к какой-нибудь ИИ-модели, основан на вполне конкретных кейсах и примерах.
Но внедрение такой технологии требует определенной зрелости рынка. Во-первых, нужны LLM в компании. Во-вторых, нужно понимать, в чем состоит угроза. В-третьих, нужно понимать, как это организовать – то есть дать доступ к той самой нейросети не через chatgpt.com, а через внутреннюю систему, которая позволит этот контроль создать.
Иван Иванов (Альфа-Банк): В контексте обеспечения безопасности возникает развилка инвестиций в платформу, которая будет шлюзом и инвестиций в собственные LLM-модели. Альфа-Банк пошел по первому пути по нескольким причинам. Во-первых, самая популярная модель ChatGPT – это UI и понятный доступ к технологии для обычных сотрудников. Во-вторых, наличие API, которые будут обеспечивать доступ к генеративному искусственному интеллекту нашим IT-приложениям.
В процессе кейс-чемпионата, который мы проводили для вовлечение сотрудников в кейсы использования ИИ, мы как раз использовали шлюз для маскирования. И благодаря нему нам удалось поднять уровень вовлеченности сотрудников в тему genAI, ведь не было никаких ограничений. Такая инвестиция точно оправдает себя в будущем, так как есть возможность переключить этот шлюз с OpenAI на другие источники.
Каким Альфа-Банк видит будущее с ИИ?
Кирилл Петров (Just AI): Иван, есть ли примерное видение того, как через 2-3-4 года трансформируется банковская отрасль под влиянием ИИ? Можешь ли дать совет представителям бизнеса, которые планируют масштабные интеграции ИИ-систем?
Иван Иванов (Альфа-Банк): Думаю, что наиболее очевидный тренд – переход от клиентоцентричности к человекоцентричности. ИИ сотрет черту между массовым и премиальным обслуживанием, ведь персональное, эмпатичное общение с банком сможет получить любой клиент. Я считаю, что ИИ сильно изменит это направление, и в скором времени человекоцентричное обслуживание в банковской сфере станет превалирующим.
Во-вторых, изменится подход к продаже продуктов. Сейчас при возникновении определенной потребности, клиент ищет способы ее закрытия через рекламу, поиск информации в интернете и т.п. Встраивание ИИ в сервисы клиентского пути позволит человеку сократить время поиска, у клиента появится возможность проконсультироваться с ИИ-помощником – какой кредит лучше взять, как распределить свои финансовые возможности и т.д. То есть клиенты будут меньше искать, а больше советоваться с банками. И выиграет тот банк, который правильно интегрирует ИИ для того, чтобы создать некую эмоциональную привязанность клиента через премиальное обслуживание.
Третья история о том, как будет устроен банк внутри. Мы верим в то, что постепенно будут появляться полуавтономные функции, co-pilots для сотрудников. Например, у программистов будут ИИ-агенты, которые будут писать бета-тесты к кодам. А в будущем мы видим появление целых групп агентов, которые будут взаимодействовать друг с другом без участия человека. Например, менеджерскую работу можно описать с помощью ИИ и автоматизировать. И создать несколько агентов, каждый из которых будет отвечать за свой блок задач.
Выиграет тот банк, который правильно интегрирует ИИ для того, чтобы создать некую эмоциональную привязанность клиента через премиальное обслуживание.
Кирилл Петров (Just AI): Звучит хоть и тревожно, но я склонен верить, что это сделает нашу жизнь интереснее и ярче. Есть мысли о том, как подойти к оценке эффективности внедрения, посчитать, сколько денег компания сэкономит?
Иван Иванов (Альфа-Банк): CIR у нас в основном состоит из ФОТа. ФОТ – это часы работы людей, которые выполняют те или иные функции. Далее мы решаем, какие из этих функций могут быть переданы ИИ, и, отталкиваясь от этого, оцениваем, сколько в себестоимости удастся сэкономить. Внедрение ИИ повлияет на себестоимость большого количества продуктов. Многие компании должны уже сейчас думать о том, как пересобрать свою бизнес-модель с учетом внедрения ИИ. Иначе их обойдут конкуренты, которые за счет новых технологий будут делать продукты значительно дешевле.
Как изменилась Алиса с появлением генеративного ИИ?
Кирилл Петров (Just AI): Илья, «Яндекс» многие годы остается технологическим лидером в большом количестве направлений. В частности, на рынке умных устройств, который динамично рос последние 5 лет. Фаворит в этом сегменте, безусловно, голосовая колонка Алиса.
Учитывая активное развитие ИИ-модели YaGPT, расскажи, в какие сценарии Алисы вы внедряете ИИ? Можете ли уже оценить, насколько часто пользователи обращаются к новым функциям?
Илья Никаноров (Яндекс): В мае запустили первую версию навыка «Алиса, давай придумаем», в июне вторую с поддержкой контекста, недавно сделали «Давай придумаем» на базе YandexGPT 2, которая в разы лучше предыдущих версий.
Первые результаты — это понимание того, как новая технология может работать для самых популярных задач. Далее анализ того, какие приложения будут хорошо работать на практике, учитывая голосовой интерфейс. Также важно было адаптировать существующие сервисы: музыка, погода, навигатор, лавка и т.д. Во всех сценариях мы видим влияние языковой модели.
Во всех сценариях мы видим влияние языковой модели.
Существует концепция, согласно которой языковые модели — это не способ ответить на все вопросы в мире, и это не способ выполнять задачи. Языковые модели — это второй логический аппарат у человека. К этому логическому аппарату подключаются внешние модули, которые позволяют ему оперировать информацией и решать различные задачи.
Эта концепция отражает то, как мы относимся к внедрению ИИ в Алису. YaGPT позволяет ей быть более человечной, вести более интересные диалоги, а также быстро доставать нужную информацию. Кстати, снизить галлюцинации получилось благодаря тому, что Алиса пользуется данными из «ЯндексПоиск». Это интегрально общий буст и для остальных функций Алисы.
Вообще нельзя недооценивать то, как часто люди общаются с голосовыми ассистентами. И генеративный ИИ, несомненно, делает диалоги между машиной и человеком гораздо более насыщенным и информативным.
Вклад техногигантов в развитие стартапов
Кирилл Петров (Just AI): У нас в стране сейчас не самое лучшее время для стартапов, для инноваций. Но генеративный ИИ открыл много возможностей для небольших технологических компаний. И техногиганты в этой ситуации могут занять разные позиции: корпорации могут сделать вертикально интегрированный подход — внедрять все свои инновации от первого лица и напрямую идти к клиентами. Или создать инновационный кластер, в котором будут расти компании, которые в будущем будут приносить вам часть своей прибыли.
Какой подход ближе к вашей политике? Как относитесь к партнерству, разработчикам, стартаперам? Готовы ли им помогать?
Максим Волошин (SberDevices): Развитие через партнерство и масштабирование — единственный правильный путь сейчас. Важно заниматься развитием не только внутренней, но и внешней экосистемы. Университеты, академическое сообщество — это те места, где есть место быстрым экспериментам, а также развитию партнерских сетей.
С одной стороны, есть мощные ИИ-модели и большие компании, которые могут позволить себе не только разработку таких моделей, но и предоставление API. Но не все могут позволить себе это внедрять. Поэтому должны появиться компании, которые будут помогать интегрировать новые технологии в бизнес — стартапы, которые образовываются от потребности. Я думаю, что в этом направлении сейчас активно начинают развиваться внешние экосистемы, партнерские сети и различные хакатоны.
Техногиганты могут занять разные позиции: корпорации могут сделать вертикально интегрированный подход — внедрять все свои инновации от первого лица и напрямую идти к клиентами. Или создать инновационный кластер, в котором будут расти компании, которые в будущем будут приносить вам часть своей прибыли.
Илья Никаноров (Яндекс): YandexCloud запустил бустинг для компаний, которые хотят протестировать генеративные модели для своих проектов или бизнес-процессов. Грант на 1 млн рублей на первые полгода, на вторые полгода 50% скидка на инференс. В ближайшее время это направление будет активно развиваться.
Согласно опросу 600 западных enterprise-компаний, 10% из этого числа уже используют генеративный ИИ. У 25% он находится в раскатке, а еще у 25% — в стадиях тестирования. Оставшиеся 40% пока что на этапе proof of concept. Мы все находимся в начале этого пути и надеемся, что выбрали верный курс.