5 минут
Виолетта Малышко
Русскоязычные LLM: могут ли они заменить ChatGPT
ChatGPT — самая популярная сегодня LLM — лидирует среди больших языковых моделей и задает тренды на развитие технологий в отрасли. Сегодня отечественные компании предлагают потребителям нейросети-аналоги ChatGPT, заточенные непосредственно под работу с русским языком. Что умеют русскоязычные LLM и смогут ли они составить достойную конкуренцию нейросети от OpenAI?
Современные русскоязычные LLM
ChatGPT, несмотря на очевидное лидерство среди других нейросетей, все-таки пользуется переводчиком для работы с русским языком и не понимает всех нюансов и тонкостей «великого и могучего». Именно поэтому российский бизнес начал разработку собственных LLM — для учета языкового контекста и безопасности при использовании моделей (в том числе защиты конфиденциальных данных).
GigaChat
Разработчик: Сбер.
Краткое описание: Сбер первым среди всех российских компаний вышел с релизом собственной русскоязычной LLM. Большая языковая модель под названием GigaChat работает на основе языковых моделей ruGPT-3 и FRED-TP. По данным разработчиков, обучение языковой модели GigaChat производилось на 18 миллиардах параметров. Нейросеть (как и другие генеративные нейросети) может написать текст любого формата, генерировать программный код или нарисовать изображение с помощью интеграции с Kandinsky 2.2. Использовать GigaChat можно как на сайте разработчика, так и в голосовом помощнике Салют от Сбера.
YandexGPT
Разработчик: Яндекс.
Краткое описание: YandexGPT — вторая большая языковая модель, выпущенная в мае 2023 года российской компанией Яндекс. Эту нейросеть семейства GPT обучали на датасете, содержащем информацию из открытых источников из Интернета, книг, журналов и газет. Для русскоязычных пользователей нейросеть YandexGPT доступна в разных продуктах: от виртуального помощника Алисы до главной страницы одноименного поисковика и приложений Яндекса. Запустить YandexGPT можно простой командой «Давай придумаем», адресованной голосовому помощнику Алиса. Функционал YandexGPT схож с американским аналогом нейросети от OpenAI: она умеет создавать тексты, общаться на разные темы, объяснять любые понятия и термины, пересказывать материалы, генерировать идеи, давать советы и так далее. Нейросеть может ошибаться и фантазировать, однако по мере обучения ответы будут становиться точнее и детальнее.
Saiga
Разработчик: Илья Гусев
Краткое описание: Языковая модель Saiga с открытым исходным кодом представлена на платформе Hugging Face. Ее дообучили на русском языке на базе LLaMA, поэтому она хорошо справляется с любыми текстовыми запросами.
Cotype
Разработчик: MTS AI
Краткое описание: Большая языковая модель Cotype появилась в 2024 году. У нее уже есть четыре версии: Light (8 млрд параметров), Plus (13 млрд параметров), Pro (70 млрд параметров), а четвертая, опенсорс-модель Nano, вышла в свет совсем недавно. LLM от MTS AI поддерживают русский, английский, арабский и даже татарский языки.
T-Pro
Разработчик: Т-Банк
Краткое описание: Модель на 32 млрд параметров появилась в конце 2024 года. Она разработана на базе китайской модели Qwen-2.5 от Alibaba Group. За счет большего числа параметров модель учитывать больше контекста и особенностей языка, лучше запоминает информацию, делает более точные и сложные выводы.
DeepPavlov
Разработчик: МФТИ (Московский физико-технический институт).
Краткое описание: DeepPavlov — это набор моделей для обработки языка, включая русскоязычные LLM. Они используются для создания диалоговых систем, автоматических переводчиков и аналитических инструментов. DeepPavlov широко используется в академических и коммерческих проектах.
RuGPT3
Разработчик: СберТех, Институт искусственного интеллекта AIRI (Artificial Intelligence Research Institute).
Краткое описание: RuGPT3 — серия моделей, созданных на основе архитектуры GPT-3. Она разработана с акцентом именно на использование в России и обучена на большом массиве данных. RuGPT3 является одним из наиболее масштабных проектов в области разработки LLM для русского языка и обладает высокой точностью в работе с контентом на родном для нас языке.
Представленные Large Language Models — далеко не конечный список моделей, работающих с запросами на русском языке. Для того чтобы не потеряться при выборе подходящей языковой модели, команда Just AI разработала сервис Caila. С помощью этого инструмента можно тестировать и сравнивать генеративные модели. В число доступных входят такие популярные LLM как ChatGPT, GigaChat, Claude, Gemini, YandexGPT и так далее. Пользователи сервиса могут использовать одновременно две и более нейросетей, следя за качеством и скоростью работы в online-режиме. Это сильно упрощает процесс выбора подходящего решения под конкретные бизнес-задачи.
Могут ли русскоязычные модели конкурировать с ChatGPT?
Русскоязычные Large Language Models сегодня активно развиваются. И мы уже можем говорить о полноценной конкуренции между ними и ChatGPT. Генеративная нейросеть от OpenAI пока остается лидером отрасли, но и российские модели постоянно наращивают свою функциональность и предлагают пользователям все более качественный сервис. Какие точки роста есть у российских LLM?
Качество данных: Например, для обучения ChatGPT использовались огромные массивы данных — и этот факт позволяет нейросети максимально быстро работать с пользовательскими запросами. Русскоязычные Large Language Models не всегда имеют доступ к такому объему и разнообразию данных, но компании-разработчики работают над этим.
Конфиденциальность информации: защита персональных данных при использовании любых языковых моделей часто вызывает вопросы. Да, появляются решения, которые помогают скрыть чувствительную информацию, но их пока на рынке немного. Например, для работы с облачными LLM можно использовать модуль маскирования данных Jay Guard.
Мощность: ChatGPT построен на передовой модели GPT-4. Российские аналоги не всегда имеют доступ к аналогичным мощностям.
Спектр решаемых задач: последние версии ChatGPT справляются с разными задачами, которые пользователь попросит реализовать. На российском рынке ни одна large language model не обладает такой широтой функционала, зато такие модели могут предложить пользователям функциональность, заточенную под решение именно их задач.
Сегодня уже стало понятным, что русскоязычные модели однозначно имеют ощутимый потенциал для роста и развития и сейчас быстро справляются с работой над текстами на родном для нас языке и смежными задачами.