GigaChat — это сервис, в функционале которого представлены разнообразные опции: он взаимодействует с пользователем в формате диалога, умеет писать код, создавать тексты и картинки по запросу. Разбираемся, как пользоваться этой нейросетью, какие у неё плюсы и есть ли недостатки.
Kandinsky рисует, с ChatGPT можно поговорить, а для написания кода существуют свои специализированные нейронки. На первый взгляд может показаться, что искусственный интеллект можно научить выполнению только одной конкретной задачи. Однако механизм работы нейросети отличается от функций обычной техники, к которой мы привыкли. По сути это искусственный мозг, а у человека такой орган может понимать и осваивать самые разные области. Надо всего лишь дать ему информацию и запустить мыслительный процесс.
По этому принципу и возникли модели, получившие название мультимодальных. В их функционале могут быть представлены самые разные опции – от понимания языка и создания видеороликов до генерации мелодий и клонирования голоса. Объединяя несколько процессов в одном, разработчики придумывают модели машинного обучения, способные производить несколько видов контента сразу. Такой и является нейросеть от Сбербанка GigaChat.
Как работает GigaChat
Резонно предположить, что для выполнения множества задач требуется не один исполнитель. Внутри GigaChat работает целая команда нейросетей – кое-кого мы даже можем узнать. Разработчики назвали этот «коллектив» NeONKA, а включены в него несколько разных моделей:
RuGPT-3.5. Несложно догадаться, что это русская версия знаменитой GPT, на основе которой работает и бот ChatGPT, совершивший прорыв в развитии искусственного интеллекта. Языковая модель работает с текстом, так что в её задачи входят все возможности GigaChat его понимать, писать и вести беседу.
FRED-T5. Ещё одна сеть из команды GigaChat, обрабатывающая язык. Умеет переводить, разбираться в логике и смысле написанного, делать текст более простым и объяснять сложные моменты.
RuCLIP. Тоже дообученная на русском языке модель компании OpenAI (создателя ChatGPT) CLIP. В GigaChat она применяется для того, чтобы созданное изображение соответствовало тому, что запросил пользователь.
Kandinsky. И, наконец, знакомый пользователям генератор картинок. Рисует в GigaChat именно он, так что картинку от него можно запросить ещё и здесь.
Из этого описания уже можно в целом понять, в каких сферах можно использовать мультимодальную модель GigaChat. Его возможности охватывают задачи, связанные с языком и созданием изображений. Однако слаженная совместная работа нескольких нейросетей в его структуре рождает и другие возможности на пересечении их функций.
Что можно делать с помощью GigaChat
Многозадачность нейросети предполагает несколько отдельных областей, в которых она вполне применима как специально разработанный инструмент.
Языковые модальности
- Писать тексты. Понимание нейросетью языка и умение с ним обращаться открывает массу возможностей в сочинительстве. GigaChat сгенерирует любой текстовый материал, будь то статья, рассказ, письмо или поздравление. Можно запросить отдельные его части (например, заголовок или вывод), структуру материала со всеми моментами, которые необходимо упомянуть, переписать текст в другом стиле. GigaChat справляется и с задачами попроще – перевод или исправление ошибок.
- Генерить идеи. Нейросеть вполне справляется с такой уникальной задачей человеческого мозга, как придумывание. Области применения – самые различные: сценарий видеоролика или детского праздника, интерьер жилища или оригинальный рецепт торта, план путешествия или идея нового бизнес-продукта.
- Выполнять сетевой поиск. Искусственный интеллект сейчас уже серьёзно конкурирует с существующими поисковыми системами и алгоритмами. GigaChat снимет с вас необходимость долго гуглить в попытках найти нужную информацию. Задав вопрос таким же образом, как вы набираете его в поисковой строке, вы получите ответ от бота. Он основан на том, что GigaChat сам нашёл и проанализировал в Google, Bing, Yahoo и других поисковиках. Сервис использует данные различных источников, включая веб-страницы, новостные статьи, научные статьи, форумы и прочее.
- Получать пояснения. В целом всё общение с GigaChat строится в форме диалога, поэтому вы всегда можете задать ему дополнительный вопрос, если не хватает данных или вы чего-то не поняли в предоставленной информации.
- Получать экспертные комментарии по темам, в которых вы не сильны. Модель обучали на специализированных датасетах, например, по праву и экономике. В определённой степени GigaChat может заменить юриста, финансового или карьерного консультанта. У него можно уточнить детали законодательства, значение терминов, подробности экономической ситуации (например, процент инфляции в разных странах).
Надо понимать, что возможности нейросетей пока ограничены, так что нельзя опираться на них в принятии важных решений.
Работа с картинками
Нейросеть способна генерировать изображения. Как мы уже знаем, создавать изображения GigaChat помогает Kandinsky, так что тут без сюрпризов: задаёте промпт и получаете картинку. Особенность работы Kandinsky именно в GigaChat такова, что здесь вы более свободны в текстовых запросах, так как сервис умеет поддерживать диалог. Так что с нейронкой можно общаться, не следуя инструкциям редактирования. Например, получив по запросу картинку с котом, написать напрямую: «поверни его в кадр» или «добавь букет цветов на подоконник».
Программирование
По большому счёту, эта функция тоже про язык, только не естественный, на котором разговаривают люди, а алгоритм для записи компьютерных программ. Для нейросетей это то же самое, поэтому они также легко «общаются» с вычислительной техникой, как и с человеком. Это открывает ещё одну поистине огромную сферу применения моделей машинного обучения – кодинг.
В этой области GigaChat выполняет целый ряд функций. Начинать можно с нуля – запрашивать у него генерацию кода с чистого листа. Для этого ему необходимо указать цель разработки и собственно язык, на котором надо кодить. В базе модели: популярные Java, Python, HTML, SQL.
Если код уже есть, но с ним надо поработать, нейросеть можно попросить отформатировать его и сделать более читаемым. Непонятное он способен пояснить отдельно: как по поводу своей работы над кодом, так и в качестве комментариев к чужой генерации.
Для более сложных задач нейросеть готова предложить написание кода несколькими способами. При этом опять-таки с ней можно взаимодействовать с помощью естественного языка, без дополнительных «переводчиков».
С подобным набором функций по кодингу для программирования с GigaChat даже не нужно быть программистом. Также он будет полезен начинающим кодерам, поскольку подробно растолковывает азы и проясняет сложные моменты.
Кстати, о том, что и как он делает, GigaChat может буквально рассказать сам – это ещё один плюс моделей, которые обучены беседовать с людьми, даже если их ответы пока несовершенны.
Где можно воспользоваться GigaChat
Традиционно разработчики предлагают несколько ресурсов, которые подходят для тех или иных обстоятельств применения.
- В браузере. Чтобы попробовать работать с GigaChat на сайте разработчика (это продукт Сбера, как и Kandinsky), необходимо авторизоваться через Сбер ID. Для этого введите номер телефона, на который вам вышлют код входа. Также можно авторизоваться с QR-кодом в приложении Сбербанк Онлайн.
- Довольно популярен также и GigaChat-бот в Telegram. Здесь доступны все стандартные функции сети, а если что-то непонятно, можно обратиться в поддержку по команде /support.
- Пользователи «ВКонтакте» могут пользоваться GigaChat прямо в соцсети.
Во всех случаях вам предлагают ознакомиться с Пользовательским соглашением, которое вы автоматически принимаете, когда начнёте работу с сетью.
Плюсы GigaChat
- Модель мультимодальная, поэтому позволяет решать несколько задач, не прибегая к помощи других инструментов. В GigaChat можно поручить полный цикл какого-нибудь творческого процесса: от выбора идеи до генерации всех её составляющих. Например, создание интернет-магазина с написанием текстового наполнения, визуала и в итоге – кодинга самого ресурса. Или подготовку мероприятия: от сценария до генерации текстов для участников.
- GigaChat поддерживает два языка: русский и английский. Ему не требуются дополнительные вычислительные операции для перевода с русского на английский, как это делают нейросети иностранных разработчиков (даже те, которые поддерживают русский язык).
- Сеть бесплатная и открытая. Для пользователей это удобно, так как не нужно тратиться, а разработчики могут использовать код сети для внедрения в свои проекты.
- У нейросети довольно приличный по объёму контекст беседы. Сейчас она способна охватывать до 8 тысяч токенов (понятных ей единиц текста – слов или символов). Такой размер контекста означает, что в его рамках GigaChat ориентируется в поднятой теме или поставленной задаче, не требуя заново начинать с ним диалог.
Минусы GigaChat
- Как и многие нейросети, GigaChat не идеален в ответах на вопросы, может галлюцинировать (то есть использовать недостоверные факты) и далеко не во всём может помочь.
- Сеть ограничена правилами этики и не поддаётся на провокации. Это нельзя назвать буквальным недостатком, так как важно контролировать искусственный интеллект и не допускать нарушения закона и ущерба для пользователя. Но, учитывая то, что сами по себе модели пока не всегда хорошо понимают человека, они могут отмалчиваться даже тогда, когда получают вполне невинный вопрос. Это не всем нравится.
- GigaChat почему-то не пишет стихи, хотя это довольно популярный запрос среди тех, кому требуется креатив в текстах. Ранее нейросеть напрямую отвечала, что такого функционала у неё нет, однако сейчас этот навык, по всей видимости, в разработке. GigaChat не отказывается сочинить стихотворение, но оно получается откровенно мало похожим на рифмованное произведение.
Чтобы улучшить работу нейросети, разработчики пользуются также и обратной связью от пользователей. Каждому результату генерации можно поставить лайк или дизлайк.
Как правильно составлять промпты для GigaChat
Промпт-инжиниринг важен для качественной работы любой нейросети и получения того результата, который вы задумали. Можно набраться опыта на практике, тем более, что нейросети и сами пока не идеальны в понимании языка и их совершенствуют в реальном времени.
Но разработчики GigaChat предлагают и собственный каталог промптов с удачными примерами для генерации текстов, картинок и кода. Также можно ознакомиться с советами о том, как составлять текстовые запросы. Нейросети можно задать простой вопрос, попросить прокомментировать текст или его фрагмент, которые вам непонятны, описать свою идею, предложить образцы.
Для удобства промпты распределены по темам: образование, маркетинг, кулинария, психология, быт и другие сферы.