Искусственный интеллект становится доступнее, и все больше пользователей пробует себя в роли ИИ-креаторов. Наверняка вы и сами игрались с «Шедеврумом», примеряя на фотографии образы эльфов и аниме-персонажей или, может быть, генерировали картинку-поздравление с днем рождения для рабочего чата. Готова поспорить, далеко не каждый раз результат получался таким, каким вы себе его представляли.
Часть того самого детского алфавита от ChatGPT
Неужели нейросети еще недостаточно хороши в подобных задачах? Нет, просто нужно научиться объяснять им свои идеи. Как раз этим сейчас и займемся.
Искусственный интеллект примечателен тем, что его применение в большинстве случаев не требует знания специальных языков программирования. Большие языковые модели (LLM) и генераторы изображений могут распознавать команды на привычных нам естественных языках, например, русском или английском.
Запросы, которые мы вводим в специальном окне для взаимодействия с нейросетью называются промптами.
Строка ввода ChatGPT
Слово «промпт» появилось в русском языке недавно. Оно пришло к нам вместе с нейросетями из англоязычных стран, от prompt – запрос, подсказка. Соответственно, заимствованное слово должно писаться как в оригинале, с буквой «п». Читается не слишком удобно, но ничего не поделаешь: такая форма уже зафиксирована в орфографическом словаре.
По данным сайта «Грамота.ру», правильно писать «промпт»
Оба понятия обозначают процесс написания промптов, и многие источники используют их как синонимы.
Однако мы будем считать, что: промптинг – это «общение» с нейросетью на базовом уровне, интуитивная постановка задач обычными пользователями; а промпт-инжиниринг – профессиональное составление промптов людьми, которые хорошо знают, как устроены нейросети, и умеют их обучать. Во втором случае также подразумевается работа со специальными командами, параметрами, настройками ИИ, которая больше напоминает программирование.
Скриншот из курса по работе с GigaChat от «Сбера»
В этот раз мы не будем вдаваться в подробности и обсуждать настройки различных нейросетей. Сейчас нас интересует другое.
Нейросети хотя и распознают человеческий язык, но не понимают его. Поэтому запросы надо формулировать несколько иначе, не так, как вы попросили бы друга, коллегу или ассистента. Представьте, что даете задание роботу – они любят четкие инструкции и алгоритмы. С искусственным интеллектом нужно разговаривать подобным образом.
Вы, наверное, замечали, что многие шаблоны промптов начинаются со слов «Действуй как […] с 10-летним опытом…». На первый взгляд это немного странно и как будто бы ни на что не влияет, ведь не станет же нейросеть нужным нам специалистом, если мы ее об этом попросим. А нет, на самом деле эта строчка действительно важна. Чтобы понять почему, разберем структуру промпта.
Разбор промпта для ChatGPT
Однако не всегда все основные элементы используются в одном запросе – дальше расскажу об этом подробнее.
Попросить о чем-то нейросеть можно по-разному, у каждого подхода свои преимущества и недостатки. Важно понимать, какой вариант лучше сработает в конкретной ситуации – давайте рассмотрим несколько способов «общения» с GPT.
Пятый метод промптинга с поэтапным решением крупных задач мне нравится больше всего. Так ИИ выступает в роли личного ассистента, а не становится основным автором контента. Искусственный интеллект экономит время на изучении вводных данных и аналитике, плюс прописывание каждого шага в запросах помогает не упустить из вида ничего важного. Аналогичным образом работали Тони Старк и Д.Ж.А.Р.В.И.С. в фильме «Железный человек».
Хотя для взаимодействия и с LLM, и с графическими моделями используются промпты, формулировка запросов для этих ИИ отличается, потому что они решают принципиально разные задачи: одни создают тексты, другие – картинки.
Для генераторов изображений промпты пишутся в виде перечисления ключевых слов и фраз без сложной грамматической структуры. Связный текст используется редко, в основном, когда нужно описать пространственные отношения объектов в кадре.
Portrait of a woman, watercolor style, soft lighting, realistic eyes;
A dog sitting on a chair.
Порядок слов имеет значение. Нейросеть в первую очередь фокусируется на первых 3–7 словах, воспринимает этот фрагмент как главную сцену. Поэтому в начале промпта нужно указать центральный объект, персонажа. Далее будут элементы второго плана, детали, описание фона или атмосферы, а в конце – стиль, ракурс, размер и прочие технические параметры.
Пример хорошего промпта:
A young woman is reading a book in a cozy cafe, warm lighting, vintage interior, soft focus, photorealistic, shot with 50mm lens.
Также важно уметь сохранять баланс в количестве деталей: слишком общий запрос = скучная картинка, слишком перегруженный = каша.
«Человек учит робота»
«Человек с указкой стоит у доски в классе, на доске написаны русские буквы, рядом робот за партой пишет в тетрадь»
Учитывайте, что генерация картинок более вариативна и непредсказуема, чем создание текста – один и тот же промпт может давать совершенно разные результаты при каждом запуске.
В генераторах изображений есть такая штука как negative prompt. И это не про готический стиль, негативы из пленочной фотографии или что-то неприятное. Это особая часть запроса, в которой можно указать ИИ, что НЕ должно присутствовать на картинке.
Функция появилась из-за того, что нейросети на ранних этапах развития часто допускали ошибки – галлюцинации. На картинках возникали лишние руки, дополнительные головы и т. п. Пользователи начали писать в промптах «не показывай пальцы» или «без третьей ноги», но нейросети плохо воспринимают отрицательные частицы и предлоги – недочетов становилось только больше.
Негативный промпт как инструмент точечной коррекции позволил добиться более точных результатов, не тратя время на десятки раз перегенерации.
В интерфейсах одних нейросетей (например, Stable Diffusion и «Кандинский») есть специальное окно для негативного промпта, в других (Midjourney) нет отдельного поля, его прописывают прямо в обычном промпте, через параметр —no.
Если хотите использовать негативные промпты, вот несколько ключевых слов, которые могут сделать изображение лучше: >
Blurry, low quality, jpeg artifacts – картинка будет четче;
extra limbs, bad anatomy, fused fingers – не будет лишних частей тела;
ugly – генератор постарается избегать ассоциаций с уродством;
lowres, watermark, deformed, distorted, disfigured – ИИ старается не делать ошибок, свойственных слабой генерации.
Однако, как показывает практика, негативный промпт работает не всегда. Например, в LLM технология не поддерживается.
GigaChat и ChatGPT, наоборот, добавили объекты, указанные через параметр —no
«Кандинский», хотя у него и есть возможность добавить негативный промпт, учел не все условия: картинка получилась размытая
Stable Diffusion – единственная нейросеть, где негативный промпт сработал на «отлично»
Необязательно каждый раз изобретать велосипед, особенно если задача типовая. Для большинства целей уже существуют готовые промпты или сервисы, которые помогут сгенерировать желаемое. Их тоже можно использовать, нужно только немного скорректировать и доработать запрос.
Есть сайты, на которых размещают готовые платные и бесплатные промпты практически для всех digital-сфер: маркетинг, программирование, дизайн, обучение и так далее. Однако пользоваться ими нужно осторожно, с умом. Дело в том, что промпт, написанный под одну нейросеть, может не подойти для другой, и по достаточно подробному запросу ИИ выдаст какую-нибудь ерунду. Но почему бы и не попробовать?
Вот несколько таких площадок:
Кто лучше расскажет о том, как написать промпт для нейросети, чем сам искусственный интеллект? Попросить помочь с составлением запроса можно любую языковую модель (например, ChatGPT) или специально обученного бота, который сгенерирует промпт по вашему описанию задачи.
Сервисы для создания и улучшения промптов:
Чтобы получить качественный результат от нейросети, будь то текст или изображение, важно сформулировать эффективный запрос. Делимся еще несколькими советами, как это сделать.
Для каждой темы создавайте свое обсуждение
LLM учитывают контекст чатов и могут запутаться, если вы сначала просите текст для сайта металлургического завода, потом – список идей для видео в блог авиакомпании. Модель может все перепутать и начать отвечать не так, как вы ожидаете.
Выбирайте нужный язык для «общения» с ИИ
Большинство генеративных моделей обучалось в основном на англоязычных материалах, однако они поддерживают и другие языки. Вы можете писать запросы на русском, и нейросеть будет выдавать вполне неплохие ответы. Но есть нюансы.
Когда лучше писать по-русски:
Когда стоит использовать английский:
Тестируйте разные формулировки и будьте готовы к итерациям
Хороший промпт редко получается с первого раза. Если результат вам не нравится, перепишите запрос или попросите нейросеть переписать ответ, указав конкретные правки.
Не пренебрегайте настройками и параметрами
У многих нейросетей есть дополнительные опции: температура, поиск в сети, режим рассуждения, выбор модели и пр. Разберитесь, как работают эти функции, и сможете в большей степени влиять на ответы ИИ.
Пишите промпты без ошибок
Двусмысленные формулировки, излишние метафоры, неточности и даже грамматические ошибки «сбивают с мысли» искусственный интеллект. Из-за некачественных промптов в генерациях могут возникать галлюцинации, а еще ваша манера переписки с нейросетью влияет на стиль ответов.
За чем ты там следишь, ChatGPT?
Кстати, лайфхак. Ответы будут точнее, если просить ИИ каждый раз проверять самого себя.