Как мы с помощью Midjourney визуализировали понятия из мира ИТ на картах «‎Имиджинариума»

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Всем привет! Хочу поделиться необычным кейсом из моей практики – созданием иллюстраций для игровых карточек «‎Имиджинариума» с использованием нейросети Midjourney. Наша команда визуализировала выражения и понятия из мира ИТ. Мы представили, как может выглядеть на карточках настольной игры Agile, путь пользователя, удаленный доступ, оживили системы видеонаблюдения, пофантазировали над человеческим обличием бекенда, стартапа или дедлайна. Об этом – новая статья в блоге ЛАНИТ. Бонус – под катом вас ждут очень много красивых картинок и ссылка на составленный мной гайд по работе с промтами в Midjourney. 

Сделать что-то яркое и необычное при участии искусственного интеллекта мы задумали неспроста: ЛАНИТ давно изучает потенциал и сферы применения ИИ. А с активным развитием нейронных сетей стало возможно использовать технологии ИИ не только в больших проектах, но и для решения небольших задач. Прошедший год мы, как и все пользователи нейросетей, методом проб и ошибок познавали, что умеют Kandinsky, Stable Diffusion, Шедеврум, Midjourney и другие сетки. Ведь предел возможностей генеративных моделей не изучен, о чем говорят и их создатели. 

С постановкой креативной задачи для нейросетей, а заодно и для нашего арт-отдела, помог приближающийся Новый год. Мы задумали подарить партнерам компании запоминающийся презент, но такой, что не будет пылиться на полке. Так, мы решили, что это будет настольная игра «‎Имиджинариум», но необычная, а с набором карт о мире информационных технологий. 

Хранитель данных, звуковые системы, капча и еще более 60 карточек

На воплощение идеи мы запланировали полтора месяца. За это время нам, дизайнерам, предстояло нарисовать 65 карт, на каждой из которых представить понятие или крылатое выражение из мира ИТ. Были и нюансы. 

  • От нас требовалось визуально представить процессы и понятия, которые на картинах уж точно не встретишь. Например, стартап, хранитель данных, звуковые системы, дедлайн.

  • Карточки должны быть в разных стилях. Об этом знают все, кто играл в «‎Имиджинариум». 

Вот лишь некоторые понятия, объекты, процессы и т.п. из мира ИТ, которые пришли в голову нашим коллегам-маркетологам во время мозгового штурма и передали в качестве технического задания. 

Этот список стал для нас отправной точкой. 

Мы работали в тандеме с нейростетью Midjourney и ботом Discord, в котором как раз и писали промты. Она популярна, и в открытом доступе можно отыскать много советов по составлению промтов (текстовых запросов к нейросети). Вдобавок, Midjourney очень долго лидировала и в рейтинге Googlе (хотя, как видно из второго графика, Stable Diffusion уже осенью 2023 года ее догнал). 

Упомяну еще несколько важных технических моментов. На старте работы мы оплатили подписку на Midjourney картой иностранного банка  (летом 2023 года стоимость подписки в пересчете на рубли составляла около тысячи рублей), поскольку бесплатное пользование сервисом уже стало недоступно. 

Также благодаря подписке можно добавлять бот Midjourney на свой сервер в Discord (платформу для общения, в которую интегрирована нейросеть) и взаимодействовать с ИИ-помощником без задержек и необходимости искать сгенерированное изображение в потоке сообщений других пользователей.

К серверу могут подключиться и коллеги. Однако учтите, что для взаимодействия с Midjourney им также придется приобрести подписку или же создавать изображения, используя ваш оплаченный профиль. 

«Послушные и непослушные» промты

На старте мы были полны энтузиазма и думали, что справимся с задачей очень быстро: ведь нам помогал всемогущий ИИ. К тому же художники еще задолго до появления информационных технологий и уж тем более искусственного интеллекта пытались изобразить на своих полотнах такие непростые понятия, как жизнь (картина «Жизнь», написанная Пабло Пикассо), память (работа Сальвадора Дали «‎Постоянство памяти»). 

На деле же было все непросто. Нейросеть Midjourney оказалась не такой уж и волшебной программой и к тому же непослушной. «Гибкость на минималках», – сказала бы я.

Если вам нужно изобразить кота, летящего в космосе, – эта программа однозначно для вас. Если вам, как и нам, необходимо создать картинку под кодовым названием «путь пользователя» или Agile, то здесь придётся попотеть. 

Нейросеть работает на базе бота Discourd и была обучена  на нетривиальном дата-сете, по всей видимости. Поэтому получить то, что вы вообразили, будет весьма и весьма сложно. Конечно, случалось, что нейронка понимала нас с полуслова, но чаще на генерацию одного изображения (подготовку дополнительных промтов для доработки рисунка) требовались несколько часов или целый день, или вся ночь. Нейросеть сопротивлялась и видела результат по-своему, не такой, что ждали от нее мы. И лишь художественно-образный склад ума нашей команды и креативный подход покорили Midjourney. Мы заставляли ее «слушаться» и подталкивали в нужном направлении промтами. За время работы у нас даже появился свой сленг, например «послушный» и «непослушный» промт.

Расскажу подробнее об этом на примерах создания нескольких карточек. 

Python-разработчик

Интересной была работа над изображением Python-разработчика. Имея представление, насколько непрост этот язык программирования, мы вообразили себе серьезного мужчину с величественной змеей. Такую карту в итоге и увидят игроки «Имиджинариума». 

Но она получилась не сразу. Сначала нейросеть выдала нам по запросу милого мультяшного чудика. 

Следующая попытка сделать разработчика серьезнее привела к угрюмому старцу. 

И лишь спустя сутки сражений с Midjourney мы добились желаемого результата. Делимся также промтом, который привел к нему. 

Имейте в виду, что каждое слово из ассоциативного ряда, содержащееся в промте, меняет картинку до неузнаваемости. Нейросеть может как додумать самостоятельно детали, создать композицию, так и разрушить всю задумку, начав креативить в другом направлении. 

Цифровой звук

С карточкой «‎цифрового звука» нам повезло: Midjourney с первой попытки угадала, что мы хотим. 

Умный дом 

Мы представляли технологичное сооружение с руками и ногами, которое катится по дороге на скейте, в модной бейсболке. Казалось, что может быть проще. Однако наш ИИ-помощник снова наотрез отказывался слушаться и упорно выдавал нам людей (пусть на скейтах и в бейсболках) на фоне домов, но не «очеловечивал» саму постройку.  

Когда же мы попросили Midjourney нарисовать дома с глазами, то получили это:

Нам ничего не оставалось, как отказаться от первоначальной задумки. Мы решили сделать что-то яркое и необычное в 3D-стиле. И, действительно, получилось цепляющее взгляд изображение, но совершенно не подходящее для игры (все, кто играл в «Имиджинариум» знают, что на карточках не нарисовано ничего конкретного, а лишь предметы и объекты, вызывающие ассоциации с кем-то или чем-то). 

Однако картинка посередине натолкнула нас на мысль, как еще можно изобразить «умный дом». Мы ее доработали и получилась та самая картина, которую мы забрали в наш набор карт. 

Инкассация

Иллюстрация к этой карточке родилась случайно. Задача была другой – нарисовать банкомат. Мы долго пытались изобразить его в фантазийном виде, но получалось все не то. В итоге я стала представлять себе, что же происходит с банкоматом в течение дня. Например, к нему подходят инкасаторы. Воображение рисовало мне суперменов, ответственных за важные операции с купюрами. 

Я нашла изображение человека, которого представляла в роли инкассатора, и оно мне очень понравилось по стилю. Кроме этого, использовала обычное фото банкомата, а точнее, лишь часть снимка с летящими купюрами. И предложила Midjourney сделать гибрид двух картинок. Направить в нужное русло безграничную фантазию ИИ вновь помогли промты. 

Отражена мимика эмоционально непробиваемого человека, чем нам и понравилась иллюстрация. 

Использовать несколько изображений для создания гибрида – эффективный способ заставить нейросеть отойти от шаблонов и получить прекрасный результат. 

Офисный планктон 

«Все решает мгновение»... В случае с нейросетью «все решает стиль» (по крайней мере, очень многое). Еще в начале работы над набором карт я отыскала на одном из сайтов полезную таблицу со стилями. Это был огромный список художников и иллюстраторов с примерами, как может выглядеть изображение, если применить при обработке их стиль. 

Поначалу я наивно полагала, что так и будет. Однако когда использовала упомянутые в таблице стили для придуманных нами иллюстраций, то получала совсем не тот результат. Когда казалось, что для карточки идеально подходит стиль работ Энди Уорхола или Туве Яннсон, то ждало разочарование. Подбирать стиль для каждой из картинок приходилось методом многочисленных проб и ошибок. 

И все же знать стили художников или мультипликаторов очень полезно при написании промтов. К примеру, обращение к творчеству канадского иллюстратора Йона Классена помогло нам при создании карточки «офисный планктон». 

Удаленный доступ

Визуализировать «удаленный доступ» мы решили нестандартно – поместили фото компьютера в лесной пейзаж. Уместным оказался и стиль Клода Моне. 

Иногда нам трудно было выбрать одно изображение, так как по запросу Midjourney генерировала сразу несколько любопытных картинок. 

java-разработчик
java-разработчик
капча
капча
дедлайн
дедлайн

Вместо заключения 

Главное, что мы для себя уяснили за время работы над нашим «Имиджинариумом», – общаться с Midjourney надо, как с младенцем. Впрочем, это и неудивительно, ведь нейронка появилась на свет лишь в феврале этого года. Вам придется подстроиться под мир алгоритмов и давать сети задания на уровне команд без красивостей, и лучше во всех промтах избегать отрицаний (но, не, кроме, без)

Золотое правило создания всех промтов выглядит так:

В конце промта указывается разрешение, в котором требуется иллюстрация. Мы заказывали картинки с разрешением 8k: этого значения достаточно для получения качественного изображения для веб или для печати небольших форматов.

Итак, давайте отметим плюсы и минусы работы в Midjourney.

Плюсы работы в Midjourney:

  • ​​понятный интерфейс,

  • много стилей,

  • есть опция создания “гибрида” из нескольких изображений. 

Минусы работы:

  • сложно добиться того, что хочется (особенно абстрактного по ТЗ),

  • сложно контролировать результат.

Однозначно на создание этих же изображений несколькими художниками и иллюстраторами понадобились бы не один, не два и не три месяца. Или же много иллюстраторов, а, соответственно, и много денег на их оплату. Умение разговаривать на языке команд и промтов, «языке робота», позволило ускорить весь процесс и выполнить работу качественно и в срок. Это непросто (ведь профессиональных промт-инженеров в нашей команде не было), но за этим навыком будущее, и без него не получится двигаться вперед. 

Напоследок, как и обещала много красивых карточек из нашего набора. Заваривайте чай и готовьтесь к просмотру. 

Хранитель данных
Хранитель данных
Системы видеонаблюдения
Системы видеонаблюдения
Бекенд
Бекенд
 Стартап
 Стартап
 Стажёр-тестировщик
 Стажёр-тестировщик
Телемедицина
Телемедицина
Путь пользователя
Путь пользователя

Надеюсь, контент был для вас полезен. Делитесь в комментариях своими коммерческими графическими работами, созданными в нейросетях. И ловите бесплатный гайд по работе в Midjourney

Источник: https://habr.com/ru/companies/lanit/articles/781920/


Интересные статьи

Интересные статьи

Вот таких тирекс-тянок выдает нейросеть Текст про Midjourney привлек внимание, и в комментариях наметилась дискуссия про Stable Diffusion. Аргументы убедили меня попробовать SD самостоятельно, но в...
Язык программирования Go стал популярным для написания приложений командной строки. Для этого может быть много причин, но один аспект, в котором выделяется Go, — это возможность ск...
Сегодня решили обсудить тему информационной безопасности. Публикуем перевод статьи Kunal pandey, обнаруживаем уязвимости и работаем на опережение! Введение Кража персональных данных (PI...
Технология ESP-NOW — это упрощенный протокол связи WiFi с передачей коротких пакетов между парами сопряженных устройств, разработанный и выпущенный Espressif в 2016.07 для микроконт...
Привет, Хабр! Раньше я жаловался на жизнь в парадигме Infrastructure as code и ничего не предлагал для решения сложившейся ситуации. Сегодня я вернулся, чтобы рассказать, какие подходы и практики...