Текст книги "Невероятный искусственный интеллект Easy Diffusion. Учебное пособие для школьников средних и старших классов"

Текст добавлен: 28 сентября 2023, 05:40

Автор книги: Александр Чесалов

Жанр: Прочая образовательная литература, Наука и Образование

Возрастные ограничения: +12

сообщить о неприемлемом содержимом

Авторские права соблюдены

Текущая страница: 2 (всего у книги 8 страниц) [доступный отрывок для чтения: 2 страниц]

Скачать книгу

Шрифт:

- 100% +

«Help & Community» / «Помощь и сообщество»

За окном «Settings» / «Настройки» идет окно «Help & Community» / «Помощь и сообщество».

Окно «Help & Community» / «Помощь и сообщество»

В этом окне, перейдя по одной из ссылок, вы можете самостоятельно изучить дополнительную информацию о работе с приложением, узнать об установке дополнительных моделей и модулей (плагинов), а также присоединиться к сообществу пользователей системы или скачать ее исходные коды.

«Merge models» / «Объединить модели»

За окном «Help & Community» / «Помощь и сообщество» идет окно «Merge models» / «Объединить модели».

Как вы уже догадались из названия, при помощи этого окна можно объединять между собой различные модели. Например те, что мы скачивали после установки из сети Интернет.

Если вам нравится пара каких-то моделей, с которыми вы работаете чаще всего, вы можете объединить их в одну модель и дать ей свое название. Но тут есть одно небольшое ограничение: модели должны быть однотипными.

Окно «Merge models» / «Объединить модели»

Из своего опыта скажу, что в объединении моделей особой необходимости нет. Но, если вы пользуетесь двумя десятками разных моделей, возможно, вам пригодится данная функциональная возможность приложения Easy Diffusion для объединения по нужным тематикам или стилям.

«What’s now» / «Что нового»

За окном «Merge models» / «Объединить модели» идет окно «What’s now» / «Что нового». В этом окне представлен список всех обновлений и изменений, которые были сделаны для текущей и предыдущих версий приложения Easy Diffusion.

Шаг 5. Приступаем к работе

Для того чтобы нам создать свое первое изображение, переходим в рабочую область программы (окно «Generate» / «Создать»):

Рабочая область программы Easy Diffusion

В окне «Generate» («Создать») слева вы увидите панель инструментов, которая позволяет ввести описание и определить все необходимые параметры изображения, которое мы хотим создать:

Панель инструментов

Обратите внимание, над панелью инструментов находятся две дополнительные кнопки:

– «Load from a file» / «Загрузить из файла». Эта кнопка позволяет загрузить текст с описанием созданной ранее картинки из файла (например, из файла формата «JSON»). Она очень полезна, когда вы работаете с большим количеством изображений. Ранее в окне «Settings» («Настройки») мы активировали опцию «Auto-Save Images» («Автосохранение изображений») и определили «Metadata format» («Формат метаданных») как текст «txt». Таким образом наша система сохраняет все ваши изображения и описания в текстовом формате автоматически.

– «Image Modifiers» / «Модификаторы изображения». Очень полезная кнопка, особенно на первых порах, когда вы еще не научились составлять сложные описания новых изображений. В модификаторах вы можете выбрать несколько разных фильтров для своих изображений.

Кнопка «Image Modifiers» / «Модификаторы изображения»

Для того чтобы создать наше первое изображение из текста, в окне «Enter Prompt» нам необходимо написать правильный текстовый запрос («Prompt»):

Окно «Enter Prompt» («Ввод запроса»)

Давайте в окне «Enter Prompt» напишем следующий запрос на английском языке: «artificial intelligence that will change the world, white picture» («искусственный интеллект, который изменит мир, белая картинка»).

А также в разделе «Image Settings» («Настройки изображения») выполним следующие действия:

– выберем алгоритм «Realistic Vision»: «realisticVisionV40_v40VAE»;

– Sampler (Сэмплер): Euler Ancestral.

Все остальные параметры оставляем без изменений и жмем кнопку «Make image» («Создать изображение»).

Ура!

Вы создали свое первое изображение при помощи искусственного интеллекта. Оно находится справа от панели инструментов:

Рабочая область программы Easy Diffusion

Тут необходимо сделать небольшое отступление.

Если у вас не получилась такая же картинка, как у меня, не пугайтесь и пробуйте создать ее снова. Очень часто в Easy Diffusion нужное изображение может получиться со второго, третьего или пятого раза. Это особенность работы программы. Часто такое бывает еще и с простыми запросами, как у нас в примере.

Следующим нашим шагом будет изучение вариантов улучшения и работы с изображением, которые чаще всего необходимо выполнить после того, как мы создадим любое изображение. Для этого наведите курсор мышки на новое изображение, и вы увидите следующие команды:

– «Upscale» («Масштабировать»). Если новое изображение вам нравится, и вы считаете, что нет необходимости его улучшать далее, выполните команду «Upscale». После чего изображение будет увеличено до максимального разрешения 2040х2048 и вы его сможете сохранить на компьютере.

– «Fix faces» («Исправить лица»). Команда исправляет лица на изображениях. Чаще всего на изображениях страдают пальцы и детали лиц.

– «Draw another 25 steps» («Нарисовать еще 25 шагов»). Если вы считаете, что изображение нужно улучшить, выполните команду «Draw another 25 steps». Часто бывает так, что деталей картинки станет больше и ее качество станет лучше. Бывает и так, что особых изменений не заметно. Тут требуется терпение и упорство.

– «Make Similar Images» («Сделать несколько похожих изображений»).

– «Download Image» («Скачать изображение»). Команда сохраняет ваше изображение в нужном вам месте.

– «JSON». Команда сохраняет описание и все параметры созданного вами изображения в размеченном файле. Его можно загрузить в следующий раз, когда вы захотите создать подобное изображение, нажав кнопку «Load from a file» («Загрузить из файла»).

– «Use as Input» («Использовать как входные данные»). Это очень полезная команда, которая позволяет улучшать изображение из раза в раз. При ее использовании система искусственного интеллекта берет за основу не только наш запрос, но и ваше изображение, на основе чего создается новое изображение. Подробнее работу этой команды мы рассмотрим в следующей главе.

Теперь давайте сделаем еще 25 шагов для улучшения нашего изображения, выполнив команду «Draw another 25 steps» («Нарисовать еще 25 шагов»):

Рабочая область программы Easy Diffusion

В результате мы получим похожее изображение, но с некоторыми изменениями:

Рабочая область программы Easy Diffusion

Теперь вернемся к нашему первому изображению «искусственного интеллекта», которое находится ниже.

Наведем курсор мышки на картинку и выбираем команду «Make Similar Image» («Сделать похожее изображение»). Эта команда позволит нам создать из исходного варианта еще пять новых вариантов изображений.

Рабочая область программы Easy Diffusion

Все новые варианты будут размещены в одном окне программы:

Рабочая область программы Easy Diffusion

Этой функцией можно пользоваться неограниченное количество раз, до тех пор пока вы не получите устраивающий вас вариант изображения. Именно так я и делал, когда выбирал картинки для обложки книги.

После того как вы выберете подходящий для вас вариант, все остальные изображения можно удалить. Наведите мышку на то изображение, которое хотите удалить, и нажмите крестик в правом вернем углу:

Рабочая область программы Easy Diffusion

Таким образом, в окне останутся те изображения, которые вам нужны для дальнейшей обработки.

Как я раньше отмечал, у всех без исключения моделей, которые мы дополнительно установили в Easy Diffusion, есть один существенный недостаток – они плохо прорисовывают глаза или пальцы рук, а также очень часто на картинках появляются разные странные артефакты. Чтобы откорректировать глаза на понравившемся нам изображении, необходимо снова навести мышку на картинку и выполнить команду «Fix Faces» («Исправить лица»):

Рабочая область программы Easy Diffusion

В качестве примера я оставлю одно лицо «искусственного интеллекта» с буквой «A» на лбу и выполню для этого изображения команду «Fix Faces».

Необходимо сделать небольшое замечание и уточнить, что команда «Fix Faces» достаточно часто не улучшает изображение, а порой его портит. Тем не менее всегда стоит попробовать, что может получиться из ваших экспериментов. Будьте смелее и чаще экспериментируйте.

Рабочая область программы Easy Diffusion

Ну и наконец полученный финальный результат (который нам больше подходит) нужно перевести в более высокое разрешение и сохранить его на нашем жестком диске для того, чтобы потом использовать его для дальнейшей работы. Для этого выполняем команду «Upscale» («Масштабировать»), наведя курсор мышки на рисунок.

Рабочая область программы Easy Diffusion

После этого выполняем команду «Download Image» («Скачать изображение»). Скачанное изображение будет с разрешением 2040 х 2048 пикселей на дюйм. Этого вполне достаточно, чтобы оформить обложку книги или сделать красивую открытку.

Поздравляю вас!

Вы создали свое первое уникальное изображение при помощи системы искусственного интеллекта Easy Diffusion, которое можно смело назвать маленьким произведением цифрового искусства.

В последующих главах книги мы узнаем много нового об искусственном интеллекте и повысим наш уровень знаний при работе с программой Easy Diffusion.

Шаг 6. Создаем красивое изображение

Как вы уже успели узнать из прошлой главы, система искусственного интеллекта Easy Diffusion может сделать новое уникальное изображение из текста, из другого изображения или из сочетания того и другого (при помощи команды «Use as Input» / «Использовать как входные данные»).

В этой главе мы с вами рассмотрим самый интересный вариант работы с системой Easy Diffusion – создание нового изображения из сочетания текста и другого изображения. Также мы уделим внимание написанию более сложного запроса.

Итак, начнем…

Для того чтобы создать изображение из текста, в окне «Enter Prompt» нам необходимо написать правильный текстовый запрос («Prompt»):

Окно «Enter Prompt» («Ввод запроса»)

Обратите внимание на то, что в окне «Enter Prompt» мы пишем не литературное описание той картинки, которую хотим получить, а именно запрос. Искусственный интеллект, с которым мы работаем, к сожалению, еще не читает наши мысли, и для него важно, чтобы мы говорили с ним на понятном ему языке. Уже большое достижение разработчиков заключается в том, что запрос пишется набором из ключевых фраз (состоящих из простых для понимания и человека, и машины слов), разделенных запятой, и исключительно на английском языке.

Давайте рассмотрим конкретный пример.

Мы создадим с вами изображение киборга с искусственным интеллектом.

Для этого выполним следующие действия:

– В окне «Enter Prompt» напишем следующую фразу на английском языке: «Artificial intelligence cyborg» («Киборг с искусственным интеллектом»). Если у вас возникли сложности с переводом, то рекомендую пользоваться помощью онлайн-переводчиков.

– Выберем алгоритм «Realistic Vision».

– Автоэнкодер (Custom VAE): vae-ft-mse-840000-ema-pruned. Автоэнкодер будет вам полезен в дальнейшей работе. Он помогает решить проблему с появляющимися артефактами и дефектами на лицах.

Найти файл можно в сети Интернет, а также скачать по ссылке:

https://huggingface.co/stabilityai/sd-vae-ft-mse-original/blob/main/vae-ft-mse-840000-ema-pruned.ckpt

Скачанный файл нужно перенести в папку:

С: EasyDiffusionmodelsvae

или

D:EasyDiffusionmodelsvae

Если не получается найти и скачать файл, оставьте поле пустым.

– Sampler (Сэмплер): DPM++2s Ancestral (Kerras)

Все остальные параметры оставляем без изменений и жмем кнопку «Make image» («Создать изображение»).

Рабочая область программы Easy Diffusion

Давайте в окне «Enter Prompt» добавим небольшое уточнение про цвет глаз нашего киборга: «Artificial intelligence cyborg, green eyes».

Все остальные параметры оставляем без изменений и жмем кнопку «Make image».

В результате мы получим изображение, похожее на предыдущее, но уже цвет глаз киборга будет зеленым:

Рабочая область программы Easy Diffusion

Обратите, пожалуйста, свое внимание на то, что Easy Diffusion обрабатывает ваш запрос слева направо по порядку следования фраз, разделенных запятой.

Основная магия искусственного интеллекта заключается в том, что даже если вы все сделали так же, как я, то в большинстве случаев вы получите либо совсем другую картинку, либо очень похожую, при условии, что вы нажмете на кнопку «Make image» много раз.

Связано это с тем, что система Easy Diffusion каждый раз будет интерпретировать фразу «Artificial intelligence cyborg» как ей захочется, по причине того что наша ключевая фраза очень простая и носит общий характер, а также требует дополнительных уточнений.

Сделаем еще один шаг. В окне «Enter Prompt» добавим уточнение про цвет волос нашего киборга: «Artificial intelligence cyborg, green eyes, blue hair».

Все остальные параметры оставляем без изменений и жмем кнопку «Make image».

В результате мы получим изображение, похожее на предыдущее, но уже цвет волос киборга будет… зеленым:

Рабочая область программы Easy Diffusion

Как же так?

Мы же определили, что цвет волос должен быть голубым.

Для такого случая есть еще один полезный прием, который заставит искусственный интеллект обратить более пристальное внимание на наше уточнение про волосы.

Для этого в нашем запросе мы можем выставить приоритеты (соответствующие веса для фраз в интервале от 1 до 100), на которые система обратит особое внимание. Этот прием я позаимствовал из одного учебного курса22
Нейросеть Stable Diffusion. Обзор. Как пользоваться. Инструкция. [Электронный ресурс] supermicrostock.ru URL: https://supermicrostock.ru/stable-diffusion-obzor-how-to-use-guide/ (дата обращения: 28.08.2023).

[Закрыть].

В окне «Enter Prompt» добавим веса для цвета глаз и цвета волос нашего киборга: «Artificial intelligence cyborg, green eyes:20, blue hair:80».

Все остальные параметры оставляем без изменений и жмем кнопку «Make image».

Рабочая область программы Easy Diffusion

Я использовал следующий синтаксис весов в запросе из соображения того, что, увидев текст «Artificial intelligence cyborg, green eyes:20, blue hair:80», система искусственного интеллекта будет обрабатывать его слева направо, но обратит особое внимание на то, что 20% своих усилий она должна отдать на рисование зеленых глаз, а 80% усилий направить на рисование голубых волос.

Должен сказать, что этот прием хоть и сработал (я проверил его много раз), но до конца я не уверен, что его использование является верным решением.

Существуют два правильных и проверенных способа расставить приоритеты (веса для определенных фраз) в нашем запросе, чтобы обратить внимание системы искусственного интеллекта на порядок обработки запроса.

Рассмотрим два способа, которые описаны в справке к программе:

– Первый способ. Использовать следующий синтаксис при распределении приоритетов: «Artificial intelligence cyborg, green eyes:1.2, blue hair:1.8». Этот пример похож на вышеописанный. Веса можно присваивать любым фразам, разделенных запятыми. Например: «Artificial intelligence cyborg:0.8, green eyes:1.2, blue hair:1.8».

Этот пример, как и описанный выше, требует проверки его работы экспериментом.

– Второй способ. Порядок обработки запроса можно определить с помощью круглых « ()» и/или квадратных скобок « []».

Например, предыдущий запрос мы можем написать так: «Artificial intelligence cyborg, [green eyes], (blue hair)».

Или, чтобы усилить акцент, пишем так: «Artificial intelligence cyborg, [[green eyes]], ((blue hair))», где

(фраза в одних круглых скобках) – увеличивают акцент на фразе на 10%,

((фраза в двух круглых скобках)) – увеличивают акцент на фразе на 20%,

[фраза в одних квадратных скобках] – уменьшают акцент на фразе на 10%, и т. д.

[[фраза в двух квадратных скобках]] – уменьшают акцент на фразе на 20%, и т. д.

Практика показала, что использование скобок работает лучше, чем числовые приоритеты. Я рекомендую вам использовать круглые скобки « ()» для усиления или квадратные скобки « []» для ослабления значений фраз в ваших запросах.

Таким образом, всего за четыре шага мы создали киборга с зелеными глазами и синими волосами очень похожего на простого человека:

Киборг с человеческим лицом

На первый взгляд, может показаться, что сила приоритетов сместила акцент на внешний вид и совсем забыла, что мы хотели создать киборга.

И тут я должен раскрыть вам свой небольшой секрет (о котором намекнул в предыдущей главе).

Все дело в том, чтобы каждый раз система искусственного интеллекта не создавала совершенно новое и ненужное мне изображение, я воспользовался приемом, который мне позволил реализовать эволюцию моего первого изображения и в конечном итоге получить последнее.

Другими словами, я создал первую картинку из текста, а все последующие из текста и предыдущих версий изображений, воспользовавшись командой «Use as Input» (которая появляется при наведении мышкой на изображение):

Рабочая область программы Easy Diffusion

Таким образом, алгоритм моих действий был таков:

– Шаг 1. Создаю первое изображение из текста «Artificial intelligence cyborg». После того как первая картинка (а может, вторая или третья, но которая очень понравится) будет создана, использую команду «Use as Input», чтобы сказать искусственному интеллекту: «бери ее за основу, потому что она мне очень нравится».

– Шаг 2. Создаю второе изображение из текста «Artificial intelligence cyborg, green eyes». Использую команду «Use as Input» на второй картинке, чтобы сказать искусственному интеллекту: «бери вторую картинку за основу, потому что она мне очень нравится».

– Шаг 3. Создаю третье изображение из текста «Artificial intelligence cyborg, green eyes, blue hair». Использую команду «Use as Input» на третьей картинке.

– Шаг 4. Создаю четвертое изображение из текста «Artificial intelligence cyborg, green eyes:20, blue hair:80». Получаю итоговый результат:

Этапы преобразования изображения с использованием команды «Use as Input»

Последовательность этих действий дает точное представление о способах, какими нужно воспользоваться для создания красивого изображения в Easy Diffusion из комбинации текста и изображения.

Чтобы изображение сделать еще более красивым, пользователи Easy Diffusion часто используют набор следующих ключевых фраз после тех, которые отражают основную суть создаваемого изображения:

– highly detailed,

– trending on artstation,

– soft light,

– photorealistic,

– perfect composition,

– cinematic shot,

– intricate details,

– hyper detail,

– cinematic.

В нашем случае запрос выглядел бы так: «Artificial intelligence cyborg, green eyes, blue hair, highly detailed, trending on artstation, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cinematic».

К ключевым фразам, отвечающим за стиль изображения, можно добавить фамилии известных художников (например, Пикассо) или название сайтов (например, unsplash), на которых хранятся картинки тысяч пользователей.

Наш обновленный запрос выглядел бы так: «Artificial intelligence cyborg, green eyes, blue hair, Picasso, unsplash, soft light, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail, cinematic».

Не забывайте и про эмоции. Не лишним будет слово: «smile».

А также не забывайте, что вы можете воспользоваться кнопкой «Image Modifiers» / «Модификаторы изображения», которая находится сверху панели инструментов:

Кнопка «Image Modifiers» / «Модификаторы изображения»

Если вам нравятся эксперименты, то добавьте в список фраз слова cyberpunk или steampunk, и вы получите нечто невообразимое, как это получилось у меня:

Также нам нельзя забывать о том, что помимо основного запроса, мы можем написать еще «Negative Prompt» («Отрицательный запрос»):

Окна «Enter Prompt» («Ввод запроса») и «Negative Prompt» («Отрицательного запроса»)

Отрицательный запрос нам нужен для того, чтобы исключить из изображения все то, что нам не нужно. Например, фраза «Black background» исключит из изображения, которое мы хотим создать, черный фон.

Ниже приведу пример своего, на мой взгляд, самого удачного запроса, который позволил мне создать несколько потрясающих изображений:

Запрос (Prompt): Nouvelle AI, new artificial intelligence, cyborg face, an enchanted technological portal from the future, journey into the healing power of nature, photorealistic, perfect composition, cinematic shot, intricate details, hyper detail

Модель (Model): DreamShaper

Автоэнкодер (Custom VAE): vae-ft-mse-840000-ema-pruned

Сэмплер (Sampler): DPM++2s Ancestral (Kerras)

Шаги вывода (Inference Steps): 50

Image Quality: 95

Чтобы расширить свои знания в части написания правильных и/или сложных запросов, я рекомендую вам посмотреть альбом изображений, который прилагается к данной книге. Также вы можете найти и изучить дополнительную информацию по написанию запросов в сети Интернет. Например, найти группы с названиями «Stable Diffusion» или «MidJorney» в мессенджерах или социальных сетях. В этих группах пользователи публикуют свои запросы, а также изображения, которые им удалось создать. Особое внимание уделяйте синтаксису. В разных системах искусственного интеллекта ключевые фразы разделяются между собой по-разному. В Easy Diffusion фразы пишем через запятую :-).

Внимание! Это не конец книги.

Если начало книги вам понравилось, то полную версию можно приобрести у нашего партнёра - распространителя легального контента. Поддержите автора!

Получить полную легальную копию

Страницы книги >> Предыдущая | 1 2

Скачать книгу "Невероятный искусственный интеллект Easy Diffusion. Учебное пособие для школьников средних и старших классов"

- 80
- 1
- 2
- 3
- 4
- 5
4 Оценок: 1

Правообладателям!

Данное произведение размещено по согласованию с ООО "ЛитРес" (20% исходного текста). Если размещение книги нарушает чьи-либо права, то сообщите об этом.

Читателям!

Оплатили, но не знаете что делать дальше?

Текст книги "Невероятный искусственный интеллект Easy Diffusion. Учебное пособие для школьников средних и старших классов"

Автор книги: Александр Чесалов

Жанр: Прочая образовательная литература, Наука и Образование

Шаг 5. Приступаем к работе

Шаг 6. Создаем красивое изображение

Популярные книги за неделю

Жанры библиотеки

Популярные серии книг

По году издания

Рекомендации