Генерацию текста в изображение выполняет программное обеспечение Stable Diffusion Models (SD). Вычислительная структура оформляет неоконченные рисунки, изменяет оригинал снимка. Обучающая система имеет исходный код, соответствующие лицензии на программное обеспечение.
- Что такое Stable Diffusion, и как пользоваться нейросетью
- Зачем нужны диффузионные модели генерации изображений
- Как добавить модель в SD
- Лучшие models для Stable Diffusion в 2023 году
- Robo Diffusion
- Open Journey
- Arcane Diffusion
- Anything V3
- Corset Beauties 2
- F222
- Deliberate 2.0
- Civitai
- Другие интересные модели для Stable Diffusion
- Обзор
Что такое Stable Diffusion, и как пользоваться нейросетью
Искусственный интеллект (ИИ) разработан группой Stability AI. Основная модель SD – это v1-5-pruned-emaonly.ckpt. Исследование проведено на платформе GitHub.
В обучающую программу входят 2 части:
- нейросеть;
- вспомогательные элементы вокруг процессора.
Главное достоинство вычислительной структуры – NSWF-картинки (в оригинальной версии). Нейросеть работает бесплатно. Установочный дистрибутив скачивают с сайта разработчика, нажимая на кнопку «Скачать» (Download).

Зачем нужны диффузионные модели генерации изображений
Искусственная структура SD работает с image-файлами и решает следующие задачи:
- рисует картины в стиле художников эпохи Возрождения, Ренессанса;
- обеспечивает ресурсами компьютерные игры;
- генерирует anime.
Stable Diffusion models создает free-изображения, используя webui-user.bot, дополняет рисунок по запросу пользователя.
SD корректирует личные фото и генерирует визуальный фон. Для моделей SD 1.5, 2.0, 2.1. размер картинок 768х768 pixel.
Как добавить модель в SD
Перед работой пользователь тестирует SD-образец:
- меняет фон;
- скрывает персонажей;
- отображает новые объекты.
Материалы устанавливают в 3D с помощью редактора Material Editor.
Лучшие models для Stable Diffusion в 2023 году
Создать рисунки, портреты, репродукции несложно с помощью обученных контрольных файлов.
Лучшие модели в 2023 г.:
- Rodo Diffusion;
- Open Journey;
- ArcaneGAN;
- F22;
- Deliberate.AI;
- Caritai;
- Elysum Anime V2 и др.
Универсальные образцы Stable Diffusion (EMA model) применяют для генерации персонажей, объектов и SVG-фонов. Запросы составляют на английском языке. Учитывают пол, внешний вид персонажа, тип рисунка: будь то цифровая картина, фотография, аниме и пр.
Robo Diffusion
Программа генерирует картинки с роботами. Пользователь с помощью scripts вводит триггер «Hours robot» для создания изображения. Образец Stable diffusion 2.0 создает рисунки высокого качества.
Для конструирования изображения военной техники в поисковую строку вписывают триггер «housr».
Open Journey
Обучающая структура использует рисунки, созданные MidJourney V4. Изображения высокого качества, яркие, с мощной композицией баланса и симметрии.
Arcane Diffusion
Программа SD V3 (1,99 Gb) – лучший образец для конструирования персонажей TV Show Arcane (anime). Пользователь знакомится с футуристическими героями сериала, созданными программой.
Ключевые слова для работы:
- SD1-5;
- в стиле;
- аниме;
- checkpoint.
Anything V3
Контрольный чек-поинт для SD работает аналогично NovelAL. Запрос оформляют на английском языке: masterpiece, best quality.
Нейросеть создает аниме, например:
- девушку-кошку в форме полицейского;
- дворецкого-орка и пр.
Недостаток модели в том, что она рисует женщин с непропорциональными фигурами.

Corset Beauties 2
Нейросеть делает фотографии 3D персонажей, используя Pixel art. Качество изображения высокое. Запросы оформляют на английском языке.
Обучающая структура создает современные и запоминающиеся образы, выбирает следующий тип корсета:
- для ежедневного пользования;
- праздничный (с рукавами);
- для танцовщиц канкана и пр.
F222
Полное название – Novel Inkpunk F222. Программа осуществляет сборку изображения по представленным фото.
Нейросеть генерирует образы:
- принцессы;
- рыцаря;
- черной кошки;
- робота;
- монстра и пр.
Deliberate 2.0
Лучшая искусственная сеть, генерирующая портреты реальных людей. Структура учитывает анатомические особенности строения тела человека.
Civitai
На civitai.com. представлена модель SD (версия 1.4). С помощью нейросети пользователь загружает файлы Hypernetwork, Lora и др. Коллекция насчитывает 1 700 экземпляров от 250 авторов.
Другие интересные модели для Stable Diffusion
Модель Elyslum Anime (V2) создает персонажей в стиле Yandere. Inkpunk Diffusion – оригинальный и высокоточный образец, генерирующий картинки в жанрах Corillaz, FL CL, Yoji Shinkawa.
Сеть Embedding создает рисунки пиратской символики:
- шляпы-треуголки «Джек Воробей»;
- сабли;
- флага «Веселый Роджер»;
- банданы;
- подзорной трубы.
Для работы с нейросетью применяют ключевое слово «prt».
Модель Embedding генерирует красивые пейзажи:
- зимние;
- пробуждение реки;
- осенний лес и пр.
Waifu Diffusion V1 рисует персонажей в стиле anime, а Elden Ring создает объекты по триггерной фразе «Elden Ring style». Структура IconsMi конструирует UI (иконки для приложений).