Stable Diffusion 3: ръководство за инсталиране и използване на вашия компютър

  • Stable Diffusion 3 е модел за генериране на изображения, задвижван от изкуствен интелект, който можете да стартирате на вашия компютър, използвайки интерфейси като Easy Diffusion или Stability Matrix.
  • За плавна работа се препоръчва графичен процесор с поне 8 GB VRAM, въпреки че е възможно да се работи само с процесора, но с цената на много по-голяма бавност.
  • Ключът към постигането на добри резултати се крие в правилното комбиниране на подкани, параметри за генериране (семе, семплер, стъпки, размер) и модификатори на стил.
  • Възможно е да се разширят възможностите чрез инсталиране на нови модели, VAE и добавки, винаги изтегляни от надеждни източници, за да се избегнат проблеми със сигурността.

Стабилна инсталация на Diffusion 3 на компютър

Ако това, което искате, е опитвам Стабилна дифузия 3 на вашия компютър и започнете да създавате изкуство Колкото по-рано започнете, толкова по-добре. Нормално е да се чувствате малко претоварени, докато търсите ясна информация. Екосистемата е пълна с фронтенди, модели и форкове; някои са премахнати от сайтове като CivitAI поради правни проблеми, а други постоянно променят имената си. Добрата новина е, че ако вече сте инсталирали Stability Matrix или подобен интерфейс, сте на половината път и можете да използвате SD3 модела локално без излишни усложнения.

В това ръководство обясняваме всичко, което трябва да знаете. Какво е Stable Diffusion 3, какви изисквания има вашият компютър, как да го инсталирате и използвате с удобен за потребителя интерфейс Как да използвате Easy Diffusion или Stability Matrix, как да зареждате съвместими модели… И най-вече как да конфигурирате параметрите, така че изображенията да започнат да се получават по желания от вас начин. Ще разгледаме и опциите за работа със скици, ваши собствени снимки, различни модели, VAE и други добавки.

Какво е Стабилна дифузия и как се вписва Стабилна дифузия 3?

Стабилната дифузия е a модел на изкуствен интелект, способен да създава изображения от текстови описания. Това е известно като „текст в изображение“. Пишете това, което искате да видите, а изкуственият интелект го рисува, смесвайки стилове, композиции и детайли почти без ограничения.

Голямата разлика е, че стабилната дифузия е Отворен код, безплатен и проектиран да работи на вашия компютърТова ви позволява да изтеглите базовия модел, да обучите персонализирани варианти, да обедините модели на трети страни и да експериментирате с безброй стилове, без да разчитате на външни сървъри. За разлика от затворените услуги, тук имате огромен контрол върху това какво инсталирате и как го използвате.

Стабилна дифузия 3 (SD3) е една от по-модерни еволюции на двигателя за генериране на изображения Stability AIТой предлага по-добра консистентност, по-фини детайли и превъзходно обработване на текста в изображението. Но не всичко е розово. В същото време, той идва с... лицензионни ограничения и промени в разпространението което е довело до изчезването на някои контролни точки от уебсайтове като CivitAI или до ограничаването им до определени оторизирани интерфейси.

На практика, на потребителско ниво, SD3 все още се използва по същия начин като предишните версии: Зареждате модела в съвместим интерфейс (Easy Diffusion, Stability Matrix, Automatic1111 и др.)Избирате семплер и останалите параметри, пишете си подканата и генерирате. Сложността днес не се състои толкова в обработката, колкото в изпълнението. вземете правилния модел и спазвайте неговия лиценз. Ето защо е важно винаги да го изтегляте от официални или надеждни източници.

стабилна дифузия 3

Минимални и препоръчителни изисквания за използване на Stable Diffusion 3 на компютър

Първото нещо, което трябва да знаете, е дали екипът ви е готов. Добрата новина е, че Стабилната дифузия може да работи дори само с процесор. Очевидно е, че преживяването се променя много, когато имате приличен графичен процесор.

Като отправна точка, за да стартирате интерфейс като Easy Diffusion или Stability Matrix с модели тип SD3, ще ви трябват поне модерен процесор, 8 GB RAM и около 25 GB свободно пространство на диска. С това можете търпеливо да генерирате изображения с ниска резолюция, въпреки че процесът ще бъде доста бавен, ако използвате само процесора.

Ако вашият компютър има Интегрирана графика с 2GB споделена видео паметМожете да опитате да използвате графичния процесор, но в много случаи активирането на режима на рендиране от процесора ще бъде по-стабилно. Особено ако започнете да заявявате високи резолюции или множество изображения едновременно.

За комфортно преживяване се препоръчва да имате специализирана графична карта от Nvidia или AMD с поне 8 GB VRAMОт този момент нататък нещата се променят: можете да използвате по-високи резолюции, да генерирате множество изображения едновременно и да активирате допълнителни функции като мащабиране или предварителен преглед, без всичко да бъде засегнато.

Имайте предвид, че двигателят, използван от фронтендове като Easy Diffusion Обикновено не се възползва конкретно от RTX Tensor Cores. както DLSS прави в игрите, например. Ускорението се основава предимно на общата изчислителна мощност и пропускателната способност на паметта на графичната карта, така че графичен процесор с добра шина на паметта и много видео памет Винаги е предимство.

Инсталиране на опростен интерфейс: Easy Diffusion като пример

Дори и вече да имате инсталиран Stability Matrix, все пак е добре да знаете Как да инсталирате удобен за потребителя интерфейс като Easy DiffusionТъй като процесът и изискванията са много сходни, а и много от опциите за употреба са споделени. Ще видите, че няма никаква мистерия.

Лесната дифузия се разпространява като Класически инсталатор за Windows, Linux и macOSВ Windows, което е най-често срещаният случай, просто отидете на официалната страница на проекта в GitHub и изтеглете инсталатора, съответстващ на вашата система (обикновено изпълним .exe файл).

Веднъж изтеглени, ще трябва Стартирайте инсталатора и следвайте инструкциите на помощника, като щракнете върху „Напред“ в различните стъпки. Важният момент идва, когато ви помоли да изберете пътя за инсталиране: препоръчително е да го инсталирате в папка директно в корена на диска, например C:\EasyDiffusion, вместо да го заравяте в пътища със странни интервали или твърде много поддиректории.

По време на процеса, инсталаторът Ще изтегли допълнителни файлове и необходими зависимости.Това може да отнеме известно време в зависимост от вашата интернет връзка и скоростта на диска. Когато приключи, обикновено ще ви предложи да създадете пряк път на работния плот; добра идея е да активирате тази функция, за да можете да отворите програмата по-късно, без да се налага ръчно да търсите папката.

Когато всичко е готово, ще можете да стартирате интерфейса от иконата на работния плот или с помощта на скрипта „Стартиране на стабилен потребителски интерфейс на Diffusion“ в инсталационната папка. Оттам нататък процесът е подобен и в Stability Matrix: скрипт стартира backend-а и отваря графичния интерфейс във вашия браузър.

лесна дифузия

Първо зареждане: черен прозорец, браузър и локален достъп

Когато стартирате Easy Diffusion (или подобни интерфейси), ще видите, че той се отваря първо черен прозорец на командния ред (CMD)Този прозорец е действителният двигател, който изпълнява Stable Diffusion и други зависимости, така че не го затваряйте, или ще прекратите внезапно сесията с изкуствен интелект.

Докато този прозорец си върши работата, системата Проверете дали всички файлове са на мястото си и изтеглете или поправете всичко, което липсва.Ако има предстояща актуализация или грешка, която изисква повторно изтегляне на част от модела, тази стъпка може да отнеме повече време от очакваното; междувременно можете да проверите съобщенията в конзолата, за да видите какво се случва.

Когато всичко е готово, то се отваря автоматично. браузърът ви по подразбиране, сочещ към уеб интерфейсаАко по някаква причина браузърът не се отвори или случайно затворите раздела, можете да възстановите интерфейса, като въведете ръчно адресната лента. локалният URL адрес: http://localhost:9000/, който е портът по подразбиране, използван от Easy Diffusion.

Интерфейсът изглежда организиран в няколко основни разделаРазделите, които ще използвате най-много в началото, са „Генериране“, където създавате изображенията, и „Настройки“, където конфигурирате производителността, маршрутизацията и общото поведение. Обикновено има и раздели за помощ и общност с връзки към документация, както и раздел за... „Модели на сливане“, които позволяват сливане на контролни точки и друга с историята на промените („Какво е новото?“), която показва подобренията на всяка версия.

В горната дясна част на интерфейса обикновено ще видите индикатор за състоянието на систематаТова е добра отправна точка, за да се разбере дали рендерирането все още работи или е замръзнало.

Основни настройки в раздела с настройки

Преди да започнете да създавате изображения със SD3 или друг модел, си струва да отделите малко време, за да Прегледайте опциите в раздела „Настройки“защото производителността, лекотата на използване и някои аспекти на сигурността на съдържанието зависят от това.

  • „Автоматично запазване на изображения“Ако активирате тази опция, системата автоматично ще запазва всички генерирани изображения в папка по ваш избор. Можете също така да решите как да се съхраняват метаданните (подкани, начална фраза, параметри и др.).
  • „Блокиране на изображения без профили за работа“Тази функция позволява на системата да размива или блокира сексуално откровено или неподходящо съдържание. Ако ще използвате Stable Diffusion 3 в споделена среда, с непълнолетни наблизо или на служебен компютър, препоръчително е да оставите този филтър активиран, за да избегнете неприятни изненади.
  • „Използване на паметта на графичния процесор“. Определете колко VRAM се използва. Обикновено има три нива: „Ниско“ (предназначено за графични карти с 2 до 4 GB), „Балансирано“ (4 до 8 GB) и „Бързо“ (повече от 8 GB). Ако получите грешки поради недостатъчна памет или сривове, намалете тази настройка с една точка и опитайте отново.
  • „Използване на процесор“. По този начин целият процес се управлява от процесора. Производителността ще бъде значително по-бавна, но това ще ви позволи да тествате изкуствения интелект и да създавате малки изображения, докато решавате дали си струва да инвестирате в по-добър графичен процесор.
  • Потвърдете опасните действияНастройка за сигурност, която добавя допълнително потвърждение при изтриване на папки, модели или настройки, намалявайки риска от случайно изтриване на нещо важно.

Не забравяйте, че промените, които направите в този раздел, няма да бъдат приложени, докато не натиснете бутона. „Запазване“ Намира се точно под списъка с настройки. Под него обикновено се показва и обобщение на открития хардуер (процесор, графичен процесор, памет), което е полезно за потвърждение, че системата правилно разпознава компютъра ви.

стабилна дифузия 3

Генерирайте първите си изображения със Stable Diffusion 3

След като основната настройка е завършена, е време за забавната част: Генериране на изображения от раздела „Генериране“Всичко започва с основно текстово поле, където се появява типичен пример от типа „снимка на астронавт, яздещ кон“. Това е подканата или описанието за въвеждане за изкуствения интелект.

За да създадете свой собствен образ, просто трябва Напишете на английски какво искате да постигнете в полето „Enter Prompt“ (Въведете подкана). Въпреки че Stable Diffusion приема думи на други езици, английският остава езикът, който моделите разбират най-добре. Във всеки случай винаги можете Напишете подканата на испански и я преведете с помощта на онлайн инструмент. преди да го залепите.

Точно по-долу ще намерите полето „Отрицателна подкана“. Там можете да посочите какво не искате да се вижда на снимкатаАртефакти, специфични стилове на рисуване, необичайни анатомични характеристики и др. Комбинирането на положителни и отрицателни подкани ефективно оказва голямо влияние върху яснотата на резултатите.

След като подканата е готова, просто натиснете големия бутон, обикновено с текст като този: „Създаване на изображение“За да изпрати задачата за рендиране към опашката, системата ще вземе произволно начално число (или това, което посочите) и ще започне да рендира едно или повече изображения, в зависимост от конфигурацията, която ще видим сега.

Под главния бутон ще намерите две големи падащи секции. Първата групира Параметри за генериране на изображения (размер, стъпки, семплер...) Втората категория включва модификатори и стилове, които ви позволяват да придадете на творението си нотка на илюстрация, фотография, комикс, 3D и др. Разбирането на тези контроли е ключово за извличане на максимума от Stable Diffusion 3.

Настройки на изображението: семена, размер, семплер и контрол на качеството

Първият блок от опции съдържа параметрите, които имат най-голямо влияние върху как се изчислява и показва крайният резултатВнимателният им преглед ще ви спести време и чувство на неудобство. Това са настройките, които трябва да знаете:

  • „Семе“ Това показва „семето“, използвано за генериране на изображението. Това е числото, което захранва вътрешния произволен процес: с едно и също семе, едно и също подканяне и едни и същи параметри, винаги ще получавате едно и също изображение.
  • „Брой изображения“Можете да изберете както колко изображения искате общо на заявка, така и колко да се изчисляват едновременно и паралелно. Първата стойност е общата сума. Втората, броят паралелно, определя натоварването на графичния процесор.
  • „Модел“Това ви позволява да изберете коя контролна точка за стабилна дифузия ще използвате.
  • „Персонализирана VAE“. Използва се за прилагане на различен VAE (вариационен автоенкодер) модел от този, който контролната точка използва по подразбиране. Тези VAE са отговорни за подобряването на определени аспекти на изображението, като например цветове, очи или лица.
  • „Семплер“Да се ​​избере алгоритъмът, който прогресивно премахва шума, за да формира крайното изображение. Всеки семплер има свои собствени характеристики: някои са по-бързи, други по-плавни, трети генерират по-добри детайли.
  • „Размер на изображението“. Задава ширината и височината, в пиксели, на генерираното изображение. Като цяло, моделите Stable Diffusion се представят добре със съотношения на страните, близки до 1:1 (квадрат), или такива, считани за естествени за базовия модел.
  • „Стъпки на извод“. Това показва колко стъпки за прецизиране извършва изкуственият интелект, за да трансформира първоначалния шум в крайното изображение. Повече стъпки обикновено означават повече детайли и консистенция.
  • „Скала за ориентиране“. Контролира колко точно ИИ се придържа към подканата. Високата стойност означава, че моделът следва описанието много точно, за сметка на известна творческа свобода.

стабилна дифузия 3

Модификатори на стилове и опции за разширено генериране

Вторият основен раздел от параметри се фокусира върху добавете предварително зададени стилове и ефекти към изображениетоОбикновено се показва като поредица от категории с икони, които представляват различни визуални аспекти: комикс, акварел, реалистичен, фотореалистичен, 3D, нискополигонален и др.

Тези модификатори действат като Преки пътища за вмъкване на ключови думи в подканата без да се налага да ги въвеждате всички на ръка. Можете да комбинирате няколко, да активирате и деактивирате, за да видите как се променя резултатът, и разбира се, да продължите да добавяте свои собствени термини в основното текстово поле.

Важно е да се разбере това Не сте ограничени до стиловете, които се появяват в интерфейсаStable Diffusion 3, подобно на други модели, разбира хиляди имена на художници, техники, камери, обективи и естетически концепции. Ако имате познания по фотография, дизайн или живопис, можете да използвате технически речник директно като част от подканата, за да прецизирате резултата.

Ключът е да отидеш експериментиране с комбинации от модификатори, подкани и параметриВсеки модел реагира малко по-различно, а с SD3 начинът, по който се интерпретират езиковите нюанси, е значително подобрен, така че малки промени във фразирането могат да доведат до коренно различни резултати.

Какво да правим с генерираните изображения: повторно използване, прецизиране и мащабиране

Когато генерирането на изображение приключи, то ще се появи в галерията с интерфейси. Ако задържате курсора на мишката върхуЩе видите, че се появяват няколко бързи опции, които улесняват продължаването на работата от този резултат, без да се налага да преконфигурирате всичко от нулата.

Командата „Използване като вход“ Той копира използваните параметри (prompt, seed, size и т.н.) и, в зависимост от интерфейса, може да използва и самото изображение като основа за нови варианти. Това е много полезно, когато искате усъвършенствайте идея, в която сте почти убедени без да започвате отново от празно платно.

Опцията „Създаване на подобни изображения“ Генерира нови изображения, подобни на избрания резултат, като променя началните параметри и някои вътрешни детайли. Това е бърз начин да създадете набор от алтернативи, като същевременно запазите подобна композиция или стил, докато намерите тази, която наистина ви подхожда.

От иконата за изтегляне можете да получите крайното изображение в избрания формат (PNG, JPG…) или изтеглете JSON файл с всички параметри, използвани при генерирането. Запазването на този JSON е особено полезно, ако искате споделете рецептата за приготвянето ѝ с други хора или да възпроизведете изображението на друго устройство или интерфейс.

В интерфейси като Easy Diffusion, опцията „Нарисувай още 25 стъпки“ Това позволява процесът на генериране да продължи върху същото изображение, добавяйки 25 допълнителни стъпки за извод. Това обикновено е полезно за Усъвършенствайте детайлите, подобрете текстурите или коригирайте малки несъответствия без да променя твърде много оригиналния състав.

Накрая, бутонът „Луксозно“ Това инициира процес на мащабиране с по-висока резолюция. В зависимост от избрания метод, оригиналният стил може да бъде запазен с по-големи детайли или могат да бъдат приложени модели със свръхрезолюция, задвижвани от изкуствен интелект, за реконструкция на ръбове и текстури. Тази фаза е доста интензивна по отношение на графичния процесор, така че трябва да се използва разумно, особено при карти с ограничена видео памет.

Използвайте снимки, скици и други изображения като отправна точка

В допълнение към класическото преобразуване на текст в изображение, Stable Diffusion 3 позволява работа със съществуващ визуален материалМожете да качите снимка от вашия компютър, да използвате повторно изображение, което току-що сте създали, или дори да нарисувате бърза скица върху основно платно в интерфейса.

Когато качвате изображение като вход, изкуственият интелект го използва като ръководство за композиция, форми или цветовекомбинирайки го с предоставения от вас текстов подкана. Ако качите например снимка на град и поискате нощен киберпънк стил, моделът ще се опита да уважи градската структура, адаптирайки я към новия контекст.

Опцията „Рисунка“ Той предлага малко платно, върху което можете да рисувате общи форми, силуети и позиции на елементите, оставяйки Stable Diffusion 3 да се погрижи за финалните щрихи. Това е добър начин за контрол. където искате да бъдат героите, сградите или обектите преди изкуственият интелект да започне да декорира сцената.

Резултатите с тези видове функции обаче могат да бъдат доста разнообразни и първоначално донякъде непредсказуеми. Препоръчително е тествайте различни степени на влияние на първоначалното изображение (според интерфейса, той се регулира с плъзгачи за сила) и го комбинирайте с добре описани подкани, така че изкуственият интелект да не се отклонява твърде много от вашето намерение.

Инсталирайте нови модели, VAE и добавки Stable Diffusion

Едно от най-големите предимства на стабилната дифузия, включително SD3, е, че можете Зареждане и смесване на модели от трети страни да адаптирате ИИ към вашия вкус: екстремен реализъм, фентъзи илюстрация, европейски комикси, аниме, хиперреалистична архитектура… на практика има модел за всяка ниша.

Най-често срещаната практика е моделите да се изтеглят във формат .ckpt или .safetensorsТова са големи файлове, където се съхраняват обучените тегла на невронната мрежа. Освен това има отделни файлове за VAE, хипермрежи и други плъгини, които променят начина, по който се интерпретира подканата или как се реконструира изображението.

За безопасност никога не изтегляйте шаблони от произволни, непроверени източници. Сравнително е просто. скриване на злонамерен софтуер във файлове от този типТака че, най-малкото, трябва да ги сканирате с актуална антивирусна програма и да проверите дали идват от признати автори или реномирани сайтове.

За да ги инсталирате в Easy Diffusion, процесът обикновено е толкова прост, колкото Копирайте изтегления файл в съответната папка „Модели“ в рамките на инсталацията на програмата. В тази основна папка ще видите специфични подпапки за контролни точки, VAE, хипермрежи и др.

Всяка подпапка обикновено съдържа текстов файл, обясняващ кои файлови разширения се поддържатКопирайте модела на съответното място, рестартирайте интерфейса, ако е необходимо, и след това новата контролна точка или добавка трябва да се появи в падащите менюта за избор на модел или VAE.

С всичко гореизброено, вече имате солидна основа за инсталиране, конфигуриране и използване на Stable Diffusion 3 на вашия компютърКато разберете как работят фронтенд интерфейсите, какви изисквания има вашият хардуер, как се настройват параметрите за генериране и къде безопасно да изтегляте нови модели и VAE, можете да се движите плавно между различните интерфейси (Easy Diffusion, Stability Matrix, Automatic1111…) и да се съсредоточите върху важното: експериментиране, фина настройка на вашите подкани и наслаждаване на създаването на графично изкуство с изкуствен интелект, без да разчитате на външни услуги.