

Automatic1111 met Stable Diffusion
Automatic1111



Automatic1111
- Automatic1111 is open source en dus gratis software
- Gemaakt met Gradio
- De software bestaat uit een user interface om Stable Diffusion modellen te draaien en afbeeldingen te generen
- Werkt in de browser
Automatic1111

NMKD

Dreamstudio

Invoke AI

Diffusers


Automatic1111
- Automatic1111 is prima voor beginners en professionals
- Vele updates dankzij een grote community
- Je kan text prompts of afbeeldingen gebruiken om nieuwe afbeeldingen te genereren
- Je kan een deel van de afbeelding genereren d.m.v. een masker
- Is heel goed voor experimenteren met recente modellen

Installeren
Je kan Automatic1111
- Lokaal installeren, maar hou er rekening mee dat je de nodige hardware nodig hebt en snelle GPU kracht
- Via GitHub Colab
- Via een cloud oplossing zoals Runpod

Lokaal
- Voor een lokale installatie heb je git nodig:
- Je heb ook Python 3.10 nodig
- Te installeren via miniconda, zie Getting Started
- Clone de Automatic1111 repository via
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
- Navigeer via je terminal in de stable-diffusion-webui folder en:
- Voor Windows loop je webui-user.bat
- Voor macOS loop je ./webui.sh
- Automatic1111 opent zicht in de browser

Runpod via Pytorch
- Je kan Automatic1111 handmatig installeren via een Pytorch instantie
- Zorg dat je in customize deployment je harde schijf groter maakt (bijv. 50 GB). Modellen nemen veel plaats in beslag
- Start je Jupyter notebook op
- Open de Terminal en clone de stable-diffusion-webui repository in je workspace



Runpod via Pytorch
- Pas de file webui-user.sh aan

- --share: we krijgen een publieke Gradio URL
- --xformers: versnelt het genereren van afbeeldingen
- --autolaunch: opent Automatic1111 automatisch
- Start Automatic1111 met bash webui.sh -f
- Open de gradio link, je hebt nu Automatic1111 geïnstalleerd


Runpod via Template
-
Je kan Automatic1111 installeren met een vooraf gebouwde template
- Dit is waarschijnlijk de snelste en meest makkelijke manier
- Deploy deze template op een pod
- Kies ook hier voor voldoende schijfruimte
- Neem de tijd om alles te laten opstarten (kan een tijdje duren)
- Eenmaal klaar klik je op Connect to HTTP Service [Port 3001] om Automatic1111 te starten

Automatic1111 met Stable Diffusion
The art of prompting



Wat zijn prompts?
Woorden die je geeft aan de AI om te zeggen wat die moet genereren

We voeren prompts in in dit tekstveld (wat we willen)
We voeren negatieve prompts in in dit tekstveld (wat we niet willen)

Positive prompts
- Vraag jezelf af:
- Wat is het onderwerp van je afbeelding?
- Wat zijn de details of de eigenschappen van je onderwerp?
- Wat zijn bijkomende details die je kan toevoegen aan je onderwerp?
- Welk medium wil je gebruiken: olieverf, illustratie, een foto,...
- Gaat het over een close-up portret, een full body portret of een landschapsfoto? Met andere woorden, welk cadrage?
- Welke stijl wil je, misschien geïnspireerd door een specifieke kunstenaar of esthetiek?
- Beschrijf de omgeving
- Hoe moet het licht en de sfeer van je afbeelding eruitzien?
- Beschrijf welk kleurschema je afbeelding heeft, zoals bijv. oranje of paars

Positive prompts
- Gebruik kwaliteitswoorden:
- masterpiece
- best quality
- intricate details
- high resolution
- etc.

Positive prompts
golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, close up shot, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, birds flying in the background
subject
details
medium
style
framing
context
color scheme
light
atmosphere
extra details

Positive prompts
golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, close up shot, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, birds flying in the background
* je kan meerdere keren proberen
** zet je afbeelding vast door de Seed parameter op 1 te zetten


Positive prompts
golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, close up shot, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, birds flying in the background, masterpiece, best quality, intricate details, high resolution


Negative prompts
- Negative prompts worden gebruikt
- voor dingen die we niet in ons eindresultaat willen.
- om een stijl aan te passen
- om bepaalde features te vermijden (zoals bijv. handen, haar, een kleur)
- om de AI te helpen in het genereren van betere resultaten

Negative prompts
Positive
golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, close up shot, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, birds flying in the background, masterpiece, best quality, intricate details, high resolution
Negative
pink


Negative prompts
- Je kan ook hier omgekeerde kwaliteitswoorden gebruiken:
- blurry
- normal quality
- lowres
- monochrome
- mutated
- low quality
- ... ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face ...

Negative prompts
Positive
golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, close up shot, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, birds flying in the background, masterpiece, best quality, intricate details, high resolution
Negative
green leaves, brown trees, blurry, normal quality, lowres, monochrome, mutated, low quality, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face


Prompt weight
Benadruk woorden in de prompt:
- (keyword)
- ((keyword))
- (((keyword)))
- Elk ronde haakje staat voor 1.1 keer verhogen in gewicht
- (keyword) = 1,1
- ((keyword)) = 1,21
- (((keyword))) = 1,33
- Imperfecties kunnen ook opgelost worden inpainting
- Tip: voeg niet te veel gewicht toe, het kan leiden tot vreemde resultaten, het is beter om de prompt te verbeteren

Negative prompts
Positive
golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, close up shot, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, a flock of birds, masterpiece, best quality, intricate details, high resolution
Negative
(((pink))), blurry, normal quality, lowres, monochrome, mutated, low quality, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face


Volgorde van keywords
Positive
close up shot, golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, a flock of birds, masterpiece, best quality, intricate details, high resolution
Negative
(((pink))), blurry, normal quality, lowres, monochrome, mutated, low quality, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face

close up shot is een associatie met fotografie, vandaar dat we hier eerder een foto zien dan een tekening

Volgorde van keywords
Positive
macro perspective of a dogs nose, golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, a flock of birds, masterpiece, best quality, intricate details, high resolution
Negative
(((pink))), blurry, normal quality, lowres, monochrome, mutated, low quality, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face


Volgorde van keywords
- Bovenstaande voorbeelden zijn gegeneerd met Stable Diffusion 1.5
- Enkel voor demonstratieve doeleinden
- Model kan worden gefinetuned




Prompt types
-
Gefragmenteerd (meestal beter)
- golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, close up shot, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, birds flying in the background
-
Talig, minder strikt
- an illustration of a golden retriever dog with big black eyes and big ears, in a park on a sunny day with morning light shining through the trees, and birds flying in the background, drawn in a masterpiece colorful style of a vivid children’s cartoon, in best quality, with intricate details, and high resolution:

Prompt types
Talig, minder strikt
Gefragmenteerd



Keyword blending
- Laat twee keywords in elkaar overvloeien
- [keyword1 : keyword2: number]
- Het nummer heeft aan hoe veel overvloeiing er is
- 0.1: vermindert de sterkte van keyword1
- 0.5: mixt beide keywords
- 0.75: legt meer nadruk op keyword2

Keyword blending
[billie eilish : harry styles: 0.1]
0.1
0.5
0.75




Prompts bewaren




Inspiratie
- CivitAI
- Midjourney Showcase
- Klik op de verschillende afbeeldingen om te zien welke prompts er werden gebruikt

Automatic1111 met Stable Diffusion
Stable Diffusion Modellen



Modellen
- Modellen bevatten alle informatie die nodig is om afbeeldingen te genereren
- Het onderwerp en de stijl van de afbeeldingen die we genereren hangen af van het model dat we gebruiken.
- We bouwen verder op de bestaande Stable Difussion Modellen voor een flavor.
- Er zijn veel modellen te downloaden via het internet
- We gebruiken niet altijd Stable Diffusion 1.5, maar we gebruiken custom modellen
- We vinden deze modellen op civitai.com, huggingface of 4chan (nooit doen)

Model Types
-
.Ckpt
- Een checkpoint van het model
-
.Safetensors
- Bij voorkeur te downloaden, deze is veilig
-
SDXL (Stable Diffusion XL)
- Getraind op grotere afbeeldingen (768x768)
- Foto realistische afbeeldingen
- Duurt langer om iets te genereren
- Is niet persé beter en heeft een refiner model nodig
- We blijven bij de SD1.5 modellen


Meerdere varianten
Base Model (SD 1.5)
Safetensors Download

Pruned VS Non-pruned
- Pruned Modellen bevatten de data die nodig is voor enkel het genereren van afbeeldingen. Bij voorkeur te gebruiken.
- Non-Pruned Modellen bevatten ook nog eens de trainingsdata (veel groter)


FP16 vs FP32
- FP16 modellen hebben een lagere precisie vergeleken met FP32-modellen, maar ze vereisen minder geheugen en kunnen sneller zijn in bepaalde hardwareconfiguraties, vooral bij het gebruik van gespecialiseerde hardware zoals GPU's of TPU's die geoptimaliseerd zijn voor gemengde precisieberekeningen.
- Bij voorkeur te downloaden

Modellen downloaden
- Plaat je modellen in de folder /stable-diffusion-webui/models/Stable-diffusion
- Ga via de Jupyter notebook naar een terminal
- Gebruik het wget commando om modellen te downloaden




Modellen downloaden
- Wijzig de naam naar iets relevants, bijv. realistic-vision-6.safetensors of realistic-vision-6.ckpt
- De extensies safetensors en ckpt zijn belangrijk!

- Refresh de modellen in Automatic1111 en selecteer je model


Golden Retriever
Positive
golden retriever dog, with big black eyes and big ears, illustration in a style of cartoon, close up shot, children cartoon, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, birds flying in the background, masterpiece, best quality, intricate details, high resolution
Negative
green leaves, brown trees, blurry, normal quality, lowres, monochrome, mutated, low quality, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face


Golden Retriever

Base SD1.5 Model
Realistic Vision


Hergebruik prompts



Foto realisme
Positive
close up raw photograph of a golden retriever dog, with big black eyes and big ears, camera photography in a style of Annie Leibovitz, (Getty Images:1.2), Canon 6D, iso100, 35mm f/3.5, in a park, vivid colors, colorful, on a sunny day, morning light shining through the trees, birds flying in the background, masterpiece, best quality, intricate details, high resolution, 4K, highres
Negative
purple trees, red trees, collar, anime, blurry, normal quality, lowres, monochrome, mutated, low quality, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face


Foto realisme






Modellen vinden
- Een model dat getraind is door de auteur
- Een model dat bestaat uit meerdere modellen (merged)


- Fotorealisme of animated styles (anime)
- Ethniciteit

Modellen vinden
- Trigger keywords
- Zitten in de beschrijving van het model


Modellen vinden
Hier kan je een document vinden met fotorealistische modellen en anime modellen, alsook prompts die goed werken


Cyberpunk
Positive
closeup frame of a golden retriever dog in (Cyberpunk 2077 style:1.2), (dog:1.2), wet
pavement, rain reflections, dark brooding atmosphere, urban samurai, chinatown, (cybernetic
implants), neon lights in the background, vivid colors, colorful, Night City, masterpiece, best quality,
intricate details, high resolution, high resolution, 4k, highres
Negative
people, human, purple trees, red trees, collar, anime, blurry, normal quality, lowres,
monochrome, mutated, low quality, ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn
face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark,
signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face

Automatic1111 met Stable Diffusion
Modellen uitbreiden



Inhoud
- Model Merging
- Uitbreiden
- Textual Inversion
- LORA
- Lycoris
- Hypernetworks

Model Merging
- Je kan twee of meerdere modellen samenvoegen
- Samenvoegen kan modellen versterken


Model Merging
Realistic Vision 6



Merged
SDVN8

Uitbreiden
- Onderwerpen of personages (fictional en real-life)
- Kunst stijlen (anime, Studio Ghibli, Van Gogh, lineart)
- Kleding elementen (hoodie, Lolita, high fashion)
- Gezichtsuitdrukkingen (smiling, open mouth, surprised)
- Props zoals weapons of tools
- Poses
- Objecten (cars, or a specific car model, planes)
- Fotografische stijlen (polaroid, Afga Vista, black and white)
- Interieur en exterieur (Indonesian interior, gothic bedroom, schoolyard)
- ...

Uitbreiden
- Sharpness
- Level of detail
- Contrast
- How dark the black tones are
- Overall quality of your image generations
- Skin detail or level of skin imperfections
- Help you keep a generation detail the same across multiple generations (keeping hair color, body type, skin color the same)

Textual Inversion
- Ook wel embeddings genoemd
- 10-100 kilobytes
- Vaak gebruikt om een nieuw personage of concept te intrduceren
- Je traint in Automatic1111
- Instagram modellen, bekende mensen
- Plaats in de embeddings folder
- Zet je textual inversion aan het begin van je prompt (!)

Textual Inversion


Realistic Vision 6 (zonder haze light)

Textual Inversion
- Negative embeddings
- Zijn getraind op slechte afbeeldingen
- Om de kwaliteit te verhogen, zoals handen, dijen


Textual Inversion


Emma Watson
Julia Roberts

LORA
- 10-100 megabytes
- Kunnen zo goed als alle soorten nieuwe dingen introduceren
- Kwaliteit, personage, etc. bijv.
- Detail tweaker
- Noise offset
- Gebruik ze met een checkpoint model (bijv. Stable Difussion 1.5)
- Plaatse ze in de Lora folder (/stable-diffusion-webui/models/Lora)
- Kies je Lora model in het Lora tabblad
- Lora werken
- standalone door ze toe te voegen aan de prompt <lora:naam:1>
- via trigger words, waardoor je het Lora model activeert

LORA
- Voorbeeld: Kids Illustration
- Je kan eender wel base model gebruiken
- Het base model van de voorbeelden staat in de meta data op civitai


Zonder Lora
Met Lora

LORA

- Voorbeeld: Zdzislaw Beksinski Style
- Gebruik het base model (in dit geval SD 1.5)
- Prompt: High detail painting of a golden retriever in the style of (b3ks1nsk1:1.1) <lora:Beksinski2:1>
- (b3ks1nsk1:1.1): dit is het trigger woord
- <lora:Beksinski2:1>: dit is nodig voor het inladen van het Lora model
- De 1 achteraan is hoe hard het Lora model doorweegt (waarde tussen 0.1 en 1)

LORA
- Je kan meedere Lora modellen combineren met elkaar
- Combinatie van Coolkids met Zdzislaw Beksinski Style
- Prompt:High detail painting of a golden retriever in the style of (b3ks1nsk1:1.1) <lora:Beksinski2:0.4> <lora:Coolkids:0.6>
- Hier wordt Coolkids met een sterkte van 0.6 toegepast, wat de stijl van Zdzislaw goed laat doorschemeren.
- Optelsom niet hoger dan 1 (anders raakt het model in de war)


LORA
- Alternatief
- Prompt: golden retriever dog in the style of <lora:Zdzislaw_Beksinski_ArtStyle_selected:1> with big black eyes and big ears, cosmic horror, sharp translucent crystals, gothic, lovecraftian, cold hues, warm tone gradient background, concept art, digital painting, masterpiece, 8 k, uhd, close up shot, vivid colors, colorful, morning light shining through the trees, masterpiece, best quality, intricate details, high resolution


Lycoris
- Nieuwer
- Heel gelijkaardig aan Lora
- Download proces en gebruik is exact hetzelfde
- Installeer
- Onthoud dat de plaats van een Lycoris of Lora statement of trigger word in de prompt belangrijk is om je afbeelding te genereren

Hypernetworks
- Rond 80MB
- Heel gelijkaardig aan Lora
- Geen trigger woord nodig, enkel de verwijzing
- Download proces en gebruik is exact hetzelfde
- Installeer in de models/hypernetworks folder
- Voorbeeld van Vintage Synthwave


Automatic1111 met Stable Diffusion
Settings



Inhoud
- Image Size
- Sampling Methods
- Sampling Steps
- CFG Scale
- Seed Value
- Seed Variation
- Seed Resize
- Batch Count
- Batch Size
- Upscalers
- Hires.Fix

Image Size
De standaard afbeeldingsgrootte waarop modellen getraind zijn is:
- Voor SD 1.5: 512 x 512 pixels
- Voor SD 2.0: 768 x 768 pixels
- Voor SDXL: 1024 x 1024 pixels

- We noemen dit de "native" resolutie.
- De grotere modellen doen er meestal langer over om afbeeldingen te genereren.
- Belangrijk om te weten is dat dit de initiële grootte is, we vergroten later de resolutie met Hires.fix en Upscalers.

Image Size
De afbeeldingsgrootte aanpassen met dezelfde prompt en zelfde seed heeft invloed op je afbeelding.
520 x 520
512 x 512


a photorealistic cat in the woods, close up

Image Size
Als we een grootte kiezen die ver buiten de native resolution van het model ligt, dan krijgen we twinning. Blijf dus zo dicht mogelijk bij de native resolutie.
520 x 1024
a photorealistic cat in the woods, close up


2048 x 2048

Sampling Methods
- Elke Sampling Method werk evengoed
- Zie het als "een AI kunstenaar die jouw kunstwerk maakt"
- Sampling methods vertalen een tekst prompt naar een unieke afbeelding


Sampling Methods
Een sampling method heeft ook invloed op de snelheid waarmee een afbeelding wordt gemaakt



Sampling steps
- Sampling steps zijn het aantal stappen die genomen worden voor het maken van een afbeelding.
- Het is zoals het aantal penseel lijnen die een schilder gebruikt voor het maken van zijn schilderij
- Groter is niet altijd beter
- Hoe lager, hoe sneller
- Een goeie maatstaf is om tussen de 20 à 40 steps te blijven


Sampling steps

Euler, 20 steps
Euler, 80 steps



Euler, 40 steps

CFG Scale
- Classifier-Free Guidance Scale
- Is een parameter dat aanduidt hoe hard het generatie proces moet aanleunen bij je prompt
- Creativiteit vs letterlijk je prompt overnemen


CFG Scale
- 1 - Negeer zo goed als de prompt en laat Stable Diffusion beslissen
- 3 - Relatief vrij, blijf een beetje bij de prompt
- 6 - Iets experimenteler en creatiever, goed bij korte prompt
- 7-10 - Mooie balans tussen prompt en vrijheid
- 15 - Blijf bij de prompt, optimaal wanneer je heel zeker bent
- 20 - Wordt zelden gebruikt, levert weinig goed resultaat op
Low Values
Medium Values
High Values
1
4
7
15
20
30
A lot of freedom
Low freedom
Default Value

CFG Scale

female, close-up, cute human face, beautiful smile, purple hair, outside, forest, 8K, HD photorealistic, very detailed, sharp, focus, octane render, unreal engine, dynamic lighting, portrait lighting, rim lighting

Seed Value
- AI generated afbeeldingen beginnen bij ruis
- De waarde van de seed bepaalt het ruispatroon waarmee het genereren start
- Bepaalt heel erg de uiteindelijk afbeelding
- Je zou het kunnen zien als een ID van je afbeelding
- De seed value wordt willekeurig aangemaakt
- Gebruik je om je afbeeldingen te finetunen of om gelijkaardige afbeeldingen te produceren dan de afbeeldingen die je al eerder had.
- -1 is een willekeurig ruispatroon dat door Automatic1111 iedere keer wordt aangemaakt
- Wil je de compositie vast zetten dan kan je een getal hoger dan nul gebruiken.

Seed Value
- Seed: -1
- Prompt: a photorealistic cat in [...], close up
the woods
the park
nature




Seed Value



- Seed: 1
- Prompt: a photorealistic cat in [...], close up
the woods
the park
nature

Seed Value
Zelfde prompt, zelfde seed resulteert in dezelfde afbeelding

Klikken op het dobbelsteentje betekent terug seed -1 gebruiken
Klikken op de refresh knop betekent een willekeurige waarde genereren bijv. 3590462934

Seed Variation
- Ben je blij met je huidige seed, maar je wil toch nog aanpassingen dan kan dat met de variation seed
- Een seed in een seed
- Zet je Variation Seed op -1: willekeurige aanpassing
- Zet je Variation Strength op een waarde tussen 0 en 1

Activeer de Variation Seed

Seed Variation
- Seed: 2
- Variation Seed: -1
- Variation Strength: 0.1




Seed Resize
Twee afbeeldingen met een verschillende grootte zorgen voor andere afbeeldingen, ook al gebruiken we dezelfde prompt


Seed Resize

512 x 1024

512 x 800

512 x 600

512 x 512
Met Seed Resize kunnen we onze afbeelding wel vergroten of de aspect ratio aanpassen.

Batch Count
- Je kan meerdere afbeelding meteen genereren
- Genereer 4 of 5 afbeeldingen na je prompt zodat je ongeveer weet of je prompt hetgeen is wat je zoekt


Batch Size
- Het aantal afbeeldingen die je wil genereren in één batch
- Dit kan de performance verhogen, maar je hebt meer VRAM geheugen nodig
- Het totaal aantal gegenereerde afbeeldingen = batch count * batch size


Upscalers
- De standaard resolutie voor SD 1.5 afbeeldingen zijn 512x512
- Met een upscaler kunnen de resolutie verhogen met AI
- Upscalen op de traditionele manier is de bestaande pixels gebruiken en via wiskunde deze proberen te verhogen
- Je kan de upscaler gebruiker
- Als deel van het generatie proces (oude versie A1111)
- In post-processing, via het Extra's tabblad
- Je kan met twee upscalers tegelijkertijd werken

Geeft aan hoeveel upscaler 2 blend met upscaler 1

Upscalers
- Een gegenereerde afbeelding kan je sturen naar de Extras tab via
- Je kan meerdere afbeeldingen in een wachtrij plaatsen via Batch from Directory



Upscalers


512x512 naar 2048x2048 d.m.v. traditionele upscalers

Upscalers


Traditionele manier
Met Artificiële Intelligentie

Upscalers

- De standaard schaal-waarde is 4, dat kan je verlagen (Scale to)
- Je kan ook schaken tot een bepaalde resolutie (Scale by)
- Een goeie upscaler is R-ESRGAN 4x+
- Voor foto's is Remacri een hele goeie upscaler
- kan je installeren in de /models/ESRGAN
- wijzig de naam in 4x_foolhardy_Remacri.pth
- herstart Automatic1111
- Upscalers hebben pas effect wanneer er eentje geselecteerd is in de upscalers dropdown

Upscalers


Origineel
Upscaler 1: 4x_foolhardy_Remacri
Upscaler 2: R-ESRGAN 4x+
Scale by: 4

Upscalers
- Goeie upscalers voor fotografie zijn:
- LDSR (traag maar levert goeie resultaten op, kleur wijzigt een klein beetje)
- ESRGAN 4x+
- 4x UltraSharp
- SwinIR
- Foolhardy Remacri
- Goeie upscalers voor tekeningen:
- ESRGAN 4x+
- General-WDN voor natuur foto's, panoramas
-
Anime
- Anime6B

Hires.fix
Met de Hires.fix kan je upscalers gebruiken tijdens het generatieproces:
- We genereren een afbeelding zoals ingesteld, doorgaans 512x512
- We upscalen naar een resolutie die we instellen
- We passen nog een aantal post-processing stappen uit zoals Hires steps en Denoising strength om tot en gedetailleerd resultaat te komen


Hires.fix
-
Hires steps werken zoals sampling steps. Het zijn het aantal stappen die gebruikt wordt om bijkomende details toe te voegen.
- Op nul zullen er evenveel steps worden genomen als sampling steps
- Een specifiek nummer zal dit nummer worden gebruikt
- 15 steps is een goede norm
-
Denoising strength bepaalt hoeveel vrijheid de upscale slider krijgt
- Lagere waarden zal de prompt proberen genereren
- Hogere waarden is meer vrijheid voor de AI om te interpreteren en kan extra wijzigingen introduceren
- Doordat we meteen upscalen zullen we problemen zoals twinning vermijden

Hires.fix


1336 x 1664 - Zonder Hires.fix
1336 x 1664 - Met Hires.fix

Hires.fix

512 x 750 - Zonder Hires.fix

Hires.fix
Denoising Strength - 0,2
Upscale: 1.5, Hires Steps: 15, Upscaler: Latent, model: DreamShaper 8
Denoising Strength - 0,5
Denoising Strength - 0,8




Hires.fix
Denoising Strength - 0,2
Upscale: 1.5, Hires Steps: 15, Upscaler: R-ESRGAN 4x+, model: DreamShaper 8
Denoising Strength - 0,5
Denoising Strength - 0,8




Hires.fix
- De optimale instellingen hangen af van de upscaler
- Sommig werken best met een denoising waarde van 0.5
- Andere werken best met een denoising waarde van 0.3 - 0.5
- Helemaal herinterpreteren kan met een denoising waarde van 1:

Automatic1111 met Stable Diffusion
Image To Image Generation



Inhoud
- Img2Img
- Resize Modes
- Sketch
- Batch

Img2Img
- We transformeren een bestaande afbeelding (foto, sketch, alles aan afbeelding wat je kan vinden)
- Proces is hetzelfde:
- Voeg een prompt toe
- Voeg een afbeelding toe
- Bepaal de afmetingen
- En geef mee hoe vrij Automatic1111 mag zijn via de Denoising Strength optie (zoals Hires.Fix)
- Hogere denoising strength levert grotere aanpassingen op dan kleine waarden, een kleine waarde blijft bij de originele afbeelding en vervaagt de afbeelding

Img2Img
Positive
photorealistic picture of a house, front garden, flowers, sunny day, clouds in the sky, photographed on a Fujifilm GFX 100S, 80mm lens, F1.7, masterpiece, best quality, 4k, high-res, masterpiece, best quality, sharp focus, (cinematic lighting), dynamic angle, Canon 5D, 50mm f/1.8, ISO 320
Negative
easynegative, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale), cartoon, painting, illustration, (worst quality, low quality, normal quality:2)



Img2Img

Denoising Strength: 0.2

Denoising Strength: 0.3

Denoising Strength: 0.5

Img2Img

Denoising Strength: 0.7

Denoising Strength: 0.8

Denoising Strength: 0.9

Img2Img
- Hoe sterker het contrast in de afbeeldingen, hoe sterker deze aanwezig zullen zijn in het resultaat.
- Er is geen "goeie" waarde voor denoising values, het hangt ervan af.
- Paar kapstokken:
- Als je iets wil laten baseren of een referentie, kies dan voor een denoising value onder 0.6
- Als je een tekenachtige kwaliteit wil geven aan je foto, dan kan je al goeie resultaten hebben met waarden onder 0.15

Resize Modes
- Just resize: dit zal de afbeelding transformeren naar de breedte en hoogte die je instelt. Als de breedte en/of hoogte anders is dan zal jouw afbeelding uitgerokken worden.
- Crop and resize: dit zal de afbeelding bijknippen tot een bepaalde afmeting en daarna de generatie uitvoeren
- Resize and fill: herschaalt een afbeelding naar een andere afmeting en vult de lege ruimte met kleuren uit de afbeelding
- Just resize (latent upscale): zelfde als just resize maar gebruikt een latent upscaler


Resize Modes
- De Resize by en Resize to opties kan je gebruiken om te herschalen met een factor of naar een bepaalde afmeting.
- Je moet wel een Upscaler kiezen.


Sketch
Positive
photo of 24 y.o woman standing in front of a brick wall, pale skin
Negative
nude, naked, (deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime, mutated hands and fingers:1.4), (deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, disconnected limbs, mutation, mutated, ugly, disgusting, amputation,

Sketch is een kleur tool
model: epicRealism

Sketch



denoising strength: 0.6
Positive
photo of 24 y.o woman standing in front of a yellow brick wall, pale skin, red skirt

Sketch
denoising strength: 0.9
Positive
photo of 24 y.o woman standing in front of a yellow brick wall, pale skin, red skirt


denoising strength: 0.8
denoising strength: 0.7


Sketch
- Om zeker te zijn dat van je generation, gebruik dezelfde prompt als toen je gebruikte bij het genereren van je originele afbeelding
- Je kan de prompt aanpassen door expliciet de kleuren te vermelden die je wenst te bereiken

Batch
Met de batch tab kan je een groot aantal afbeeldingen tegelijkertijd aanpassen

Automatic1111 met Stable Diffusion
Inpainting



Inhoud
- Inpainting
- Inpainting Upload
- Inpainting Sketch

Inpainting
- Inpainting wordt gebruikt om
- Een deel van een afbeelding te wijzigen
- Een deel van een vorig gegenereerde afbeelding te herstellen
- Genereer iets rond een bepaalde omgeving
- Werkt evengoed met een deel van een niet-gegenereerde afbeelding
- Vergelijkbaar met de generative fill van Photoshop maar niet beperkt in soort content
- Hetgeen je genereert kan nog steeds aangevuld worden met Lora, Text Embeddings, etc.
- In plaats van kleur toe te voegen, zoals bij Sketch, voeg je nu nieuwe content toe

Inpainting



Prompt
jeans pants

Inpainting
-
Mask Blur: deze slider bepaalt de zachtheid van de inpainting brush
- Laag: de inpainting lijkt in de afbeelding geplakt
- Groter: de inpainting blend beter in de afbeelding
-
Padding: bepaalt de zone rond het masker dat gebruikt zal worden als referentie
- Probeer eens met grotere waarden
-
Masked Mode:
- Inpaint mask: genereert iets in het masker
- Inpaint not masked: genereert iets buiten het masker
- Masked Content: bepaalt hoe de content zal worden gegenereerd, dit hangt af van wat je wil bereiken

Inpainting
-
Masked Content:
- Fill: gebruikt de naburige kleuren
- Original: wanneer je zaken wil wijzigen ipv dingen toe te voegen
- Latent noise: goed voor als je nieuwe dingen wil toevoegen
-
Inpaint Area:
- Whole picture
- Only masked area

Inpaint Upload
Hiemee kan je je masker uploaden vanuit Photoshop




Inpaint Upload




Inpaint Sketch
Met inpaint sketch wordt enkel de gemaskeerde zone gerenderd, zonder de rest van de afbeelding te wijzigen. Bij de gewone sketch wordt de afbeelding wel gewijzigd.

Technology 2 - Automatic1111 met Stable Diffussion
By timdpaep
Technology 2 - Automatic1111 met Stable Diffussion
- 349