2023. okt 16.

AI képszerkesztés - újabb szinteken!

írta: Rózsa Katka
AI képszerkesztés - újabb szinteken!

_1db977bf-04d6-4c5d-98ba-19ccb7581b05.jpgKorábbi cikkeinkben már bevezettük olvasóinkat az AI képszerkesztés világába, azonban most még mélyebbre evezünk ezeken az új, messzire vezető vizeken, hogy mégis találjunk támpontokat az ismeretlen felfedezése során. Az alap AI képszerkesztő programok megismerése és a helyes parancsbeírás módjának elsajátítása után még bizony van mit tenni a jobb eredmény érdekében. Ha érdekel, hogy pontosan mit, akkor jó helyen jársz! 

Az AI képszerkesztés során különféle programokban találkozhatunk kiemelt beállításokkal, melyeket könnyedén be tudunk állítani, hogy a megfelelő képet kapjuk… Azonban elég pepecselős kikísérletezni ezeket, hogy tudjuk mit is jelentek, vagy utánuk olvasni, hiszen a legtöbb szöveg angolul nyújt segítséget. Éppen ezért, mi utánajártunk, hogy Neked ne kelljen!

quy0d3t6gylu_25vohgyg.pngNézzünk most meg párat ezekből, amelyekkel a leggyakrabban lehet találkozni – a tensor.art program használatával. Utóbbi előnye, hogy naponta 100 kreditnyi kép ingyenes és ezek a beállítások már gombokként elérhetőek a felületen. 

(Fotó: https://tensor.art/ prompt: house on the beach)

1. LoRA, vagyis Low Rank Adaptation

A LoRA egy olyan beállítási segédlet, amely segít a képszerkesztő rendszerek mély tanulási modelljének pontosításában. Azaz finomítja a parancsra talált képek tucatját, egy újabb „szűrővel”, ami egy olyan, már mások által kikísérletezett parancscsoport, amelyet a program már ismer. Ennek a mértékét pedig a tensor.art programon belül állítani is lehet. Egy LoRA segítségével, a fenti „part menti ház” parancsra (Prompt: house on a beach, LoRa: Circle Art) már a következőt kapjuk: 

j4_43hu8sbbzdnqbc11pq.png

2. ControlNet

A ControlNet nem más, mint egy nyílt forráskódú neurális hálózat, amely egy feltételes kontrollt ad a képgenerálási folyamathoz a pontosabb eredményért. Azaz, egy mellékelt kép feltöltésével (vagy kiválasztásával) olyan elemeket segít beépíteni a képbe, melyeket nehéz pontosan leírni, vagy csak sokadjára sikerülne a pontos eredményt megkapni. Ilyen például a test helyzete, amit az alábbi képekkel demonstrálok. Az első kép egy sima kérés volt: „egy nő állva”, míg a másodiknál a rendszer segítségével kiválasztottam egy pontosabb pozíciót. 

De ugyanígy lehet módosításokat kérni csupán az eredeti kép szerint, például a Stabled Diffusion programja, az elsőként kapott képet, így szerkesztette át a „rózsaszín ruhát visel” utasítás alapján.

3. VAE, vagyis Variational AutoEncoder

kvi0udfsi40rzw-anmnyp.pngA variational autoencoder (VAE) egy generatív mesterséges intelligencia algoritmus, amely mély tanulási modell segítségével generál új tartalmat, úgy, hogy kiszűri az anomáliákat és a zajt a képekről. A módszer kétféle neurális hálózatot egyesítve működik, hogy precízen adjon új (nem valós) képeket, viszont azokon ne legyenek valótlannak tűnő részletek.

bbrqzqtud4txptfexkux0.pngErre például itt van két kép, egy „almát tartó macskáról” amelyiknél látható, hogy az automatikus VAE bekapcsolásakor még ha nem is egy macska mancsa, de egy realisztikus almát tartó emberi kéz látható (bal oldali kép), amíg a VAE kikacsolásakor egy amorf kezet kapunk ugyanarra a parancsra (jobb oldali kép). 

4. ADetailer, After Detailer 

A fenti problémát, vagyis a nem pontos kezek és arcok pontosítását pedig az After Detailer fogja megoldani, szinte automatikusan. Bár egyes beállítások esetén választani lehet, hogy melyiket szeretnénk inkább, hogy javítsa. A „nő egy autóban” parancsra például ezt a képet adta elsőre: 

pybinsbbvbbteunnwo_lj.png

14soc3ue_ixjjscxwfqzd.pngAmit az ADetailer bekapcsolásának segítségével először az arc módosítására (bal oldali kép), majd pedig a karok módosítására kaptunk (jobb oldali kép), az már sokkal realisztikusabban néz ki.

piln9qw7_otyfkbvhmnoq.pngAz After Detailer használata már meglévő képek esetén egy kicsivel összetettebb, de amennyiben nem ragaszkodunk egy adott képhez, ez egy bizonyos határig segíteni tud a problémánkon. 

Ezek voltak az elsődleges olyan beállítások, amelyekkel tökéletesíteni tudjuk az AI kreálta képeinket. Azonban még több is van, amit meg lehet nézni a témában, így ha érdekel, akkor kövess minket és gyere vissza a folytatásért!

Felhasznált oldalak: 

https://tensor.art/ 

https://blogs.rstudio.com/ai/posts/2023-06-22-understanding-lora/ 

https://stablediffusionweb.com/ControlNet   

https://www.techtarget.com/searchenterpriseai/definition/variational-autoencoder-VAE 

https://www.jeremyjordan.me/variational-autoencoders/ 

https://stable-diffusion-art.com/adetailer/  

Szólj hozzá