DALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]

PRAASHEK --- --- 18:51:46 7.9.2022

1 odpověď

A btw si tak čtu na redditu o různých verzích GUI, co se teď dají najít a zas mě to vrhlo do nejistoty, co bude nejlepší volba :)

stable-diffusion/GUI_TUTORIAL.md at main · neonsecret/stable-diffusion · GitHub
https://github.com/neonsecret/stable-diffusion/blob/main/GUI_TUTORIAL.md

//co jsem vyčetl, "umí" to zatím jenom dva modely, takže asi nechci, nicméně tam je .bat file, který vlastně provede veškeré kroky za vás +přednastavení, které umí nějak samo optimalizovat chod pro různé grafické karty - moc jsem to dál nezkoumal, možná jenom optimalizace pro 8GB VRAM aby to nevyhazovalo chyby když zkoušíte vyšší rozlišení
---

https://github.com/hlky/stable-diffusion

moved to

GitHub - sd-webui/stable-diffusion-webui: Stable Diffusion web UI
https://github.com/sd-webui/stable-diffusion-webui

//tohle jsem chtěl zkusit, protože to bylo na redditu doporučované, nicméně proběhlo zrovna přemístění v rámci githubu a nikde nevidím instrukce pro install :) možná jsem jenom slepýš, kdyžtak mě nasměrujte
---

GitHub - henk717/stable-diffusion
https://github.com/henk717/stable-diffusion

//tohle by měl být "fork" toho předešlého, opět nevidím instrukce, protože odkazují na stejné nic, jako předchozí

PRAASHEK --- --- 18:01:09 7.9.2022

VOZKA:

GitHub - hlky/sd-enable-textual-inversion: Copy these files to your stable-diffusion to enable text-inversion
https://github.com/hlky/sd-enable-textual-inversion

How to Train Textual-Inversion

** Training is best done by using the original repo **

WARNING: This is a very memory-intensive model and, as of writing, is not optimized to work with SD. You will need an Nvidia GPU with at least 10GB of VRAM to even get this to train at all on your local device, and a GPU with 20GB+ to train in a reasonable amount of time. If you do not have the system resources, you should use Colab or stick with pretrained embeddings until SD is better supported.

Note that these instructions are for training on your local device, instructions may vary for training in Colab.

You will need 3-5 images of what you want the model to describe. You can use more images, but the paper recommends 5. For the best results, the images should be visually similar, and each image should be cropped to 512x512. Any other sizes will be rescaled (stretched) and may produce strange results.

VOZKA --- --- 19:16:37 5.9.2022

PRAASHEK: Už nevím, ale bylo to nepokrytě nemravné testování toho, jak umí AI generovat dámská pozadí, takže něco jako nude woman from behind standing in a meadow showing her bare ass. Ale ten 90s kalendář efekt je podle mě způsobený tím, že některé samplery (zrovna ddim třeba) při malém množství kroků fungují dost dobře, ale mají tendence vytvářet obrázky buďto trošku rozmazené nebo jako s více či méně umělým mlžným oparem jako tady.

PRAASHEK --- --- 19:09:27 5.9.2022

1 odpověď

//jak znělo zadání btw?

PRAASHEK --- --- 19:09:01 5.9.2022

VOZKA: prej "omylem". To je ta nejstarší výmluva na světě.

VOZKA --- --- 18:50:25 5.9.2022

1 odpověď +16

Omylem jsem vytvořil stránku z erotického kalendáře z 90. let

PRAASHEK --- --- 16:52:09 5.9.2022

LUSINDA: já bych to namaloval stejně

LUSINDA --- --- 15:17:58 5.9.2022

1 odpověď +2

špatnou angličtinu ani MidJourney nedává :-)

yellow dog in old castle with fire

MATT --- --- 10:48:18 5.9.2022

The DALL·E 2 Prompt Book – DALL·Ery GALL·Ery
https://dallery.gallery/the-dalle-2-prompt-book/

PLECH --- --- 10:27:32 5.9.2022

AI Images: Last Week Tonight with John Oliver (HBO)
https://www.youtube.com/watch?v=3YNku5FKWjw

VOZKA --- --- 18:22:46 4.9.2022

1 odpověď +1

Existuje textual inversion, což je jestli to správně chápu zhruba tohle, ale na to už potřebuješ GPU s ohromným množstvím RAM, minimálně 16 GB, možná 20, takže jsem si o tom nic víc nedohledával.

PRAASHEK --- --- 18:07:44 4.9.2022

Ješted jedna věc mě zajímá - existuje nějaký "force-learning", který by té AI vnutil třeba "takhle.vypadá.jan.werich" nebo tak něco?

PRAASHEK --- --- 16:40:20 4.9.2022

VOZKA: to gui vypadá úplně parádně :)

VOZKA --- --- 16:39:01 4.9.2022

1 odpověď +1

PRAASHEK: On by to ten skript webui.cmd který spustíš v kroku 7 měl udělat sám. U mě se to akorát nemohlo rozhodnout jestli to poběží na primární nebo sekundární grafické kartě a kvůli tomu to blbnulo, tak to nepoužívám. Můžu popsat jak to udělat ručně, ale nedělej to a zkus jestli ti nebude fungovat ten krok 7 normálně - měl by.

To GUI pak vypadá takhle: https://imgur.com/a/iPlQ1xy

PRAASHEK --- --- 16:29:50 4.9.2022

1 odpověď

VOZKA: přesně něco takového jsem si nejspíš představoval - mít web GUI s decentními možnostmi nastavení podobně, jako to má teď třeba dreamstudio/stability.ai (které jediné z těch "placených/beta" mám vyzkoušené osobně).

GPU mám jednu s 8GB RAM

Virtuální prostředí/skript sis vytvořil sám, tady se rýsuje překážka :)

můžeš nahodit screenshot, jak tvoje prostředí vypadá?

VOZKA --- --- 16:00:15 4.9.2022

1 odpověď +2

PRAASHEK: Já používám tohle: https://rentry.org/GUItard
Má to i nastavení na to jakou GPU použít když máš víc než jednu, ale to mi nefunguje, takže jsem musel dělat nějaké úpravy, ale pokud máš jedno GPU, mělo by to běžet víceméně samo. Ta paměťová optimalizace v tom zatím není, ale je to věc upravení jednoho python souboru, pokud to rozchodíš a tu optimalizaci bys potřeboval, tak sem ten jeden soubor ke zkopírování klidně nahraju.

Step 1 je stáhnout samotný AI model.
Step 2 je stáhnout zip s tím programem který ho spouští a vytváří (webové) GUI. "Git clone" ignoruj, normálně stáhni ten zip soubor z odkazu a někam ho rozbal.
Step 2a nedělej.
Step 4 podle mě nutný není, ale radši ho udělej. Někdo si mi stěžoval, že se ten soubor nedá upravovat v klasickém notepadu - nevím jestli je to pravda, já používám notepad++.
Step 5 a Step 6 nainstaluje nástroj Miniconda, což je interpretr Pythonu a zároveň balíčkovací systém, který si umí stáhnout všechny potřebné pythonové knihovny do virtuálního prostředí aniž by ti s nimi zasíral systém.
Step 7 by potom tu instalaci balíčků měl sám udělat a na závěr spustit webové rozhraní, které najdeš na http://127.0.0.1:7860/. Napoprvé stahuje a instaluje pár gigabajtů balíčků, takže to trvá dlouho, při dalších spuštěních třeba minutu.
Tenhle krok je zároveň ta jediná věc která má potenciál se nějak rozbít a mně kvůli dvěma GPU pořádně nefunguje, takže skript webui.cmd nepoužívám, to virtuální prostředí jsem si vytvořil sám a skript pro webové ui spouštím taky sám, což ale není nic moc složitého.

Dobrý návod k tomu jak potom SD správně nastavovat pro pěkné obrázky je tady: https://old.reddit.com/r/StableDiffusion/comments/x41n87/how_to_get_images_that_dont_suck_a/

PRAASHEK --- --- 15:44:05 4.9.2022

VOZKA: btw tyhle "happy-not-so-happy accidents" jsou asi to, co mě na tom nejvíc baví

PRAASHEK --- --- 15:43:11 4.9.2022

1 odpověď

VOZKA: nevíš, jestli někdo zpracovává systém, jak rozchodit na svém stroji lokálně nějakou vizualizační AI třeba v browseru nebo jakkoli podobně, pro zjednodušené "ovládání", typu stability.ai interface či tak nějak? Já se dycky při čtení "how to" zaseknu nakonci, když vidím, že se moc nechytám v tom nastavení...

VOZKA --- --- 15:28:09 4.9.2022

2 odpovědi +2

Někdo objevil novou jednoduchou možnost optimalizace paměťové náročnosti: https://old.reddit.com/r/StableDiffusion/comments/x56e8x/the_optimized_stable_diffusion_repo_got_a_pr_that/

Výsledkem je, že pro 512x512 obrázky stačí 2,86 GB VRAM, na mojí sekundární (tj. 100% využívané jen pro tohle) 6 GB VRAM grafické kartě můžu generovat 832x832 px obrázky (i když mám zapnutý ESRGAN a GFPGAN, které trošku užírají), a na 6 GB VRAM kartě která je využívaná systémem by mělo jít generovat 768x768 px obrázky (či nečtvercový ekvivalent).

A co je zajímavé, používám při spouštění webui flag --optimized-turbo, který má teoreticky o kus vyšší spotřebu RAM než jen --optimized, ale je skoro stejně rychlý jako neoptimalizovaná verze.

Nevýhoda je, že čím větší je obrázek, tím častěji dochází k chybám jako zdvojování prvků. Zkoušel jsem generovat staré portréty rustikálních angličanů a při 832x832 pixelech už mi začal často vyrábět dvě hlavy.

VOZKA --- --- 12:59:59 4.9.2022

Na podobné téma, zde si můžete udělat kvíz jestli rozeznáte landscape fotku od AI obrázku. Ale je to ztížené záměrně nižší kvalitou obrázků. Já jsem dal 11/20.

A.I Test, can you spot whether an image is Artificially generated? | Take the Quiz | QuizMaker
https://take.quiz-maker.com/Q0041DO7G

Kliknutím sem můžete změnit nastavení reklam

přezdívka
heslo


pamatuj si mě
registrace
ztracené heslo?