DALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]

BLAHOVEJ --- --- 16:01:33 8.4.2023

1 odpověď

Pokud je to GUI tak v2-1_768-ema-pruned.ckpt [ad2a33c361]

PRAASHEK --- --- 7:46:50 8.4.2023

BLAHOVEJ: který GUI používáš?

BLAHOVEJ --- --- 7:45:02 8.4.2023

Zatim jsem nasel toto: https://docs.google.com/document/d/1sgXAnFMEfx-I_Harts7cEGEPAtmWGvl62yJHByPE0ZI/mobilebasic#
A zda se ze za ty zvlastni barvy muze vysoke cfg.

BLAHOVEJ --- --- 7:31:46 8.4.2023

1 odpověď

Diky. S instalaci SD jsem si poradil. Mam tu navstevu tak zatim nestiham moc zkouset, ale nedela to uplne to co chci - divne barvy, malo detailni, zvlastni orezy a to i kdyz zkousim propracovanejsi prompty z lexica. Mozna je to nastavenim, nebo nejakymi postprodulcnimi upravami - upscale? Mate nejaky odkaz na tipy pro zacatecniky? (nastaveni, promprovani). Nebo vlastni tipy, ktere vam pomohly v zacatcich? Googlit umim, ale je toho mnoho a zatim nerozlisim jake zdroje jsou kvalitni. Dik.

VOZKA --- --- 12:48:55 7.4.2023

TEKKET: Ono těch 15 vteřin nefunguje úplně vždycky, konkrétně například u některých (nevím jestli všech) samplerů platí, že čím vyšší zvolíš hodnotu cfg (jak moc přesně má výsledný obrázek splňovat zadání), tím více výpočetních kroků je potřeba k tomu, aby výsledek vypadal dobře. Naopak při nízkých hodnotách cfg mi to 512x512 px obrázek dá i pod 10 vteřin. Takže leonardo.ai to má nejspíš nastavené tak, aby vyprodukovali dobrý výsledek vždycky, zatímco v lokálu si můžeš dovolit těmi nastaveními hýbat jak je třeba a když náhodou narazíš na obrázek co se ti líbí, ale působí jakože by chtěl víc kroků, tak prostě jen přegeneruješ ten jeden obrázek.

TEKKET --- --- 10:11:31 7.4.2023

1 odpověď

VOZKA: 15 sekund na 1060 není tak špatný, čekal jsem to horší. Tolik někdy čekám na leonardo.ai, tak to v dohledné době vyzkouším lokální verzi.

PRAASHEK --- --- 10:07:14 7.4.2023

TEKKET:
VOZKA: ještě bych dodal, že pokud má někdo (jako já) pořád puštěné nějaké video, tak při používání lokálního stable diffusion je potřeba to vypnout, protože se pak doba počítání vykreslování obrazu z promptu prodlužuje cca čtyřistakrát ;)

VOZKA --- --- 10:03:29 7.4.2023

2 odpovědi

TEKKET: SD jede v pohodě i na 10x0 kartách. Počkáš si dýl, ale se správným nastavením to na mojí GTX 1060 znamená třeba 15 sekund na obrázek, při obyčejném generování. Při procesech jako outpainting nebo použití control netu na větších obrázcích se výpočet prodlužuje na několikanásobek, takže to pak už pomalé je. Velikost VRAM řídí maximální velikost vygenerovaného obrázku, ale je to závislé i na modelu - 768x768 2.1 model je na VRAM náročnější, ale i tak s 6 GB VRAM v pohodě generuju 1024x768 obrázky. Ale není to future proof, modely se budou dál zvětšovat (SDXL už se testuje a bude větší).

To "moje" GUI od Automatic1111 by mělo fungovat na widlích i na Linuxu stejně dobře.

TEKKET --- --- 10:00:53 7.4.2023

1 odpověď

Díky.

PRAASHEK --- --- 6:32:03 7.4.2023

TEKKET: to, na co odkazuju níže, jsou webové "playgroundy", tam nepotřebuješ žádný výkonný hardware, protože nic nepočítáš na své straně, klidně to můžeš používat na mobilu. Pokud chceš zprovoznit nějaký stable diffusion gui u sebe doma, tak záleží hlavně na velikosti RAM, co máš na grafické kartě. Zkus třeba https://nmkd.itch.io/t2i-gui - ale je toho hromada. Vozka tu doporučoval možná trochu lepší GUI, ale zatím jsem se nepřinutil to zkusit ;)

NMKD

text2image-gui/README.md at main · n00mkrad/text2image-gui · GitHub
https://github.com/n00mkrad/text2image-gui/blob/main/README.md#system-requirements

System Requirements

OS: Windows 10/11 64-bit
Minimum:

GPU: Nvidia GPU with 4 GB VRAM, Maxwell Architecture (2014) or newer
Alternatively, with limited feature support: Any DirectML-capable GPU with 8 GB of VRAM

RAM: 8 GB RAM (Note: Pagefile must be enabled as swapping will occur with only 8 GB!)

Disk: 10 GB (another free 5 GB for temporary files recommended)

Recommended:

GPU: Nvidia GPU with 8 GB VRAM, Pascal Architecture (2016) or newer
RAM: 16 GB RAM
Disk: 12 GB on SSD (another free 5 GB for temporary files recommended)

Professional/DreamBooth-capable:

GPU: Nvidia GPU with 24GB VRAM, Turing Architecture (2018) or newer
RAM: 32 GB RAM
Disk: 12 GB on NVME SSD (another free 25 GB for temporary files recommended), system-managed paging file enabled

Features and How to Use Them
Prompt Input

Multiple prompts at once: Enter each prompt on a new line (newline-separated). Word wrapping does not count towards this.

Negative Prompt: Put words or phrases into this box to tell the AI to exclude those things when generating images.
Alternatively, you can also put the negative prompt into the regular prompt box by wrapping it in [brackets].

Emphasis: Use + after a word/phrase to make it more impactful, or - to do the opposite. You can also use to increase the effect. Wrap your phrase in parentheses if you want to apply it to more than one word.
Each plus/minus applies a multiplier of 1.1. So two +++ would be 1.1^3 = 1.331, and so on.
You can also type the strength manually after parentheses, e.g. a (huge)1.33 dog instead of a huge+++ dog
Syntax Examples: a green++ tree, a (big green)+ tree with orange- leaves (in the woods)++

Wildcards: Fill in words or phrases from a list into the prompt.
Inline: photo of a ~car,tree,dog~.
From File: photo of a ~objects for loading texts from objects.txt in your Wildcards folder in the SD GUI root folder.
Order: Use ~ for random/shuffled, ~~ for unchanged order, or ~~~ for sorted (A-Z) mode.

Additional Inputs

Load Image(s): Load an initialization image that will be used together with your text prompt ("img2img")
Loading multiple images means that each image will be processed separately.

Load Concept: Load a Textual Inversion concept to apply a style or use a specific character

Stable Diffusion Settings

Steps: More steps can increase detail, but only to a certain extent. Depending on the sampler, 20-60 is a good range.
Has a linear performance impact: Doubling the step count means each image takes twice as long to generate.

Prompt Guidance (CFG Scale): Lower values are closer to the raw output of the AI, higher values try to respect your prompt more accurately.
Use low values if you are happy with the AI's representation of your prompt. Use higher values if not - but going too high will degrade quality.
No performance impact, no matter the value.

Seed: Starting value for the image generation. Allows you to create the exact same image again by using the same seed.
When using the same seed, the image will only be identical if you also use the same sampler and resolution (and other settings).
Lock Seed Option: Disable incrementing the seed by 1 for each image. Only useful in combination with wildcards.

Resolution: Adjust image size. Only values that are divisible by 64 are possible. Sizes above 512x512 can lead to repeated patterns.
Higher resolution images require more VRAM and are slower to generate.
High-Resolution Fix: Enable this to avoid getting repeated patterns at high resolutions (~768px+). Can reduce fidelity though.

Sampler: Changes the way images are sampled. Euler Ancestral is the default because it's fast and tends to look good even with few steps.

Generate Seamless Images: Generates seamless/tileable images, very useful for making game textures or repeating backgrounds.

Image Viewer

Review current images: Use the scroll wheel while hovering over the image to go to the previous/next image.
Slideshow: The image viewer always shows the newest generated image if you haven't manually changed it in the last 3 seconds.
Context Menu: Right-click into the image area to show more options.
Pop-Up Viewer: Click into the image area to open the current image in a floating window.
Use the mouse wheel to change the window's size (zoom), right-click for more options, double-click to toggle fullscreen.

TEKKET --- --- 2:12:15 7.4.2023

2 odpovědi

PRAASHEK: jak je to nyní s náročností? Vím, že se obecně doporučuje rtx 30x0, byť jsem zaregistroval patch, se kterým se má údajně stable diffusion jakž takž provozovat i na kartách od 1650S. Hraje roli Linux, či Windows?

PRAASHEK --- --- 20:03:35 6.4.2023

2 odpovědi

//dyžtak uvítám tipy na další kompletně free alternatives!

PRAASHEK --- --- 20:03:00 6.4.2023

BLAHOVEJ: např.

https://www.mage.space/

Text-to-image AI Image Generator (free / freemium) - Dezgo
https://dezgo.com/

AI Art Generator, AI Image Generator - Hotpot.ai
https://hotpot.ai/art-generator

Stable Diffusion Online
https://stablediffusionweb.com/#demo

KERRAY --- --- 13:34:55 6.4.2023

BLAHOVEJ: https://github.com/AUTOMATIC1111/stable-diffusion-webui/

BLAHOVEJ --- --- 13:26:46 6.4.2023

1 odpověď

SMOKY: to by šlo. Nějaký tip na specifickou verzi?

SMOKY --- --- 13:21:42 6.4.2023

1 odpověď

BLAHOVEJ: Rozbehej si stable diffusion na vlastním stroji

BLAHOVEJ --- --- 13:17:09 6.4.2023

3 odpovědi

Ahoj, nějak jsem nesledoval vývoj. S čím si můžu hrát a testovat bez placení kreditů? Poradíte? Zkouším night-cafe, ale než se mi podaří dosáhnout přibližně toho, co si představuju tak vyčerpám kredity.

MATT --- --- 20:19:19 5.4.2023

SUBTITLES017:
https://twitter.com/heyBarsee/status/1643518329632555008

Barsee 🐶 | heyBarsee | 5.4.2023

5. And just like that. The music industry maybe forever changed by this.

Done by @rpnickson
https://t.co/0J81Fr4Bjt

MATT --- --- 17:50:00 5.4.2023

MATT: jeste tuto

https://yosinski.com/deepvis

pripadne

Visualizing deep convolutional neural networks using natural pre-images
https://arxiv.org/pdf/1512.02017.pdf

SUBTITLES017 --- --- 21:38:18 4.4.2023

1 odpověď +1

snad ne offtopic, kdyztak sry :)

JayZ v tomhle songu není JayZ, ale AI vytvořený hlas, který zní přesně jako on

AllttA - Savages
https://www.youtube.com/watch?v=y7r6PAkFRfU&t=0s

Kliknutím sem můžete změnit nastavení reklam

přezdívka
heslo

pamatuj si mě
registrace
ztracené heslo?