• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PRAASHEKDALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]
    PRAASHEK
    PRAASHEK --- ---
    MATT: Lois ujde, ale jinak jsou to brutálně nesympatické postavy
    MATT
    MATT --- ---
    Alias-Free Generative Adversarial Networks (StyleGAN3)
    https://nvlabs.github.io/stylegan3/

    ty videa mi prijdou slusne creepy, jak je videt, ze struktury a "textury" vlastne stojej na miste a jen se s ruznou intenzitou propisujou do vyslednyho obrazku..
    OMN
    OMN --- ---
    KAJJAK
    KAJJAK --- ---
    OMN: cim to animujes?
    OMN
    OMN --- ---
    co myslite, kdy nam to zakazou? btw jsem se chytil trendu te balenciagy, ale midjourney se mi nechce platit a s tim sd to neni uplne ono, tak jsem to brzo vzdal (proto je to tak kratke): https://www.youtube.com/watch?v=2yC8sQPw3AI
    BLAHOVEJ
    BLAHOVEJ --- ---
    Už mi to jde lépe. Stáhl jsem deliberate_v2.safetensors [9aba26abdf]
    BLAHOVEJ
    BLAHOVEJ --- ---
    PRAASHEK: Aha, sry. Tak to bude AUTOMATIC1111 . Ještě jsem někde našel, že někomu pomohlo naistalovat optimised sd, ale zatím jsem nenašel jak na to.
    PRAASHEK
    PRAASHEK --- ---
    BLAHOVEJ: myslel jsem GUI - graphical user interface (třeba NKMD nebo GUI od Automatic1111). To, na co poukazuješ, je model :)
    BLAHOVEJ
    BLAHOVEJ --- ---
    Pokud je to GUI tak v2-1_768-ema-pruned.ckpt [ad2a33c361]
    PRAASHEK
    PRAASHEK --- ---
    BLAHOVEJ: který GUI používáš?
    BLAHOVEJ
    BLAHOVEJ --- ---
    Zatim jsem nasel toto: https://docs.google.com/document/d/1sgXAnFMEfx-I_Harts7cEGEPAtmWGvl62yJHByPE0ZI/mobilebasic#
    A zda se ze za ty zvlastni barvy muze vysoke cfg.
    BLAHOVEJ
    BLAHOVEJ --- ---
    Diky. S instalaci SD jsem si poradil. Mam tu navstevu tak zatim nestiham moc zkouset, ale nedela to uplne to co chci - divne barvy, malo detailni, zvlastni orezy a to i kdyz zkousim propracovanejsi prompty z lexica. Mozna je to nastavenim, nebo nejakymi postprodulcnimi upravami - upscale? Mate nejaky odkaz na tipy pro zacatecniky? (nastaveni, promprovani). Nebo vlastni tipy, ktere vam pomohly v zacatcich? Googlit umim, ale je toho mnoho a zatim nerozlisim jake zdroje jsou kvalitni. Dik.
    VOZKA
    VOZKA --- ---
    TEKKET: Ono těch 15 vteřin nefunguje úplně vždycky, konkrétně například u některých (nevím jestli všech) samplerů platí, že čím vyšší zvolíš hodnotu cfg (jak moc přesně má výsledný obrázek splňovat zadání), tím více výpočetních kroků je potřeba k tomu, aby výsledek vypadal dobře. Naopak při nízkých hodnotách cfg mi to 512x512 px obrázek dá i pod 10 vteřin. Takže leonardo.ai to má nejspíš nastavené tak, aby vyprodukovali dobrý výsledek vždycky, zatímco v lokálu si můžeš dovolit těmi nastaveními hýbat jak je třeba a když náhodou narazíš na obrázek co se ti líbí, ale působí jakože by chtěl víc kroků, tak prostě jen přegeneruješ ten jeden obrázek.
    TEKKET
    TEKKET --- ---
    VOZKA: 15 sekund na 1060 není tak špatný, čekal jsem to horší. Tolik někdy čekám na leonardo.ai, tak to v dohledné době vyzkouším lokální verzi.
    PRAASHEK
    PRAASHEK --- ---
    TEKKET:
    VOZKA: ještě bych dodal, že pokud má někdo (jako já) pořád puštěné nějaké video, tak při používání lokálního stable diffusion je potřeba to vypnout, protože se pak doba počítání vykreslování obrazu z promptu prodlužuje cca čtyřistakrát ;)
    VOZKA
    VOZKA --- ---
    TEKKET: SD jede v pohodě i na 10x0 kartách. Počkáš si dýl, ale se správným nastavením to na mojí GTX 1060 znamená třeba 15 sekund na obrázek, při obyčejném generování. Při procesech jako outpainting nebo použití control netu na větších obrázcích se výpočet prodlužuje na několikanásobek, takže to pak už pomalé je. Velikost VRAM řídí maximální velikost vygenerovaného obrázku, ale je to závislé i na modelu - 768x768 2.1 model je na VRAM náročnější, ale i tak s 6 GB VRAM v pohodě generuju 1024x768 obrázky. Ale není to future proof, modely se budou dál zvětšovat (SDXL už se testuje a bude větší).

    To "moje" GUI od Automatic1111 by mělo fungovat na widlích i na Linuxu stejně dobře.
    TEKKET
    TEKKET --- ---
    Díky.
    PRAASHEK
    PRAASHEK --- ---
    TEKKET: to, na co odkazuju níže, jsou webové "playgroundy", tam nepotřebuješ žádný výkonný hardware, protože nic nepočítáš na své straně, klidně to můžeš používat na mobilu. Pokud chceš zprovoznit nějaký stable diffusion gui u sebe doma, tak záleží hlavně na velikosti RAM, co máš na grafické kartě. Zkus třeba https://nmkd.itch.io/t2i-gui - ale je toho hromada. Vozka tu doporučoval možná trochu lepší GUI, ale zatím jsem se nepřinutil to zkusit ;)

    NMKD

    text2image-gui/README.md at main · n00mkrad/text2image-gui · GitHub
    https://github.com/n00mkrad/text2image-gui/blob/main/README.md#system-requirements

    System Requirements

    OS: Windows 10/11 64-bit
    Minimum:

    GPU: Nvidia GPU with 4 GB VRAM, Maxwell Architecture (2014) or newer
    Alternatively, with limited feature support: Any DirectML-capable GPU with 8 GB of VRAM

    RAM: 8 GB RAM (Note: Pagefile must be enabled as swapping will occur with only 8 GB!)

    Disk: 10 GB (another free 5 GB for temporary files recommended)

    Recommended:

    GPU: Nvidia GPU with 8 GB VRAM, Pascal Architecture (2016) or newer
    RAM: 16 GB RAM
    Disk: 12 GB on SSD (another free 5 GB for temporary files recommended)

    Professional/DreamBooth-capable:

    GPU: Nvidia GPU with 24GB VRAM, Turing Architecture (2018) or newer
    RAM: 32 GB RAM
    Disk: 12 GB on NVME SSD (another free 25 GB for temporary files recommended), system-managed paging file enabled

    Features and How to Use Them
    Prompt Input

    Multiple prompts at once: Enter each prompt on a new line (newline-separated). Word wrapping does not count towards this.

    Negative Prompt: Put words or phrases into this box to tell the AI to exclude those things when generating images.
    Alternatively, you can also put the negative prompt into the regular prompt box by wrapping it in [brackets].

    Emphasis: Use + after a word/phrase to make it more impactful, or - to do the opposite. You can also use to increase the effect. Wrap your phrase in parentheses if you want to apply it to more than one word.
    Each plus/minus applies a multiplier of 1.1. So two +++ would be 1.1^3 = 1.331, and so on.
    You can also type the strength manually after parentheses, e.g. a (huge)1.33 dog instead of a huge+++ dog
    Syntax Examples: a green++ tree, a (big green)+ tree with orange- leaves (in the woods)++

    Wildcards: Fill in words or phrases from a list into the prompt.
    Inline: photo of a ~car,tree,dog~.
    From File: photo of a ~objects for loading texts from objects.txt in your Wildcards folder in the SD GUI root folder.
    Order: Use ~ for random/shuffled, ~~ for unchanged order, or ~~~ for sorted (A-Z) mode.

    Additional Inputs

    Load Image(s): Load an initialization image that will be used together with your text prompt ("img2img")
    Loading multiple images means that each image will be processed separately.

    Load Concept: Load a Textual Inversion concept to apply a style or use a specific character

    Stable Diffusion Settings

    Steps: More steps can increase detail, but only to a certain extent. Depending on the sampler, 20-60 is a good range.
    Has a linear performance impact: Doubling the step count means each image takes twice as long to generate.

    Prompt Guidance (CFG Scale): Lower values are closer to the raw output of the AI, higher values try to respect your prompt more accurately.
    Use low values if you are happy with the AI's representation of your prompt. Use higher values if not - but going too high will degrade quality.
    No performance impact, no matter the value.

    Seed: Starting value for the image generation. Allows you to create the exact same image again by using the same seed.
    When using the same seed, the image will only be identical if you also use the same sampler and resolution (and other settings).
    Lock Seed Option: Disable incrementing the seed by 1 for each image. Only useful in combination with wildcards.

    Resolution: Adjust image size. Only values that are divisible by 64 are possible. Sizes above 512x512 can lead to repeated patterns.
    Higher resolution images require more VRAM and are slower to generate.
    High-Resolution Fix: Enable this to avoid getting repeated patterns at high resolutions (~768px+). Can reduce fidelity though.

    Sampler: Changes the way images are sampled. Euler Ancestral is the default because it's fast and tends to look good even with few steps.

    Generate Seamless Images: Generates seamless/tileable images, very useful for making game textures or repeating backgrounds.

    Image Viewer

    Review current images: Use the scroll wheel while hovering over the image to go to the previous/next image.
    Slideshow: The image viewer always shows the newest generated image if you haven't manually changed it in the last 3 seconds.
    Context Menu: Right-click into the image area to show more options.
    Pop-Up Viewer: Click into the image area to open the current image in a floating window.
    Use the mouse wheel to change the window's size (zoom), right-click for more options, double-click to toggle fullscreen.
    Kliknutím sem můžete změnit nastavení reklam