• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PRAASHEKDALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]
    Having anal sex with AI be like:



    Twitter Weird Dall-E Mini Generations
    https://twitter.com/weirddalle

    AI model generating images from any prompt!

    I Hope This Does Not Exist (spřízněné auditko @ Nyx)

    Lexica - Databáze obrázků vygenerovaných AIčkem Stable Diffusion s prompty a vyhledáváním. Dobrá věc na inspiraci.
    rozbalit záhlaví
    VOZKA
    VOZKA --- ---
    TEKKET: Ono těch 15 vteřin nefunguje úplně vždycky, konkrétně například u některých (nevím jestli všech) samplerů platí, že čím vyšší zvolíš hodnotu cfg (jak moc přesně má výsledný obrázek splňovat zadání), tím více výpočetních kroků je potřeba k tomu, aby výsledek vypadal dobře. Naopak při nízkých hodnotách cfg mi to 512x512 px obrázek dá i pod 10 vteřin. Takže leonardo.ai to má nejspíš nastavené tak, aby vyprodukovali dobrý výsledek vždycky, zatímco v lokálu si můžeš dovolit těmi nastaveními hýbat jak je třeba a když náhodou narazíš na obrázek co se ti líbí, ale působí jakože by chtěl víc kroků, tak prostě jen přegeneruješ ten jeden obrázek.
    TEKKET
    TEKKET --- ---
    VOZKA: 15 sekund na 1060 není tak špatný, čekal jsem to horší. Tolik někdy čekám na leonardo.ai, tak to v dohledné době vyzkouším lokální verzi.
    PRAASHEK
    PRAASHEK --- ---
    TEKKET:
    VOZKA: ještě bych dodal, že pokud má někdo (jako já) pořád puštěné nějaké video, tak při používání lokálního stable diffusion je potřeba to vypnout, protože se pak doba počítání vykreslování obrazu z promptu prodlužuje cca čtyřistakrát ;)
    VOZKA
    VOZKA --- ---
    TEKKET: SD jede v pohodě i na 10x0 kartách. Počkáš si dýl, ale se správným nastavením to na mojí GTX 1060 znamená třeba 15 sekund na obrázek, při obyčejném generování. Při procesech jako outpainting nebo použití control netu na větších obrázcích se výpočet prodlužuje na několikanásobek, takže to pak už pomalé je. Velikost VRAM řídí maximální velikost vygenerovaného obrázku, ale je to závislé i na modelu - 768x768 2.1 model je na VRAM náročnější, ale i tak s 6 GB VRAM v pohodě generuju 1024x768 obrázky. Ale není to future proof, modely se budou dál zvětšovat (SDXL už se testuje a bude větší).

    To "moje" GUI od Automatic1111 by mělo fungovat na widlích i na Linuxu stejně dobře.
    TEKKET
    TEKKET --- ---
    Díky.
    PRAASHEK
    PRAASHEK --- ---
    TEKKET: to, na co odkazuju níže, jsou webové "playgroundy", tam nepotřebuješ žádný výkonný hardware, protože nic nepočítáš na své straně, klidně to můžeš používat na mobilu. Pokud chceš zprovoznit nějaký stable diffusion gui u sebe doma, tak záleží hlavně na velikosti RAM, co máš na grafické kartě. Zkus třeba https://nmkd.itch.io/t2i-gui - ale je toho hromada. Vozka tu doporučoval možná trochu lepší GUI, ale zatím jsem se nepřinutil to zkusit ;)

    NMKD

    text2image-gui/README.md at main · n00mkrad/text2image-gui · GitHub
    https://github.com/n00mkrad/text2image-gui/blob/main/README.md#system-requirements

    System Requirements

    OS: Windows 10/11 64-bit
    Minimum:

    GPU: Nvidia GPU with 4 GB VRAM, Maxwell Architecture (2014) or newer
    Alternatively, with limited feature support: Any DirectML-capable GPU with 8 GB of VRAM

    RAM: 8 GB RAM (Note: Pagefile must be enabled as swapping will occur with only 8 GB!)

    Disk: 10 GB (another free 5 GB for temporary files recommended)

    Recommended:

    GPU: Nvidia GPU with 8 GB VRAM, Pascal Architecture (2016) or newer
    RAM: 16 GB RAM
    Disk: 12 GB on SSD (another free 5 GB for temporary files recommended)

    Professional/DreamBooth-capable:

    GPU: Nvidia GPU with 24GB VRAM, Turing Architecture (2018) or newer
    RAM: 32 GB RAM
    Disk: 12 GB on NVME SSD (another free 25 GB for temporary files recommended), system-managed paging file enabled

    Features and How to Use Them
    Prompt Input

    Multiple prompts at once: Enter each prompt on a new line (newline-separated). Word wrapping does not count towards this.

    Negative Prompt: Put words or phrases into this box to tell the AI to exclude those things when generating images.
    Alternatively, you can also put the negative prompt into the regular prompt box by wrapping it in [brackets].

    Emphasis: Use + after a word/phrase to make it more impactful, or - to do the opposite. You can also use to increase the effect. Wrap your phrase in parentheses if you want to apply it to more than one word.
    Each plus/minus applies a multiplier of 1.1. So two +++ would be 1.1^3 = 1.331, and so on.
    You can also type the strength manually after parentheses, e.g. a (huge)1.33 dog instead of a huge+++ dog
    Syntax Examples: a green++ tree, a (big green)+ tree with orange- leaves (in the woods)++

    Wildcards: Fill in words or phrases from a list into the prompt.
    Inline: photo of a ~car,tree,dog~.
    From File: photo of a ~objects for loading texts from objects.txt in your Wildcards folder in the SD GUI root folder.
    Order: Use ~ for random/shuffled, ~~ for unchanged order, or ~~~ for sorted (A-Z) mode.

    Additional Inputs

    Load Image(s): Load an initialization image that will be used together with your text prompt ("img2img")
    Loading multiple images means that each image will be processed separately.

    Load Concept: Load a Textual Inversion concept to apply a style or use a specific character

    Stable Diffusion Settings

    Steps: More steps can increase detail, but only to a certain extent. Depending on the sampler, 20-60 is a good range.
    Has a linear performance impact: Doubling the step count means each image takes twice as long to generate.

    Prompt Guidance (CFG Scale): Lower values are closer to the raw output of the AI, higher values try to respect your prompt more accurately.
    Use low values if you are happy with the AI's representation of your prompt. Use higher values if not - but going too high will degrade quality.
    No performance impact, no matter the value.

    Seed: Starting value for the image generation. Allows you to create the exact same image again by using the same seed.
    When using the same seed, the image will only be identical if you also use the same sampler and resolution (and other settings).
    Lock Seed Option: Disable incrementing the seed by 1 for each image. Only useful in combination with wildcards.

    Resolution: Adjust image size. Only values that are divisible by 64 are possible. Sizes above 512x512 can lead to repeated patterns.
    Higher resolution images require more VRAM and are slower to generate.
    High-Resolution Fix: Enable this to avoid getting repeated patterns at high resolutions (~768px+). Can reduce fidelity though.

    Sampler: Changes the way images are sampled. Euler Ancestral is the default because it's fast and tends to look good even with few steps.

    Generate Seamless Images: Generates seamless/tileable images, very useful for making game textures or repeating backgrounds.

    Image Viewer

    Review current images: Use the scroll wheel while hovering over the image to go to the previous/next image.
    Slideshow: The image viewer always shows the newest generated image if you haven't manually changed it in the last 3 seconds.
    Context Menu: Right-click into the image area to show more options.
    Pop-Up Viewer: Click into the image area to open the current image in a floating window.
    Use the mouse wheel to change the window's size (zoom), right-click for more options, double-click to toggle fullscreen.
    TEKKET
    TEKKET --- ---
    PRAASHEK: jak je to nyní s náročností? Vím, že se obecně doporučuje rtx 30x0, byť jsem zaregistroval patch, se kterým se má údajně stable diffusion jakž takž provozovat i na kartách od 1650S. Hraje roli Linux, či Windows?
    PRAASHEK
    PRAASHEK --- ---
    //dyžtak uvítám tipy na další kompletně free alternatives!
    PRAASHEK
    PRAASHEK --- ---
    BLAHOVEJ: např.

    https://www.mage.space/

    Text-to-image AI Image Generator (free / freemium) - Dezgo
    https://dezgo.com/

    AI Art Generator, AI Image Generator - Hotpot.ai
    https://hotpot.ai/art-generator

    Stable Diffusion Online
    https://stablediffusionweb.com/#demo
    BLAHOVEJ
    BLAHOVEJ --- ---
    SMOKY: to by šlo. Nějaký tip na specifickou verzi?
    SMOKY
    SMOKY --- ---
    BLAHOVEJ: Rozbehej si stable diffusion na vlastním stroji
    BLAHOVEJ
    BLAHOVEJ --- ---
    Ahoj, nějak jsem nesledoval vývoj. S čím si můžu hrát a testovat bez placení kreditů? Poradíte? Zkouším night-cafe, ale než se mi podaří dosáhnout přibližně toho, co si představuju tak vyčerpám kredity.
    MATT
    MATT --- ---
    SUBTITLES017:
    https://twitter.com/heyBarsee/status/1643518329632555008
    MATT
    MATT --- ---
    MATT: jeste tuto

    https://yosinski.com/deepvis



    pripadne

    Visualizing deep convolutional neural networks using natural pre-images
    https://arxiv.org/pdf/1512.02017.pdf
    SUBTITLES017
    SUBTITLES017 --- ---
    snad ne offtopic, kdyztak sry :)

    JayZ v tomhle songu není JayZ, ale AI vytvořený hlas, který zní přesně jako on

    AllttA - Savages
    https://www.youtube.com/watch?v=y7r6PAkFRfU&t=0s
    OMN
    OMN --- ---
    MICHIGAN
    MICHIGAN --- ---
    JARDABEREZA: ale existuje:

    GitHub - hukenovs/hagrid: HAnd Gesture Recognition Image Dataset
    https://github.com/hukenovs/hagrid

    jen to zatim nikdo nevyuzil.
    VOZKA
    VOZKA --- ---
    MATT: Naštěstí máme ChatGPT aby ho vstřebal za nás! Píše se tam víc ne úplně relevantních věcí, tak jsem se ho zeptal co tam je konkrétně o rukách:

    "The article explains that AI image generators have trouble with hands because they lack the understanding of the three-dimensional geometry of hands. These models can create generic images of hands, but they struggle with more complex scenarios involving context, holding objects, or specific hand gestures. Since the models don't understand the 3D nature of hands or the geometric shapes of objects they interact with, they often produce inaccurate or bizarre results."

    Takže vlastně nic moc.
    MATT
    MATT --- ---
    tady je o tom celej clanek, ale nak aktualne nemam silu ho vstrebat..

    Why AI-generated hands are the stuff of nightmares, explained by a scientist | BBC Science Focus Magazine
    https://www.sciencefocus.com/future-technology/why-ai-generated-hands-are-the-stuff-of-nightmares-explained-by-a-scientist/

    YARIN: imho ne, je to jen prace s maticema a statistika.
    JARDABEREZA
    JARDABEREZA --- ---
    YARIN: Problém s prsty je ten, že není příliš mnoho správně otagovaných dat, kde by stroje učili co je, který prst, kde je, kolik atd. Myslím, že až nasbírají dostatek správně popsaných vstupních dat, tak se to zlepší :-)
    Kliknutím sem můžete změnit nastavení reklam