• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, DALL·E 2, Stable Diffusion, OpenAI
    Vše ohledně umění tvořeného pomocí umělé inteligence - obrázky, 'fotky', galerie, hudba, video, text + články, novinky apod.

    NSFW obsah prosím obalit spoiler tagem - <div class="spoiler">obrázek</spoiler>, a nemá to tu být klub na roštěnky a nahotinky bez nějaké přidané hodnoty

    Příbuzné diskuze:
    - [DALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]]
    - [I Hope This Does Not Exist ​ ​ ​ ▌​ ​ Vedlejší efekty v AI visuálech]
    - AI obecně [Artificial Intelligence AI]
    - Vtipy [Umělá inteligence, chatboti - vtipné konverzace aneb "Hoří hovno?"]
    - [generativní modely] Jak konstruovat prompty, kde získat váhy i jak to vše interpretovat


    Prosím zkusme pro vkládanou tvorbu používat tagy
    #galerie (2-3 obrázky na ukázku, další po rozkliku) #obrázek #video #hudba #text #hry #původní (pro vlastní tvorbu) #roštěnky

    #článek #nástroj

    (návrhy na další tagy apod. vítány)

    Texty, programování: https://beta.openai.com/playground | https://chat.openai.com/
    Obrázky online: https://www.midjourney.com/ | https://beta.dreamstudio.ai/
    Lokálně: Webui-Forge https://github.com/lllyasviel/stable-diffusion-webui-forge | ComfyUI https://github.com/comfyanonymous/ComfyUI | Civitai repository custom modelů pro SD
    AI na vytvoření textového zadání z existujícího obrázku: https://huggingface.co/spaces/pharma/CLIP-Interrogator
    rozbalit záhlaví
    KERRAY
    KERRAY --- ---
    #nástroj #video #kling 2.1 udělá video mezi dvěma obrázky, a už z toho lezou působivé kousky
    Reddit - The heart of the internet
    https://www.reddit.com/r/aivideo/s/dZ5zzEULkc
    KERRAY
    KERRAY --- ---
    #nástroj #obrázky
    Qwen-Image-Edit: Image Editing with Higher Quality and Efficiency | Qwen
    https://qwenlm.github.io/blog/qwen-image-edit/
    KERRAY
    KERRAY --- ---
    id STRYX má na FB (vedle fajn aktualit o AI) i dost dobré #původní obrázky z #midjourney
    Jan Dřevíkovský - Otestoval jsem Midjourney 7 na svych...
    https://www.facebook.com/permalink.php?story_fbid=pfbid02rFbzLs7SWuws2W9BQwWYYJQYsbgPa2cq3zz5B68NJYdMuyfZZoXzouNeRW1trSvHl&id=100079304857909
    ELEYNE
    ELEYNE --- ---
    Jak přesvětčit gpt chat aby generoval obrázky, které budou vypadat jako by je maloval stejný autor? Ať se snažím jak se snažím vždy je tam jiná míra detailu, dinamika pózy a podobně. Dát předchozí obrázek jako referenci nepomáhá
    DEEJAYY
    DEEJAYY --- ---
    Zvládne nějaký free nástroj tvořit obrázky stejně jako placené gpt? Prostě fakt něco úplně jednoduchého, kde nemusím psát promty a napíšu mu to normálně česky? Výsledky z gpt mi vyhovovaly, ale potřebuji to úplně minimálně a nechce se mi za to dávat 25 babek...
    E2E4
    E2E4 --- ---
    E2E4: (pro ty ilustrační obrázky stačí free nástroje)
    E2E4
    E2E4 --- ---
    LA_PIOVRA: záleží na co to potřebuje, pro profesionální práci midjourney, pro nějaký ilustrační obrázky kde nepotřebuješ aby mely stejný styl/postavy..

    rovozovat to sám je trošku zbytečná technická challenge.

    přístup k různým free modelům je na Poe.com, i v neplacený verzi, stačí jen google účet. tím bych asi začal.
    MATT
    MATT --- ---
    takovou zhuleneckou logikou jsem si vymyslel, jak by mohli generatory obrazku fungovat, tak by me zajimalo, jak moc je ta idea mimo.. ;)

    Inspirovalo me video od Moulda o rezonancnich frekvencich, kdy foukne do lahve bilej sum a lahev se rozezni rezonancni frekvenci. K tomu jsem si vzpomel, ze nejaka komprese obrazku funguje na principu Furrierovyho rozkladu a ze obrazky se generujou z pocatecniho sumu. Princip by byl v tom, ze bych mel obrazky veci, ty bych komprimoval Furrierovym rozkladem a vysledny "frekvence" priradil ke slovum, ktery odpovidaj veci na obrazku. Nasledna geneze obrazku by vyuzila sum a znamy "rezonancni" frekvence prislusnejch slov a ze sumu by vygenerovala pozadovany obrazek. Okolo by byl nakej balast transformace prostoru slov na vektory, frekvence na vektory a tak..
    VOZKA
    VOZKA --- ---
    Pro zajímavost doložím obrázky.

    Ulice v NYC úplně kompletně bez aut, skutečně žádná auta, žádné taxíky, nic, dle Dalle-3:


    Jeden z pokusů o ulici "bez aut" v něčí webové verzi SDXL (moje lokální pokusy byly podobně úspěšné):


    Jeden z pokusů o ulici "bez aut, taxíků ani jiných vehiklů" v SDXL Turbo, které je obzvlášť špatné v respektování negativních promptů:



    Ulice v NYC bez aut dle SD v1.5:


    Dvouproudá silnice (aby to měl trochu těžší a nedělal jen úzké staré uličky pro chodce) bez aut v Praze dle SD .1.5:
    VOZKA
    VOZKA --- ---
    Zaregistrovali jste vydání SDXL Turbo?

    Je to vydestilovaný model, který generuje použitelné obrázky už ve dvou krocích. A u mě, starší počítač a 6 GB VRAM s nutností použití pomalého --lowvram módu, se každý krok počítá cca o polovinu rychleji. Takže zatímco u SDXL se mi použitelný obrázek generuje přes tři minuty, tady to mám za dvacet vteřin. Na rychlejších současných GPU to je prý víceméně realtime.

    Funguje to v ComfyUI, s nutností použít trochu jiný workflow (u nich na webu mají někde ukázku), s A1111 předpokládám taky.

    Kvalita je někde subjektivně stejně dobrá, někde, když po tom chcete generovat méně standardní věci (typu screenshot ze staré pixel artové videohry), funguje hůř. Testoval jsem jen chvilku, ale přijde mi, že slabé stránky SDXL jsou ještě o něco slabší, silné stránky jsou srovnatelné.
    PEETIK
    PEETIK --- ---
    Jakým způsobem vytvářejí lidi ty stejné Ai obrázky co cpou na Instagram apod... zejména jakože modelky. Dokáže to MJ nebo něco víc spešl?
    KILLUA
    KILLUA --- ---
    Všem díky za lajky, vím, že obrázky spíše nacházím než tvořím, ale vždy si na každém dám záležet i několik hodin, hledám ještě lepší verzi a tak. Bohužel se zdá, že u dalle3 je ted problematické používat stejný seed (čím dál víc zlobí) a zavedli přísné limity i na daily usage. Takže se to stává vlastně nepoužitelné.

    Rok zpět jsem ale dělal seriozní inpainting a s jedním obrázkem si tak hrál snad týden... v takovém případě pak už mám pocit, že jsem obrázek vlastně vytvořil, že jen "zmáčkl tlačítko".

    No prostě díky, mám jich mnohem víc, ale nechci spamovat a pak je to taky mrzení když lidé obrázek odignorují no nevím jak to máte vy... prostě se chcete pochlubit a nic no X-)
    THEODORT
    THEODORT --- ---
    FRK_R23: no. a co s tim?
    i v ramci jednoho modelu ti nesmyslny ci prazdny prompt vygeneruje na jeden seed jednu nesmyslnou vec.
    lorem ipsum pripomina latinu, tak to seka anticky obrazky.
    DAVE2
    DAVE2 --- ---
    KERRAY: Tohle by mohl být gamechanger. Prozatím byl pro profi použití problém s kompozicí. Když jste chtěli vygenerovat košík jablek a vedle košík hrušek, většinou to smíchal dohromady protože na vstupu se to převede jen na slova "košík" "jablka" "hrušky" a na základě toho to něco sesmolí. Dalo se to obejít rozdělením obrazu na segmety apod. Ale to je nepraktické. Teď si můžu pohrát s kompozicí scény a pak zakroužkovat místo a nechat tam vygenerovat jeden a pak druhý košík. I když se to nezdá, toto je podle mě velký posun od toho, že to generuje náhodné hezké obrázky k opravdu použitelnému nástroji
    HUGGI
    HUGGI --- ---
    Nenarazil jste někdo na aplikaci která by uměla generovat ne "obrázky" ale grafický podklady - například úplně klasický webový bannery.
    DAVE2
    DAVE2 --- ---
    HONZAK89: Jestli tomu rozumím dobře, tak 360° panoramatické obrázky umí tak trochu všechny generátory obrázků a na youtube jsou k tomu nějaké videa (např. https://www.youtube.com/watch?v=FINasiWtjO0 ). Stable diffuion jako jediný (?) umí generovat podle vodítek (například podle skici nebo jiného obrázku jak to využívá třeba RoomGPT). Takže někdo jen doplnil plugin, kde si ty vodítka můžete nakreslit jekože ve virtuální místnosti. Výsledek je ale pořád jen 360° rozložený obrázek. Je to zajímavé, ale moc nevidím žádný usecase...
    DAVE2
    DAVE2 --- ---
    Pouzivam pres 2 mesice Midjourney a po prvotnim nadseni jsem z toho cim dale frustrovanejsi. Umi generovat krasne obrazky jednotlivych objektu. Jakmile ale clovek chce nejakou komplikovanejsi scenu s vice objekty/aktery, je to hruza. Jak jsem pochopil, tak zadna soucasna AI neumi kompozici, to znamena, ze to uplne ugnoruje popisy jako nad, pod, za, v dali, blizko. V podstate to z promptu vybere klicova slova a nejak je ro nahodne spoji, nebo rovnou ignoruje ty, co se ji nehodi. Kdyz jsem koukal na snahu lidi na Discordu, resi to nekdo dost casto. Nebo neco delam spatne? Je nejaky jiny generator obrazku lepsi.
    Priklad obrazku podle knihy TO od Stephena Kinga, ktery jsem se marne snazil vytvorit: kluk ve zlute plastence stoji na moste pres ricku, ma v ruce papirovou lodicku, prsi, pod mostem se ve stinu skryva vrazdici klaun Pennywise, drzi v ruce balonky
    Jestli to budete nekdo schopni vygenerovat, dejte mi prosim vedet
    LOJZA
    LOJZA --- ---
    KERRAY: Mno, v zásadě to dokazuje, že stávající image-generative AI umí i méně hyperrealistické obrázky... Vadí mi na tom asi tolik, že to autor podává tak, že mu ChatGPT udělala "early feeling", jakoby chápala, co to "early feeling" vlastně je. Jenže ChatGPT nemá třeba o nejnovějším Midourney modelu IMHO ani potuchy. Čili prompt, který mu ChatGPT vygenerovala, je v zásadě střelba naslepo, resp. autor musel ChatGPT dobře vysvětlit, co vlastně chce. Takže taková AI pro AI, resp. autorovi se nechtělo vymýšlet prompt, tak si ho popsal pro ChatGPT. Že by to ale znamenalo, že jedna AI umí přesvědčit jinou AI, aby se chovala "jako dřív", tak to bych řekl, že ani omylem :/
    VOZKA
    VOZKA --- ---
    MICHIGAN: Jestliže to co ukazuješ je reprezentativní průřez a ne preselekce toho povedeného, tak mi přijde že mají obrázky o hodně lepší koherenci než 1.5 nebo 2.1. Jsou limitovaný tím, že na rozdíl od Midjourney zatím nemají zpětnou vazbu od uživatelů pro každý obrázek, na základě které pak můžou model ladit směrem k hezčím výstupům, a s vědomím toho by mi tyhle obrázky přišly dost dobré.
    CRAZY_IVAN
    CRAZY_IVAN --- ---
    jenom pro představu

    obrázky od sebe dělí cca rok, prompt stejný

    Kliknutím sem můžete změnit nastavení reklam