• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, DALL·E 2, Stable Diffusion, OpenAI
    Vše ohledně umění tvořeného pomocí umělé inteligence - obrázky, 'fotky', galerie, hudba, video, text + články, novinky apod.

    NSFW obsah prosím obalit spoiler tagem - <div class="spoiler">obrázek</spoiler>, a nemá to tu být klub na roštěnky a nahotinky bez nějaké přidané hodnoty

    Příbuzné diskuze:
    - [DALL·E mini i Craiyon - having sex with AI since [date format unknown]]
    - [I Hope This Does Not Exist ​ ​ ​ ▌​ ​ Vedlejší efekty v AI visuálech]
    - AI obecně [Artificial Intelligence AI]
    - Vtipy [Umělá inteligence, chatboti - vtipné konverzace aneb "Hoří hovno?"]
    - [generativní modely] Jak konstruovat prompty, kde získat váhy i jak to vše interpretovat


    Prosím zkusme pro vkládanou tvorbu používat tagy
    #galerie (2-3 obrázky na ukázku, další po rozkliku) #obrázek #video #hudba #text #hry #původní (pro vlastní tvorbu) #roštěnky

    #článek #nástroj

    (návrhy na další tagy apod. vítány)

    Texty, programování: https://beta.openai.com/playground | https://chat.openai.com/
    Obrázky online: https://www.midjourney.com/ | https://beta.dreamstudio.ai/
    Lokálně: https://github.com/AUTOMATIC1111/stable-diffusion-webui | https://github.com/invoke-ai/InvokeAI | Civitai repository custom modelů pro SD
    AI na vytvoření textového zadání z existujícího obrázku: https://huggingface.co/spaces/pharma/CLIP-Interrogator
    rozbalit záhlaví
    GEKONZPRAHY
    GEKONZPRAHY --- ---
    Ahoj, mám na vás prosbu. Hrál jsem si s Midjourney, je to docela sranda, ale jak pořádně nevim jak s těma promptama, nedaří se mi vytvořit jistej obrázek. Měla by to bejt kapybara, ideálně podobná té na fotce. Tedy pouze silueta, akorát s tím rozdílem, že chci, aby kapybara dělala nataženým prstem u tlamy mezinárodně známé gesto "psssst". Chci si to vygravírovat na tlumič :)

    Můžete mi prosím někdo poradit jaké prompty zadat, nebo ideálně zkusit vytvořit? Dopředu mockrát děkuju :)

    MATT
    MATT --- ---
    takovou zhuleneckou logikou jsem si vymyslel, jak by mohli generatory obrazku fungovat, tak by me zajimalo, jak moc je ta idea mimo.. ;)

    Inspirovalo me video od Moulda o rezonancnich frekvencich, kdy foukne do lahve bilej sum a lahev se rozezni rezonancni frekvenci. K tomu jsem si vzpomel, ze nejaka komprese obrazku funguje na principu Furrierovyho rozkladu a ze obrazky se generujou z pocatecniho sumu. Princip by byl v tom, ze bych mel obrazky veci, ty bych komprimoval Furrierovym rozkladem a vysledny "frekvence" priradil ke slovum, ktery odpovidaj veci na obrazku. Nasledna geneze obrazku by vyuzila sum a znamy "rezonancni" frekvence prislusnejch slov a ze sumu by vygenerovala pozadovany obrazek. Okolo by byl nakej balast transformace prostoru slov na vektory, frekvence na vektory a tak..
    VOZKA
    VOZKA --- ---
    Zjistil jsem docela zajímavou věc. Na internetech (převážně socky/blogy, ale sem tam i serióznější články) se s jistou pravidelností řešívá bias generativních modelů, zejména v kontextu etnicity, genderu a tak. U novějších modelů se biasy prý trochu zlepšují - například když si necháte vygenerovat asiatku, je prý menší šance, že bude pokaždé poodhalená a vyzývavá. Články jsou obvykle trochu hysterické, tak místo toho zabrušme do nekontroverzních a možná zajímavějších neb méně prozkoumaných témat:

    Zdá se, že nikdo moc nesleduje, jaké vznikají u nových verzí nové nekontroverzní ale klidně i silnější biasy, které u ranějších verzí, co používaly méně sofistikované metody trénování a méně filtrované datasety, neexistovaly.

    Tak například: pomocí Stable Diffusion SDXL se zdá být zcela nemožné vytvořit fotku velkoměsta, která neobsahuje žádná auta. Pro starou verzi 1.5 to není žádný problém, na první dobrou dostanete několik (méně fotorealistických) variant New York City bez jediného auta. Ale v SDXL se mi to nepodařilo ani jednou, dokonce se mi ani moc nedařilo snížit jejich počet. Zkoušel jsem Prahu, která není tak známá vysokým provozem ale spíše starými uličkami, které se fotografové často snaží fotit spíše bez aut, a podařilo se mi udělat obrázek staré ulice s málo auty, ale úplně bez aut taky ne.

    Takže podobně jako si AI představuje generickou asiatku jako sexy odhalenou kočenu a doktora jako bílého muže středního věku, tak si představuje NYC jako plné aut? To je v pořádku protože to je v souladu s realitou, ne? No, ne tak docela, protože sexy asiatky a bílé doktory lze pomocí přesněji definovaného promptu ve většině případů přerazit, ale tohle se zdá být úplně neprůstřelné.

    Dall-E 3 na to trpí taky. Trochu pomáhá fakt, že mu při prvním pokusu (který je plný aut) řeknete "ne, to je špatně, jsou tu auta, chci to pičo bez aut!", a on pak vytvoří další obrázek, kde je aut méně (ale jsou tam). Ale zase čím větší dáváte fokus na absenci aut, tím míň je to pak celé realistické a tím míň to vypadá jako NYC.

    Midjourney nemám a nemohu otestovat, klidně to někdo zkuste, docela by mě zajímalo jestli na tom jsou líp.

    A stejně tak mě zajímá, jestli jste narazili na nějaká jiná nečekaná omezení.
    HITOMI
    HITOMI --- ---
    MJ 6 je fajn :) ale češtin teda bohužel nezvládá :(

    #galerie #obrázek #midjourney #původní

    KERRAY
    KERRAY --- ---
    nevím, že si z toho všeho z nové verze #midjourney vyberu zrovna tenhle #obrázek, ale když už se ty svátky blíží...

    Reddit - Dive into anything
    https://www.reddit.com/r/midjourney/comments/18nx6gz/merry_christmas_v6/
    KERRAY
    KERRAY --- ---
    jsem sem ještě asi nedával nic za sebe, co? tak tenhle kousek třeba vyšel sice mimoděk, ale docela pěkně #původní (haha, původní AI generovaný) #obrázek #midjourney 5.2

    VOZKA
    VOZKA --- ---
    Zaregistrovali jste vydání SDXL Turbo?

    Je to vydestilovaný model, který generuje použitelné obrázky už ve dvou krocích. A u mě, starší počítač a 6 GB VRAM s nutností použití pomalého --lowvram módu, se každý krok počítá cca o polovinu rychleji. Takže zatímco u SDXL se mi použitelný obrázek generuje přes tři minuty, tady to mám za dvacet vteřin. Na rychlejších současných GPU to je prý víceméně realtime.

    Funguje to v ComfyUI, s nutností použít trochu jiný workflow (u nich na webu mají někde ukázku), s A1111 předpokládám taky.

    Kvalita je někde subjektivně stejně dobrá, někde, když po tom chcete generovat méně standardní věci (typu screenshot ze staré pixel artové videohry), funguje hůř. Testoval jsem jen chvilku, ale přijde mi, že slabé stránky SDXL jsou ještě o něco slabší, silné stránky jsou srovnatelné.
    HUGGI
    HUGGI --- ---
    PEETIK: Na ladění detailů mi přijde že lépe funguje generativní film přímo v Photoshopu.
    Celý obrázek mi to dohromady hezky nedá, ale ladit detaily/přidávat prvky jde perfektně.
    KILLUA
    KILLUA --- ---
    Všem díky za lajky, vím, že obrázky spíše nacházím než tvořím, ale vždy si na každém dám záležet i několik hodin, hledám ještě lepší verzi a tak. Bohužel se zdá, že u dalle3 je ted problematické používat stejný seed (čím dál víc zlobí) a zavedli přísné limity i na daily usage. Takže se to stává vlastně nepoužitelné.

    Rok zpět jsem ale dělal seriozní inpainting a s jedním obrázkem si tak hrál snad týden... v takovém případě pak už mám pocit, že jsem obrázek vlastně vytvořil, že jen "zmáčkl tlačítko".

    No prostě díky, mám jich mnohem víc, ale nechci spamovat a pak je to taky mrzení když lidé obrázek odignorují no nevím jak to máte vy... prostě se chcete pochlubit a nic no X-)
    MICHIGAN
    MICHIGAN --- ---
    dvě podzminí - starej dobrej Dreamshaper :)



    #obrázek #původní
    KILLUA
    KILLUA --- ---
    Tak se tu taky něčím pochlubím snad se bude líbit, vytvořeno pomocí dalle3

    Screenshot by Lightshot
    https://prnt.sc/vYVMcRm2nprU
    Screenshot by Lightshot
    https://prnt.sc/z_WCeq7vcY9h

    #obrázek #původní
    KERRAY
    KERRAY --- ---
    https://twitter.com/ErikRobson/status/1715515831726252261

    Dedicated thread for Dall-E 3 screenshots of classic 3D modeling/animation apps that never existed.

    #obrázek #galerie
    THEODORT
    THEODORT --- ---
    Ad odstranovani textu:
    Na Stable diffusion asi nejlip funguji dva controlnety, prvni Reference a obrazek s texty, druhy controlnet inpainting..

    a nebo je tu tenhle projekt: https://github.com/iuliaturc/detextify
    DAVVID
    DAVVID --- ---
    DRAGON: myslim ze nejjednodussi vysledek bude v tom photoshopu :) odstranoval jsem takto text z obrazku na labelu vinylu. oznacit radek nebo vetsi blok textu podle toho co je na pozadi → generate.

    Me to trvalo tak 30 minut ale jen diky tomu ze tam byla hromada textu pres stylizovanou fotku a chtelo to hodne rucni prace a ruznych vyberu. Tvuj obrazek je prace na minutku. Ten Ai generate zvlada dobre i patterny...
    VDB
    VDB --- ---
    E2E4: taky nejsem guru, imho je to ale obecnej problem. Vec s tim rozvinutym promtem... no ono je to hezky, nicmene casto to vubec neodbovida obrazku. On proste presne nevi co generuje, navic kvuli nahodnosti v algoritmu je jezke vygenerovat tu vec stejne (coz je zakladni predpoklad pro upravu). Zaroven z tech obrazku vyrazne čiší na jakých datech (často asi velmi stereotypních) se trénovalo. Takže když napíšu ať mi udělá obrázek 70 let otce a 40 let syna jak jsou na rybách je to ok, jakmile ale synovi má přidělat copánek, automaticky tam prdne jak se drží za ruce jak milenci apod...:) Prostě na generování art věcí super, ale na "seriozní" fejky bída, což ale kdo ví jestli není záměr:D

    E2E4
    E2E4 --- ---
    VDB: super obrazek!

    co ted koukam, on to dela tak ze mirne meni prompt.

    E2E4
    E2E4 --- ---
    E2E4: taky je dobry ze narozdil od bingu to umi vylepsit vygenerovany obrazek. ("na prvnim obrazku zmen krabici at vypada vic jako pocitac")

    KAJJAK
    KAJJAK --- ---
    E2E4: me prave chat rekl ze nemuze pouzivat a neudelal obrazek
    Kliknutím sem můžete změnit nastavení reklam