• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, DALL·E 2, Stable Diffusion, OpenAI
    Vše ohledně umění tvořeného pomocí umělé inteligence - obrázky, 'fotky', galerie, hudba, video, text + články, novinky apod.

    NSFW obsah prosím obalit spoiler tagem - <div class="spoiler">obrázek</spoiler>, a nemá to tu být klub na roštěnky a nahotinky bez nějaké přidané hodnoty

    Příbuzné diskuze:
    - [DALL·E mini i Craiyon - having sex with AI since [date format unknown]]
    - [I Hope This Does Not Exist ​ ​ ​ ▌​ ​ Vedlejší efekty v AI visuálech]
    - AI obecně [Artificial Intelligence AI]
    - Vtipy [Umělá inteligence, chatboti - vtipné konverzace aneb "Hoří hovno?"]
    - [generativní modely] Jak konstruovat prompty, kde získat váhy i jak to vše interpretovat


    Prosím zkusme pro vkládanou tvorbu používat tagy
    #galerie (2-3 obrázky na ukázku, další po rozkliku) #obrázek #video #hudba #text #hry #původní (pro vlastní tvorbu) #roštěnky

    #článek #nástroj

    (návrhy na další tagy apod. vítány)

    Texty, programování: https://beta.openai.com/playground | https://chat.openai.com/
    Obrázky online: https://www.midjourney.com/ | https://beta.dreamstudio.ai/
    Lokálně: https://github.com/AUTOMATIC1111/stable-diffusion-webui | https://github.com/invoke-ai/InvokeAI | Civitai repository custom modelů pro SD
    AI na vytvoření textového zadání z existujícího obrázku: https://huggingface.co/spaces/pharma/CLIP-Interrogator
    rozbalit záhlaví
    LOOKASH_II
    LOOKASH_II --- ---
    S tema uhlama si mi pripomel, zkouseli jsme udelat obrazek ulovenyho zraloka jak visi za ocas hlavou dolu. Necekana mission impossible v DALL-E ani Fluxu se to nepovedlo.
    KOMPAS
    KOMPAS --- ---
    ELEYNE: Nevím, čemu říkáš "dát obrázek jako referenci", ale mám určité omezené úspěchy s použitím gen_id. Nicméně dodržet přesný styl je pro DALL-E zjevně těžké. Z mé zkušenosti zvládá plusminus podobný styl, ale už ne ty nuance, které zmiňuješ. Na to býval mnohem lepší Midjourney.
    ELEYNE
    ELEYNE --- ---
    Jak přesvětčit gpt chat aby generoval obrázky, které budou vypadat jako by je maloval stejný autor? Ať se snažím jak se snažím vždy je tam jiná míra detailu, dinamika pózy a podobně. Dát předchozí obrázek jako referenci nepomáhá
    KERRAY
    KERRAY --- ---
    KERRAY
    KERRAY --- ---
    #obrázek #nástroj
    stabilityai/stable-diffusion-3.5-large · Hugging Face
    https://huggingface.co/stabilityai/stable-diffusion-3.5-large
    DOUPLE
    DOUPLE --- ---
    #původní #obrázek
    Zabere to docela stelovani, ale za me uz dost pouzitelnej img2img s flux.dev z pohledu nejakyho celkovyho vyzneni sceny
    Lora vytrenovana na moji zene (ze 20 fotek, ve stejnym svetle, na stativu), idealni mit v puvodni scene mekky svetlo a malo kontrastu

    JINX
    JINX --- ---
    Potřeboval bych vzít hromadu schémat/diagramů a převést je na jednotný styl. Ideální by bylo vzít obrázek nahrát ho do ChatGPT a dostat výsledný soubor pro Canva - máte nekdo tip jak nečeho takového docílit ?
    DOUPLE
    DOUPLE --- ---
    #původní #obrázek
    gguf flux.dev, dobre orezana verze pro mensi VRAM, na 3060 12GB jede cca 3.8s/it, to uz je celkem pouzitelny :) (guidance 2.2, 25 steps)

    mirek190/Flux1_dev_GGUF · Hugging Face
    https://huggingface.co/mirek190/Flux1_dev_GGUF

    ICE
    ICE --- ---
    #původní #obrázek #roštěnky
    cisty Flux dev1 (16bit), clip t5xxl_fp16 + Flux hiresfix, generovano na 7800xt, cpu to trochu;) brzdi (ryzen 2700x ), rocm, ubuntu, euler 50 iteraci - 3:30 min, hiresfix 20 iteraci - 2:10 min )
    zakladni popis sceny expandovany do detailu pomoci chatgpt.
    workflow -> https://civitai.com/models/618578?modelVersionId=692442

    KILLUA
    KILLUA --- ---
    HOWKING: Děkuji za zpětnou vazbu. Je to opravdu smutné DALLE 3 byla poslední věc kvůli které jsem u OAI zůstával a těšil jsem se že teď jak budu mít pár dní volna si udělám zase umělecké povyražení a vylepšim staré už tak dobré prompty.

    Většinou generuji kreslené věci, krajinky ve fantasy stylu. Dříve byly nádherné detailní, teď detaily sice jsou ale hodně ochuzené jakoby se obrázek generoval ve stable diffusion na menší počet kroků...
    BLIND_CAT
    BLIND_CAT --- ---
    KERRAY: Misty z toho leze fakt dobrej jezzik. Dobra energie. Vsadim se ze ty triadvacetiny na kazoo takhle jeste nikdy nikdo nehral ;D

    Ta prvni trumpeta je fakt dobra. 1:46 tam ale zacina kontra trumpeta, ktera mi uz pak prijde hodne mimo. Zpev v podstate na AI super, zvukove na muj vkus trochu suchej, ale sedi to k tomu celkove a vytvatri to pocit ziveho vystoupeni. Trochu to doladit a z radia v hospode bych urcite ani nepoznal ze je to AI.

    Mame novyho zpevaka v kapele, protoze chce hrat s nama progres a ne jen papouskovat karaoke, jak rika. Tak jestli si s timhle zacnu hrat a davat mu takovyhle 'predzpivany dema' tak se vsadim, ze moc nadseny nebude, protoze to bude pro nej bude zas jak to karaoke. ;D
    (Ale urcite se na to mrknu pro svoji tvorbu)

    Muzu se zeptat, jak moc jsi to vlastne editoval? obrazek u toho nevydim. dik
    KERRAY
    KERRAY --- ---
    #původní #hudba
    písnička "Ovádí zeď" - text je můj, hudbu jsem přeskládal a poladil, leč hraje a zpívá AI (Udio), obrázek je taky AI (Midjourney)
    https://kerray.cz/files/kerray_-_ovadi_zed.mp3
    E2E4
    E2E4 --- ---
    GALADAR: no. na několika úrovních - první je tvůj prompt, druhý co z něj udělá jako zadáním pro dall-e, třetí co nakresli (možná).

    každopádně lze zkoušet klasický jailbreak triky na obejití restrikcinebo jinou implementaci modelu, např chatgpt dalle mi odmítal udělat obrázek jak žena bleje do kabelky, ale Microsoft/bing to bez keců nakreslil.

    jo a u toho Microsoftu existuje ještě jedna možnost, nejen ten bing chat / dnes copilot, ale jít přímo na bing.com/create a tam zadat prompt spíš klíčová slova přímo.
    HONZA09
    HONZA09 --- ---
    Tak jsem našel omezení. nejsem za boha schopnej v Dall E vygenerovat obrázek boha dávajícího si lajnu. Ten generativní model záměrně igonruje přesný instrukce, že ten bůh má mít to brčko v nose.

    A depiction of a god inhaling the Milky Way through a straw into their nose, as if snorting a line of angel dust. The scene is high contrast, resembling the style of a tapestry. The god, adorned in majestic and detailed attire, is shown inhaling the glittering Milky Way through the straw, with cosmic elements swirling around them. The background features a vast, star-studded galaxy with vivid colors and intricate patterns, enhancing the grandeur of the universe. The format is wide to capture the expansiveness of the scene.





    GEKONZPRAHY
    GEKONZPRAHY --- ---
    Ahoj, mám na vás prosbu. Hrál jsem si s Midjourney, je to docela sranda, ale jak pořádně nevim jak s těma promptama, nedaří se mi vytvořit jistej obrázek. Měla by to bejt kapybara, ideálně podobná té na fotce. Tedy pouze silueta, akorát s tím rozdílem, že chci, aby kapybara dělala nataženým prstem u tlamy mezinárodně známé gesto "psssst". Chci si to vygravírovat na tlumič :)

    Můžete mi prosím někdo poradit jaké prompty zadat, nebo ideálně zkusit vytvořit? Dopředu mockrát děkuju :)

    MATT
    MATT --- ---
    takovou zhuleneckou logikou jsem si vymyslel, jak by mohli generatory obrazku fungovat, tak by me zajimalo, jak moc je ta idea mimo.. ;)

    Inspirovalo me video od Moulda o rezonancnich frekvencich, kdy foukne do lahve bilej sum a lahev se rozezni rezonancni frekvenci. K tomu jsem si vzpomel, ze nejaka komprese obrazku funguje na principu Furrierovyho rozkladu a ze obrazky se generujou z pocatecniho sumu. Princip by byl v tom, ze bych mel obrazky veci, ty bych komprimoval Furrierovym rozkladem a vysledny "frekvence" priradil ke slovum, ktery odpovidaj veci na obrazku. Nasledna geneze obrazku by vyuzila sum a znamy "rezonancni" frekvence prislusnejch slov a ze sumu by vygenerovala pozadovany obrazek. Okolo by byl nakej balast transformace prostoru slov na vektory, frekvence na vektory a tak..
    VOZKA
    VOZKA --- ---
    Zjistil jsem docela zajímavou věc. Na internetech (převážně socky/blogy, ale sem tam i serióznější články) se s jistou pravidelností řešívá bias generativních modelů, zejména v kontextu etnicity, genderu a tak. U novějších modelů se biasy prý trochu zlepšují - například když si necháte vygenerovat asiatku, je prý menší šance, že bude pokaždé poodhalená a vyzývavá. Články jsou obvykle trochu hysterické, tak místo toho zabrušme do nekontroverzních a možná zajímavějších neb méně prozkoumaných témat:

    Zdá se, že nikdo moc nesleduje, jaké vznikají u nových verzí nové nekontroverzní ale klidně i silnější biasy, které u ranějších verzí, co používaly méně sofistikované metody trénování a méně filtrované datasety, neexistovaly.

    Tak například: pomocí Stable Diffusion SDXL se zdá být zcela nemožné vytvořit fotku velkoměsta, která neobsahuje žádná auta. Pro starou verzi 1.5 to není žádný problém, na první dobrou dostanete několik (méně fotorealistických) variant New York City bez jediného auta. Ale v SDXL se mi to nepodařilo ani jednou, dokonce se mi ani moc nedařilo snížit jejich počet. Zkoušel jsem Prahu, která není tak známá vysokým provozem ale spíše starými uličkami, které se fotografové často snaží fotit spíše bez aut, a podařilo se mi udělat obrázek staré ulice s málo auty, ale úplně bez aut taky ne.

    Takže podobně jako si AI představuje generickou asiatku jako sexy odhalenou kočenu a doktora jako bílého muže středního věku, tak si představuje NYC jako plné aut? To je v pořádku protože to je v souladu s realitou, ne? No, ne tak docela, protože sexy asiatky a bílé doktory lze pomocí přesněji definovaného promptu ve většině případů přerazit, ale tohle se zdá být úplně neprůstřelné.

    Dall-E 3 na to trpí taky. Trochu pomáhá fakt, že mu při prvním pokusu (který je plný aut) řeknete "ne, to je špatně, jsou tu auta, chci to pičo bez aut!", a on pak vytvoří další obrázek, kde je aut méně (ale jsou tam). Ale zase čím větší dáváte fokus na absenci aut, tím míň je to pak celé realistické a tím míň to vypadá jako NYC.

    Midjourney nemám a nemohu otestovat, klidně to někdo zkuste, docela by mě zajímalo jestli na tom jsou líp.

    A stejně tak mě zajímá, jestli jste narazili na nějaká jiná nečekaná omezení.
    HITOMI
    HITOMI --- ---
    MJ 6 je fajn :) ale češtin teda bohužel nezvládá :(

    #galerie #obrázek #midjourney #původní

    Kliknutím sem můžete změnit nastavení reklam