• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, Nanobanana, ComfyUI, Suno
    Vše ohledně umění tvořeného pomocí umělé inteligence - obrázky, 'fotky', galerie, hudba, video, text + články, novinky apod.

    NSFW obsah prosím obalit spoiler tagem - <div class="spoiler">obrázek</spoiler>, a nemá to tu být klub na roštěnky a nahotinky bez nějaké přidané hodnoty

    Příbuzné diskuze:
    - [DALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]]
    - [I Hope This Does Not Exist ​ ​ ​ ▌​ ​ Vedlejší efekty v AI visuálech]
    - AI obecně [Artificial Intelligence AI]
    - Vtipy [Umělá inteligence, chatboti - vtipné konverzace aneb "Hoří hovno?"]
    - [generativní modely] Jak konstruovat prompty, kde získat váhy i jak to vše interpretovat


    Prosím zkusme pro vkládanou tvorbu používat tagy
    #galerie (2-3 obrázky na ukázku, další po rozkliku) #obrázek #video #hudba #text #hry #původní (pro vlastní tvorbu) #roštěnky

    #článek #nástroj

    (návrhy na další tagy apod. vítány)

    Texty, programování: https://beta.openai.com/playground | https://chat.openai.com/
    Obrázky online: https://www.midjourney.com/ | https://beta.dreamstudio.ai/
    Lokálně: Webui-Forge https://github.com/lllyasviel/stable-diffusion-webui-forge | ComfyUI https://github.com/comfyanonymous/ComfyUI | Civitai repository custom modelů pro SD
    AI na vytvoření textového zadání z existujícího obrázku: https://huggingface.co/spaces/pharma/CLIP-Interrogator
    rozbalit záhlaví
    ICE
    ICE --- ---
    #obrázek #původní
    Comfyu, z-image-turbo (3 + 3 + 9 steps latent upscale) + finalni SeedVR2.5 video upscale, lokalne na Radeon 7800XT, (linux rocm 7.2)
    imo z-image drzi prompt jako zadny jiny model.
    (3072x4096)

    Close-up cinematic shot of a fierce blonde Viking shieldmaiden in a snow-covered ancient Nordic forest during a winter storm, her long golden hair braided with fur ties blowing in the wind, intense blue eyes focused ahead with heroic determination as she draws a wooden longbow taut with a feathered arrow nocked and ready to release, wearing thick layered fur pelts and leather armor adorned with glowing ancient runes for warmth against the cold, her loyal large Siberian Husky standing beside her with aggressive stance bared teeth and alert ears watching the prey intently, deep snowy ground with fresh powder and frost-covered trees in the background, subtle aurora borealis lights shimmering in the twilight sky adding mythic glow, dramatic volumetric lighting with snowflakes falling and mist rising from the ground, photorealistic ultra detailed textures on fur skin bow and dog fur, high resolution epic fantasy atmosphere
    VOZKA
    VOZKA --- ---
    DRAGON: Nedá se z toho udělat výřez? Větší rozlišení určitě nějak jde, ale možná na to bude potřeba nějaký spešl workflow, zatímco s tím defaultním by to mělo jít triviálně - NanoBanana Pro v Google Gemini používá 1024x1024. Zkus z toho udělat 1024x1024 ořez ve kterém se nachází ta samolepka, ten mrdni do Gemini, vyber Pro model (pár obrázků denně máš i zadarmo) a řekni mu ať odstraní žluto-červenou samolepku a domyslí co bylo pod ní, ale všechno ostatní nechá na pokoji a nijak do toho nezasahuje. Typicky tě poslechne a zbytek fakt nechá být, takže pak ten výřez můžeš v grafickém editoru vložit zpátky do celého obrázku bez úprav. S fotkami mi to takhle fungovalo dobře.

    A pokud by to udělal blbě, tak doporučuju otevřít novou konverzaci a zkusit to znova, třeba poupravit prompt. Když se ho v jedné konverzaci zkoušíš dotlačit k tomu aby udělal líp něco co zvoral, tak často neposlouchá a je to značně frustrující.
    MINER
    MINER --- ---
    BUBBLE: Tak si to zkus:) Mně to trvalo 5 vteřin copy pastu.
    ‚Trend‘, je, že lidi předstíraj, že tomu dali neutrální prompt, aby nachytali lajky za to, jak je bombastický, jak je zlá, že tam dovalí Putina a Una. A přitom to napromptujou přesně na to. Attention-whores.

    Nešiřte ten AI slop…
    DOUPLE
    DOUPLE --- ---
    Včera/předevčírem vyšel nový Flux2.Klein-edit, pro kombinaci dvou inputů zatím vypadá, že o parník předjel Qwen-edit
    A příští týden má podle všeho vyjít Z-image base

    prompt: for image 1, use the lighting from image 2. Do not change anything else, maintain the face of image 1. Maintain the eyes of image 1. No freckles, smooth skin

    TOM
    TOM --- ---
    CYBERWOLF: zkoušel bych prompt "convert attached image into flat vector"
    Zrovna nedávno jsem zkoušel chatgpt - umí to, akorát si ten výstup hodně "vylepší". Generuje samozřejmě png, ale ve tvaru, který je snadno převoditelný pro Inkscape (oproti fotce).
    Specializovaný tool IMHO stále neexistuje :/ (čekám na něj roky, klidně bych ho i platil ;))
    DOUPLE
    DOUPLE --- ---
    MINER: sel bych pres Qwen-edit inpaint, s tim ze bych si radsi nechal prompt napsat AIckem
    YouTube-Video-Archive/2025/Qwen Image Inpainting at main-branch · SharCodin/YouTube-Video-Archive · GitHub
    https://github.com/SharCodin/YouTube-Video-Archive/tree/main-branch/2025/Qwen%20Image%20Inpainting
    ale imho 5000px je podle me docela dealbreaker (zmensil bych a pak uspcaloval, pokud ti nevadi nejaka ztrata kvality)
    DRAGON
    DRAGON --- ---
    KERRAY: musim priznat, ze absolutne nechapu, jak jsi mu dokazal rict, at ty navstevniky zachova a pouze zmeni styl, protoze ja se o to teda pokusil taky (prompt: Try to create a better orchestration from this piece that i uploaded (track1.mp3), with more emphasis on live instruments. Keep the melodies and instrument types the same, but make it more pompous, as if I were sitting in a concert hall.) a z tohoto (zdroj) mi dodal nejaky ctyri naprosto netotozny hruzy tohoto typu (vysledek), jak jsi to udelal? :) Je na to nejaky figl, jak opravdu zachovat puvodni melodii a cca nastroje a dodat tomu jen treba dynamiku? podle me si precetl muj prompt a naprosto ignoroval ten muj upload..

    KERRAY
    KERRAY --- ---
    DRAGON: máš tam českej prompt bez diakritiky a v něm je napsáno "teto", tak mu to prostě dej anglicky :)
    DRAGON
    DRAGON --- ---
    Prosim, byl byste nekdo schopny mi poradit se Suno? Nahral jsem tam mp3 (z midu stary hry z 1993), ktera nema zadny id3 tag a jmenuje se track1.mp3 ale hlasi mi to toto. Jak to prosim nastavim? Co delam blbe? Dam vlevo pouze Upload, a pak ji zadam prompt, at zkusi vetsi orchestraci jak v koncertnim sale s ponechanim melodie a typu nastroju, stejne mi to ale nepusti dal :(
    Tusite nekdo? Vubec netusim co znamena to "teto".
    dik za pripadnou radu

    KILLUA
    KILLUA --- ---
    KERRAY: To máš, ale podobné s difusníma obrázkovejma modelama. Často jedu v nějaké zajeté koleji (a ostatní na internetu taky) a pak zadáš úplně jiný prompt a model udělá naprosto jiný styl a říkáš si najednou jak moc všestraný vlastně je. Ostatní to třeba tak nemaj já se teda občas divím :)
    KERRAY
    KERRAY --- ---
    #video veo3
    The Prompt Theory: 4 Minutes Straight of Google Veo Prompts
    https://youtu.be/BLfV4sidcJM?si=5v1SgAbxpppmDOA-
    CABOWITZ
    CABOWITZ --- ---
    KERRAY: novy zanr prompt horror? :)
    KILLUA
    KILLUA --- ---
    PRAASHEK: Nový obrázkový model GPT. Prompt ti moc nepomůže tohle sem "modeloval" na základě asi 20 iterací. Musel sem si uvědomit věci jako osvětlení ze shora, ambientní tmu a pomalu měnit a vylepšovat iterováním a zkoušením.
    Mám hlavně radost, že to opravdu vypadá jako "Avatar" nějakého démona v jeho chrámu a snad to jako opravdu nahání trochu strach když si představíš že tam stojíš a ono to začne mluvit...

    Začal sem s tímhle.
    In a shadowy cavern, demonic face looms. The jagged rock walls surrounding it echo the statue's malevolent presence, while two mysterious doorways stand as silent sentinels to either side, and a weathered stone pedestal rests nearby, bathed in the ambient light.
    CABOWITZ
    CABOWITZ --- ---
    tak jsem si teda po delsi dobre rekl, ze lehce prilozim prst k tepu trendu a nainstaloval jsem lokalne comfyUI a hraju si prozkoumavam ruzne lora modely. ne ze bych z toho byl uplne paf, ale vysledkama jsem docela mile prekvapen... tohle konkretne flux_dev + woodcut oldschool lora


    prompt: countryside with fields, crippled hard working man working with scythe, there is skull on sky instead of sun, in style of black and white artistic raw and simple woodcut, thick lines, no details, only black and white, no gray and gradients

    PRAASHEK
    PRAASHEK --- ---
    KILLUA: prompt a prostředek?
    URZA
    URZA --- ---
    KERRAY: zkusil jsem tvůj obrázek předhodit MJ "describe" a nechat ho to namalovat podle toho jak to popsal.. dopadlo to úplně jinak :) ale když jsem tvůj obrázek dal popsat Geminy 2.5 flash s tím ať mi vytvoří prompt pro MJ, tak výdledek o dost podobnější :)

    STRATILSOMSA
    STRATILSOMSA --- ---
    HONZA09: co toje za pekelny prompt? :) flux to dal takto

    DOUPLE
    DOUPLE --- ---
    ICE: jj nebo light leak filtry

    stejnej prompt + koda ( https://civitai.com/models/653093/Koda%20Diffusion%20(Flux) )

    NEMRTVY
    NEMRTVY --- ---
    NEMRTVY
    NEMRTVY --- ---
    Kliknutím sem můžete změnit nastavení reklam