• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, Nanobanana, ComfyUI, Suno
    Vše ohledně umění tvořeného pomocí umělé inteligence - obrázky, 'fotky', galerie, hudba, video, text + články, novinky apod.

    NSFW obsah prosím obalit spoiler tagem - <div class="spoiler">obrázek</spoiler>, a nemá to tu být klub na roštěnky a nahotinky bez nějaké přidané hodnoty

    Příbuzné diskuze:
    - [DALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]]
    - [I Hope This Does Not Exist ​ ​ ​ ▌​ ​ Vedlejší efekty v AI visuálech]
    - AI obecně [Artificial Intelligence AI]
    - Vtipy [Umělá inteligence, chatboti - vtipné konverzace aneb "Hoří hovno?"]
    - [generativní modely] Jak konstruovat prompty, kde získat váhy i jak to vše interpretovat


    Prosím zkusme pro vkládanou tvorbu používat tagy
    #galerie (2-3 obrázky na ukázku, další po rozkliku) #obrázek #video #hudba #text #hry #původní (pro vlastní tvorbu) #roštěnky

    #článek #nástroj

    (návrhy na další tagy apod. vítány)

    Texty, programování: https://beta.openai.com/playground | https://chat.openai.com/
    Obrázky online: https://www.midjourney.com/ | https://beta.dreamstudio.ai/
    Lokálně: Webui-Forge https://github.com/lllyasviel/stable-diffusion-webui-forge | ComfyUI https://github.com/comfyanonymous/ComfyUI | Civitai repository custom modelů pro SD
    AI na vytvoření textového zadání z existujícího obrázku: https://huggingface.co/spaces/pharma/CLIP-Interrogator
    rozbalit záhlaví
    MINER
    MINER --- ---
    ICE: update: MINER:
    Banán v Google AI Studio generuje megarozlišení (klidně 6000×3000) a díky nastavitelné temperature a system promptu jde držet víc pod krkem.
    Dělá vlastní upscale z 4Mpx, ale je to použitelný.
    (placený)

    A v Gemini PRO subscription je v ceně asi 100 obrázků denně v 4Mpx.

    Takže na čistý iterace (hledání stylu a příslušného promptu) lze generovat fragmenty z obrázku v Gemini PRO. Po doladění udělat velkej v AI Studio a pak to sesadit v Photoshopu celkem za pakatel v pár krocích.

    Pro fázi ladění mi to nejjednodušší setup jak rychle začít, vyladit styl a dostat se celkem daleko.
    Beru banán na milost.
    Do Comfy se přesunu asi až na plnou kvalitu.
    ICE
    ICE --- ---
    MINER: jj existuji flux2 nebo ultra flux(4K), nicemene defaultni vystupy maji na urovni prvniho sdxl (meky roztekly visual). IMO s nadeji koukam na z-image, protoze ve spojeni s text enkoderem qwen3 dava supr vysledky - drzi promt jako zadny jiny model (+text lepe nez flux). Bouzel rozliseni je klasicke a vysledny obraz je potreba prohnat pres "hi-res optimalizery" ;).
    MINER
    MINER --- ---
    ICE: Díky i za ty hinty na upscaling modely.

    Jinak Flux umí 2048×2048 a Seedream 4Mpx s 4k na delší straně, což už je hratelný.

    Zatím si hraju s workflow: downscale do těch limitů › retexturing celého objektu › upscale › náhrada nepřirozeností buď regenerací nebo nahrazením hrany ze zdrojového obrázku. Dogenerování nových prvků do 4Mpx.


    Ještě zjišťuji, jestli nejsou nějaké retexturing modely pro filmaře, který to imo potřebují furt. Většinou z velikosti toho objektu je jen retexturing. Pro dogenerování nových detailů, se v klidu vejdu do 4Mpx.

    Zatim teda ladim jen tu estetiku v downscale, ale postup výše vypadá hratelně, až s tim budu spokojen.
    KERRAY
    KERRAY --- ---
    KERRAY
    KERRAY --- ---
    #komiks
    Reddit - The heart of the internet
    https://www.reddit.com/r/OpenAI/s/swFYtB5bLf
    ACIDOFIL
    ACIDOFIL --- ---
    RUDOLF: Resil jsem take assety pro hru(jen jednoduchou v three.js). Po Meshy.ai jsem skoncil u postupu, kdy generuju 2d obrazky v Gemini a nasledne z toho 3d modely pomoci Trellis. Super ma byt cinske Hunyuan, ale nepodarilo se mi pouzit.

    Mozna by se ti hodilo tohle video https://www.youtube.com/watch?v=HcJEYB7aQQo
    RUDOLF
    RUDOLF --- ---
    Hele, chtěl by si pohrát a generování assetů pro hru. Co to dnes umí a jestli jsem z toho schopen vygenerovat stovky assetů v jednotném vizuálním stylu.

    Zajímají mě: ikony, 2d tiles a assety (lidské a přírodní objekty) top-down a izometricke, low-poly 3rd objekty.

    Super by bylo rozanimovaní assetů.

    Velké rozlišení nepotřebuji.

    Rozjel jsem loni stable diffusion. Mám 12 GB nvram (RTX 4070 ti). Ale nebyl jsem s tím úplně happy. Klidně rozjedu něco jiného. Ale hotový placený tool nebo cloud služba se subscription je v pohodě.

    Jde mi o vyspělost nástroje nebo aspoň modelu.
    ICE
    ICE --- ---
    MINER: problem je velky pracovni rozliseni protoze generativni modely jsou omezeny na +- 1024x1024. Vetsi obrazky se pak generuji img2img upscalingem -bud specialnim upscalerem (remacri, sia, ultrasharp atd.) ktery umi vetsi vystup. tahle metoda ti ale neprida nic kontextoveho, pracuje jen s daty v puvodnim obrazku a snazi se najit hrany a patricne je zjemnit. Druha metoda generuje nove detaily v kontextu - a to je klasicky generativni model se znamym omezenim velikosti. Takze musis obrazek rezat na dlazdice (1024x1024) a urzet model v patricnych mezich aby ti kazdou dlazdici nedelal tak trochu jinak. ;)
    Tudiz tve workflow bude muset obsahovat metody jako: zamaskovat objekt s prechodem do okoli, zmensit na generativni velikost, generovat inpaint metodou, upscalovat (tiling), placnout do hires obrazku. Muze existovat i lepsi postup, zkus pohledat comfyu fora. Tohle se vyvyji strasne rychle.
    PRAASHEK
    PRAASHEK --- ---
    HIJACKER: díky, to jsou docela podstatné informace.
    HIJACKER
    HIJACKER --- ---
    PRAASHEK: Zalezi co od toho ocekavas. Playground asi vetsina lidi pouziva na vytvareni emoji, nema to tolik moznosti a vysledky jsou hodne omezeny. Darwing Things je uz vic profi, ale tablet ma na to malo ram... na iPadu M4 s 8gb ram to docela casto pada.
    PRAASHEK
    PRAASHEK --- ---
    DOPA: tak s tím se dá žít, pokud není nějaký opruz s tím nastavit si to u nás, dělal jsem to vždycky rovnou cz.

    No a zkušenosti s tím AI-gen? :)
    DOPA
    DOPA --- ---
    PRAASHEK: Tablet musi byt v AJ
    PRAASHEK
    PRAASHEK --- ---
    DOPA: můžeš, prosím, rozvést tu pasáž v závorce? :) //toto —> (dostupnost závisí na regionálním nastavení Apple Intelligence)
    DOPA
    DOPA --- ---
    PRAASHEK: Image Playground (součást Apple Intelligence): Nativní řešení od Applu pro rok 2025, které využívá čipy A17+ a M1+ k tvorbě stylizovaných obrázků přímo v systému (dostupnost závisí na regionálním nastavení Apple Intelligence).
    PRAASHEK
    PRAASHEK --- ---
    používáte někdo iPhone nebo iPad (A17+/M1+) s nějakou appkou na tvorbu či editaci obrázků? Míněno appky, které využívají chip přístroje, ne online service :)

    jde mi o to, jestli jsou přímo v OS použitelné nějaké nástroje na tvorbu a třeba "inpaint" a jak to funguje a tak, free aplikace, placené aplikace. Jestli má cenu si něco takového pořizovat (musím si koupit nový phone a taky budu teď mít využití pro tablet, takže v brzké době budu kupovat tyhle věci z druhé ruky, tak jestli má cenu jít do apple i třeba kvůli tomuhle a jestli má cenu brát ty novější stroje jenom kvůli tomu
    SKAFF
    SKAFF --- ---
    LOJZA: to mi PS nedělalá, že by zmenšil canvas. Ale případně se dá prohnat/upscale přes topaz https://www.topazlabs.com/

    Ale tady ani jeden z obědů není zadarmo
    KAJJAK
    KAJJAK --- ---
    zkuste mozna photoroom, zena to pouziva na produktova fota a puvodni objekt to umi zachovat i s textemv celkem velkem rozliseni
    DOUPLE
    DOUPLE --- ---
    MINER: sel bych pres Qwen-edit inpaint, s tim ze bych si radsi nechal prompt napsat AIckem
    YouTube-Video-Archive/2025/Qwen Image Inpainting at main-branch · SharCodin/YouTube-Video-Archive · GitHub
    https://github.com/SharCodin/YouTube-Video-Archive/tree/main-branch/2025/Qwen%20Image%20Inpainting
    ale imho 5000px je podle me docela dealbreaker (zmensil bych a pak uspcaloval, pokud ti nevadi nejaka ztrata kvality)
    LOJZA
    LOJZA --- ---
    MINER: Lehce off-topic, ale řešil jsem teď podobnou situaci: portrétová fotka od profi fotografa cca 5000 x 5000 px, kde potřebuju dogenerovat okraje po pravé a levé straně (kusy lehce rozmlženého pozadí - les, tráva...), abych mohl tisknout v potřebném poměru stran na velké plátno. Online "unclipperů" a "extenderů" je hromada, ale 99 % z nich má za sebou evidentně napojené nějaké API na standardního "velkého" provozovatele nějakého generativního modelu. Ve výsledku fotku "extendují", ale redukují rozměry na cca 1000 x 1000 px (např. Kling), v lepším případě 2000 x 2000 px (např. https://airbrush.com/). Překvapilo mě, že to takto redukuje právě i ten Kling, který se očividně snaží pozicovat jako jeden z leaderů (alespoň co se videa týče). Ztráta kvality samozřejmě nepřijatelná. Našel jsem jediný nástroj, který rozměr umí zachovat - https://www.pixelcut.ai/. Model, který za tím je, ale není zase až tak super, takže dogenerované pozadí vypadá dost "namalovaně". Takže zatím meh výsledky...
    MINER
    MINER --- ---
    KERRAY: Potřebuju právě lepší kvalitu. A to i zpracování, nejen rozlišení.

    Používám modely v Photoshopu: tam je Banán i Flux a jde to aplikovat jen na selekci, což hodně usnadňuje editace objekt po objektu, ladění a undo.

    Jenže tak kvalita neni ono.

    Bánán Pro se snaží, ale mění charakter víc, než bych potřeboval, a to třeba i trochu rozměr, tvar a okolí objektu tak, že jsou tam vidět deformace. A dělá tam i to, co nechci.

    Flux je realističtější, ale nezvládá texty. A v Adobe můžu použít jen Pro model, asi dokud neupgradnu na vyšší tarif.

    Přišlo by mi dobrý moci si vybrat model.
    Nutnost je pracovat jen se selekcí, ale chtělo by to mít v editoru s undo a ideálně i vrstvama, ne to furt pastovat a vyřezávat, protože to ty modely nezvládnou na jednu iteraci.
    Možnost plácnout na objekt jinej obrázek by se hodila.

    Jako pomalu se posunuju dál a kvalita se zlepšuje, ale trvá to a určitě to zatim nepoiužívám optimálně.
    Kliknutím sem můžete změnit nastavení reklam