• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, DALL·E 2, Stable Diffusion, OpenAI
    YMLADRIS
    YMLADRIS --- ---
    Tu je ghiblified trailer k Pánovi prstenů - 4 AI / 9 hodin

    Možná toto teď bude cesta. Jako že lidi s kamosema na louce budou točit něco, jako by kostru pro AI (kdo kam jde, co řekne, jak se tváří) a AI to bude stylovat - režisér si udělá verzí kolik bude chtít.

    Cinematic AI - Video, Luma, Runway, Haiper, Sora, Kling, Minimax | This Lord of the Rings trailer was recreated using AI… in just nine hours
    https://www.facebook.com/groups/846203050725189/permalink/1032250962120396/

    Jinak jsem cetla zajímavé srovnání chatgpt a mj. Chatgpt plní příkazy, mj je na prozkoumávání možného. Jenže už to nenajdu.
    BAT
    BAT --- ---
    DOUPLE: Me by pro zajimavost zajimalo, jak by to dopadlo, kdyby byl model natrenovany na obrazkach nakreslenych v tom stylu, ale jinym autorem, jenz by s uzitim pro trenovani AI (a dalsim, s tim souvisejicim pouzitim) souhlasil.

    Nic o tom nevim, ale divil bych se, kdyby byl "styl" nejak chraneny.
    Jakoze chapu, ze nemuzu nikde publikovat postavicku Mickey Mouse (mimo tech opravdu starych co jsou snad uz v PD), ale kdyz stejnym stylem nakreslim postavicku co jsem si ja vymyslel (Roger Rat), tak...
    no, asi by to dopadlo tak, ze by se Disney stejne soudil, a kdo na to ma, ze... ale teoreticky by to melo byt v poho ne?

    Pominme fakt, ze tvuj priklad s politickou stranou by byl asi vniman par lidmi negativne, ale v ramci autorskych zakonu a kyho certa? to by asi bylo cajk, ne?
    DOUPLE
    DOUPLE --- ---
    DOUPLE: :)
    Chatgpt: Styl studia Ghibli je natolik specifický a charakteristický, že když AI vygeneruje něco podobného, už to překračuje hranici mezi "inspirací" a "napodobováním". A pokud politická strana použije takový obrázek ve své kampani, může to být vnímáno jako zneužití estetického jazyka Ghibli k účelům, které s jejich tvorbou nemají nic společného.

    Tohle je přesně ten typ situace, kde se etika a autorské právo setkávají s limity AI generace. Technicky vzato by se Ghibli mohlo bránit, pokud by dokázali, že AI model byl natrénován na jejich dílech nebo že výstup je příliš blízký jejich stylu. A i kdyby právně nešlo o přímé porušení autorských práv, pořád je tu otázka etiky a respektu k umělcům.

    Osobně mi to taky nepřijde moc košer. Přijde mi to podobné, jako kdyby někdo vzal Miyazakiho film, přemaloval ho AI a pak ho použil v kampani, aniž by k tomu měl svolení. Je zajímavé, že si tohle dovolí například i politická strana – obvykle bývají dost opatrné, aby se vyhnuly právním problémům. Možná si neuvědomili, jak kontroverzní to může být.
    DOUPLE
    DOUPLE --- ---
    Btw nesledujete nekdo jak to ma Altman s pravama? Nasel jsem starsi ghibli dataset z flux.dev (v podobny kvalite), kde autor psal, ze vzhledem k objemu trenovacich dat doufa, ze nebude mit popotahovacky :)
    YMLADRIS
    YMLADRIS --- ---
    "transformuj fotku do ghibli style" .. v chatgpt. No ještě bych tomu tak rok dva dala ale dobrý :)

    NEEM
    NEEM --- ---
    KERRAY
    KERRAY --- ---
    THEFLON: tohle dnes myslím neuděláš - ale jestli máš instrumentální verzi, tak se dá nahrát do placené verze Suno i Udio - případně tam nahrát i ten originál, aby bylo od čeho se odpíchnout v intonaci, a pak si dloouuhým hraním prodlužovat tyhle kousky s vlastním textem, pak ty části s původním textem ořezat a pokračovat, nebo sbírat povedené vygenerované části a ručně z toho něco slepit, co se pak zase dá nahrát zpátky a pokračovat na tom... spousta práce a čekání, ale mohlo by z toho být něco zajímavého
    THEFLON
    THEFLON --- ---
    Ahoj. Jaké AI použít na tuhle operaci? Chtěl bych udělat cover jedné písničky. Zachovat hudbu, ale nahradit lyrics za jiné.

    Mám originál písničky se zpěvem (lyrics). A chtěl bych do instrumentální verze písničky (kterou mám) dostat mnou napsané lyrics, tak aby intonačně seděly na ten originál.
    LOOKASH_II
    LOOKASH_II --- ---
    Sice to neni obrazek, ale rekneme ze je to tvorba za pomoci umele inteligence :) Premejslim jak to nazvat "AI Chat Chronicles" (AI idea) nebo "Chatting with Silicon" (moje idea)

    The following is a conversation between Lookash_ii and GPT-4o:

    “Why Does Life Feel Like Pure Chaos? Blame Kali Yuga, They Said!”
    Mammouth AI
    https://mammouth.ai/shared/831686d8-c6af-4e39-a310-ee61019a26e2
    KERRAY
    KERRAY --- ---
    ad KERRAY - takhle, jak to teď je, už je to imho použitelné na poslouchatelnou audioknihu, včetně hereckého výkonu (!), akorát si v češtině vtipně šlape na jazyk s Ř (a to jen některé pokusy)

    KERRAY
    KERRAY --- ---
    nové #TTS text-to-speech modely od OpenAI jsou k dispozici přes jejich API a na vyzkoušení na stránce

    OpenAI.fm
    https://www.openai.fm/
    NEEM
    NEEM --- ---
    jeste to ladim, ale je to na spravne ceste :)

    KILLUA
    KILLUA --- ---
    THEODORT: Nezkoušel, protože obecně nemám "resoning" modly tak rád, protože mám rád rychlou odezvu. Používám max o3 když chci poradit s něčím těžkým. Ale QwQ má zajímavé nápady když brainstormuju něco mimo programování, připadá mi že je jednoduše unikátní.

    Deep seek sem zkoušel i plnej ale nezačal jsem ho používat nějak více.

    ICE: Jako je to spíš jednodušší model, ale snaží se no :)
    BAT
    BAT --- ---
    KILLUA: Zkusim jak bude fungovat ten 32B QwQ, dik za tip.

    Na GPU mam VRAM 12 GB a systemove RAM mam 64 GB.
    Takze cele se mi leccos do VRAM nevejde, ale par nejakych vetsich modelu (velikost ~30GB) jsem zkousel a sice to bylo znatelne pomalejsi, protoze co se nevlezlo do GPU nacpe do RAM, ale kdyz by to bylo dobry tak to mozna snesu.
    ICE
    ICE --- ---
    KILLUA: to zkusim uz kvuli tomu (project) 2501 v nazvu ;)
    THEODORT
    THEODORT --- ---
    KILLUA: zkousels 32b deepseek? ted celkem pouzivam protoze mi to bezi doma ve VRAM 4090...
    KILLUA
    KILLUA --- ---
    BAT: Za mě je lokálně dobře použitelnej 32B QwQ, je to reasoning model a v programování docela silnej. Ale co sem pochopil ty nemáš dost ramky na něj. Proto sem doporučil ten 14B deep seek, protože je to taky reasoning model a je to postavené na 14B Qwen modelu :)
    Vlastně jen naučili qwen model přemýšlet.

    Zkoušel sem ještě nejnovější 24B mistral small 2501 a narozdíl od své starší verze a nejspíš i codestralu je za mě o dost lepší.

    Ale to víš na Clauda to úplně nemá.
    KERRAY
    KERRAY --- ---
    hrál jsem si s Klingem a nechal ho rozanimovat pár obrazů Zdeňka Buriana
    @jadromir.bsky.social on Bluesky
    https://bsky.app/profile/jadromir.bsky.social/post/3lirg662wds2e
    @jadromir.bsky.social on Bluesky
    https://bsky.app/profile/jadromir.bsky.social/post/3lirg662kms2e
    @jadromir.bsky.social on Bluesky
    https://bsky.app/profile/jadromir.bsky.social/post/3liwdgrb3tk2g
    @jadromir.bsky.social on Bluesky
    https://bsky.app/profile/jadromir.bsky.social/post/3liwdgraxwk2g
    #původní
    BAT
    BAT --- ---
    KILLUA: hmm, takze jinymi slovy mi rikas, ze chyba bude asi na me strane. Asi to bude chtit vic prostourat.

    Deep seek jsem preskocil, protoze jsem z nejakych videi a clanku ziskal pocit, ze Qwen ma byt pry lepsi.
    Mozna to byla chyba? Ale jeste nad Qwenem nebudu lamat hul, protoze rozjet to v mem ponekud netradicnim prostredi nebylo uplne jednoduche - a v tom DS asi jiny nebude.

    Nejaky auditko tady, vic zamerene na tyhle veci, by tu nebylo? (hledal jsem, ale treba jsem si nejak nevsim).
    KILLUA
    KILLUA --- ---
    BAT: To co máš je docela top a ještě můžeš zkusit 14B Deep seek
    Kliknutím sem můžete změnit nastavení reklam