• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, DALL·E 2, Stable Diffusion, OpenAI
    KERRAY
    KERRAY --- ---
    #galerie na některé lidi by to mohlo fungovat jako pěkný trigger, všichni jako černoši :)
    Reddit - Dive into anything
    https://www.reddit.com/r/midjourney/comments/12zx0h5/the_world_of_harry_potter_but_every_character_is/
    DAVE2
    DAVE2 --- ---
    SLL_QUY: Jo to jsem videl. Ale to jenom sklada z knihovnich prvku a na nahodne rozmisteni stromu na teren clovek fakt nepotrebuje AI
    SLL_QUY
    SLL_QUY --- ---
    ARAON
    ARAON --- ---
    DAVE2: Tak stromy jsou celkem jednoduché. Různých L-systémů co fraktálově generují stromy je víc. Už do ArmA2 se generovaly. Ale pořád je tu problém s objemem dat. I kdyby nakrásně šlo vygenerovat všechno, nebude to kam dát. Předdefinovaný set objektů by to vyřešil.
    DAVE2
    DAVE2 --- ---
    DAVE2: No a ve spojení s pokročilým 3D tiskem se z toho samozřejmě stane generátor fyzyckých objektů na přání...
    DAVE2
    DAVE2 --- ---
    ARAON: Takové nástroje jsou tu už dlouho, například v podobě generovaných stromů, popínavek apod. Ale je to podobné jako stará GOFAI - člověk tomu musí vysvětlit co je kmen co podružné větve a že na tom mají být listy. Spousta lidské práce s omezeným využitím (z generátoru stromů padají jenom různé typy stromů). Představují si difuzní 3D model, který začne shlukem nějakých polygonů a postupně se odbourá šum natolik, že z toho vznikne ten strom. Nebo třípodlažní budova z roku 1905 nebo cokoliv si člověk vymyslí.
    DAVE2
    DAVE2 --- ---
    ARAON: Pak je to z pohledu autorského práva podle mě v pohodě. I když já osobně jsem pro zrušení jakékoliv autorské a patentové ochrany.
    ARAON
    ARAON --- ---
    DAVE2: Já si jako herní vývojář umím představit, jak AI snadno generuje celé krajiny, funkční města a podobné věci, pokud bude mít k dispozici databází předvyrobených elementů (stromy, kameny, zdi, dveře, okna). Dovedu si představit, že se designér vyblbne detailně s nějakým kusem, kde se bude odehrávat příběhová scéna a okolí nechá dodělat AI. Nebo že někam dá kostku s tagem “třipatrivá cihlová budova z roku 1905” a AI jí tam postaví.
    ARAON
    ARAON --- ---
    DAVE2: To tuhle někdo zkoušel obejít pomocí ChatGPT. Zadal jí jako úkol popsat styl daného autora tak, aby ho pochopil generátor obrázků a pak to použil jako prompt. Rozdíl ve výsledku mezi přímým zadáním jména a popisem stylu byl mizivý.
    DAVE2
    DAVE2 --- ---
    ARAON: Ty pokusy jsem viděl a je to ještě hodně na začátku. Zatím je levnější nějaký objekt naskenovat nebo nechat parametricky vytvořit z hotových segmentů. Zajímavé to bude až v momentě, kdy AI bude schopna generovat použitelné kompletní 3D objekty a scény levněji a rychleji než těmi stávajícími metodami. Bude to mnohem dál než "text to video". To asi nikdy nebude schopné vygenerovat stejnou scénu znovu a znovu - například pro sitcom odehrávající se ve stejném pokoji. Pokud ty kulisy pokoje vygeneruju rovnou ve 3D, můžu tam libovolně měnit osvětlení a vracet se tam v jiných scénách. "Text to video" bude mnohem podobnější snu, kde nic není stálé a postupně se proměňuje.
    DAVE2
    DAVE2 --- ---
    Můj názor na autorská práva vs. AI: Je podle mě úplně jedno, jestli nějaké dílo stvořila AI nebo člověk ve Photoshopu. Takže postavička Myšáka Mickeyho vygenerovaná v Midjourney využitá komerčně je porušení licence Disneyho, stejně jako bych si ji nakreslil tužkou a chtěl natiskout na trička. Horší je to se styly - nápodoba a inspirace jinými autory je základnímstavebním kamenem tvorby. I tak by určitý unikátní styl měl požívat podobnou ochranu jako postavička Mickeyho. Do teď se to nedalo moc prosadit, protože neexistovala přesná hranice mezi nápodobou a kopií. To se s AI změnilo. Za mě je v pohodě, že se AI na těch dílech učí a že je dokáže napodobovat. Problém nastává v okamžiku, kdy nějaký difusní model přímo promptuju "nakresli postavičku ve stylu Miyazakiho". Tím přímo dokazuji, že po AI chci vytvoření kopie daného stylu a není se o čem bavit. Předpokládám, že podobný prompt bude v budoucnu zakázán podobně jako nemůžu použít promt obsahující sex a násilí. V pohodě by ale měl být promt "nakresli postavičku ve stylu japonské anime tvorby 90 let". Výsledek může být totožný jako v prním případě, ale je jasné, že pokud okopíruju Miyazakiho tvorbu, bude spíše omylem.
    ARAON
    ARAON --- ---
    DAVE2: Tak to uz funguje. Ale jeste dlouho bude problem v tom, ze to bude umet vygenerovat do her nepouzitelny mesh, jako photogrammetry. V zasade otexturovane bramboroidy. Jsem zvedavy, jak dlouho to bude trvat, nez to dokaze udelat funkcni mesh. Moje predpoved je, ze dokud ta AI nebude vedet jak to co dela funguje, tak nikdy. Je to podobny problem, jako ty prsty. AI netusi, co je to anatomie a jak clovek funguje. Jen videla hodne obrazku. Podobne to bude s temi 3D objekty. AI videla hodne 3D robotu, ale udelat jim funkcni kloub nedokaze. Videla hodne aut, ale nevi jak funguje naprava.
    DAVE2
    DAVE2 --- ---
    KERRAY: Dalším nevyhnutelným krokem po "text to image" a "text to video" bude "text to 3D model"
    KERRAY
    KERRAY --- ---
    #video Runaway Gen-2, pokrok jde snad ještě rychleji než u obrázků, s takovou se s tím za rok budou dát točit (nejen) amatérské filmy
    https://twitter.com/Uncanny_Harry/status/1650462479237931008
    KERRAY
    KERRAY --- ---
    #galerie #StableDiffusion #nástroj
    https://twitter.com/BrivaelLp/status/1649557688282497024
    DOUPLE
    DOUPLE --- ---
    KERRAY: jednička je vykradenej Jamie Hewlett za bílýho dne :)
    MEDWYN
    MEDWYN --- ---
    KERRAY: Jojo.. clovekem predcitane audioknihy uz to maji za pár.
    KERRAY
    KERRAY --- ---
    #audio #text sice to samozřejmě nebude umět česky, ale je to teda drsný
    Notion – The all-in-one workspace for your notes, tasks, wikis, and databases.
    https://suno-ai.notion.site/Bark-Examples-5edae8b02a604b54a42244ba45ebc2e2

    Bark is a transformer-based text-to-audio model created by Suno. Bark can generate highly realistic, multilingual speech as well as other audio - including music, background noise and simple sound effects. The model can also produce nonverbal communications like laughing, sighing and crying. To support the research community, we are providing access to pretrained model checkpoints ready for inference.

    GitHub - suno-ai/bark: 🔊 Text-prompted Generative Audio Model
    https://github.com/suno-ai/bark
    Kliknutím sem můžete změnit nastavení reklam