• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, DALL·E 2, Stable Diffusion, OpenAI
    DOUPLE
    DOUPLE --- ---
    KERRAY: jednička je vykradenej Jamie Hewlett za bílýho dne :)
    MEDWYN
    MEDWYN --- ---
    KERRAY: Jojo.. clovekem predcitane audioknihy uz to maji za pár.
    KERRAY
    KERRAY --- ---
    #audio #text sice to samozřejmě nebude umět česky, ale je to teda drsný
    Notion – The all-in-one workspace for your notes, tasks, wikis, and databases.
    https://suno-ai.notion.site/Bark-Examples-5edae8b02a604b54a42244ba45ebc2e2

    Bark is a transformer-based text-to-audio model created by Suno. Bark can generate highly realistic, multilingual speech as well as other audio - including music, background noise and simple sound effects. The model can also produce nonverbal communications like laughing, sighing and crying. To support the research community, we are providing access to pretrained model checkpoints ready for inference.

    GitHub - suno-ai/bark: 🔊 Text-prompted Generative Audio Model
    https://github.com/suno-ai/bark
    KERRAY
    KERRAY --- ---
    KAJJAK: jo, máš to celý v jiné složce, maximálně si přilinkuješ existujícího modely a extensions
    KAJJAK
    KAJJAK --- ---
    KERRAY: a jde se pak jeste jednoduse vratit ke staremu ui?
    KERRAY
    KERRAY --- ---
    #nástroj #stablediffusion prý dobré lokální UI, jdu vyzkoušet
    GitHub - anapnoe/stable-diffusion-webui-ux: Stable Diffusion web UI
    https://github.com/anapnoe/stable-diffusion-webui-ux
    KERRAY
    KERRAY --- ---
    #nástroj #text #hry
    vida, GPT-4 umí přímo generovat skripty pro "vyber si vlastní dobrodružství" systém Ink, stačí zkompilovat v Inky - a text klidně může být i v češtině. Musel jsem mu předhodit pár chyb, ale sám došel k fungujícímu výsledku - tomu by šlo hodně pomoct nějakou existující ukázkou.

    room
    https://kerray.cz/files/room_ink/

    room
    https://kerray.cz/files/praha_ink/

    KERRAY
    KERRAY --- ---
    #nástroj
    https://twitter.com/EMostaque/status/1648892123893178368
    DUKON
    DUKON --- ---
    od: Martin Jurica
    DAVE2
    DAVE2 --- ---
    WADER23: Kdyby vyhrála fotka a později se ukázalo, že to byla jenom koláž vytvořená někým ve Photoshopu, tak by dotyčného jednoduše vyloučili a nic by se neřešilo. Když místo Photoshopu použil AI, tak je to zpráva dne...
    E2E4
    E2E4 --- ---
    LOJZA: on to dělá naslepo, ale asi celkem dobře rozumí jak to obecně funguje, a jak asi tak zhruba vypadá dřívější verze. prostě vidí v těch slovech jiný souvislosti než my..
    MICHIGAN
    MICHIGAN --- ---
    E2E4: on to hlavne taky neni midjourney prompt
    LOJZA: tohle az bude fungovat, tak to bude nejvetsi boom AI vubec. v podstate to bude znamenat, ze vezmes jakykoliv video treba z youtube a prelozis si ho v AI do svyho jazyka (a klidne by pro zacatek stacily jen ty titulky).
    casem pak automaticky prekladace fungujici realtime (neco malo uz existuje i dneska, ale dost spatne a bez vnitrni logiky)
    KERRAY
    KERRAY --- ---
    LOJZA: jo, a prostě když budeš dost dlouho zkoušet, a tak něco zajímavýho vygeneruješ...
    LOJZA
    LOJZA --- ---
    E2E4: To vypadá dobře. Vyzkouším, díky.
    E2E4
    E2E4 --- ---
    LOJZA: vygooglil jsem ti toto: https://sonix.ai/translation

    jinak pro obejiti limitu na velikost soouboru u moznosti #2 muzes re-encodovat na nizsi kvalitu, prelozit a pak k tomu zas pridat puvodni stopu..
    NUSPHIR
    NUSPHIR --- ---
    posun v oblasti text 2 video, image to video, resp. úprava zdrojového videa do nové podoby podle promptu,

    Dreamix
    https://www.youtube.com/watch?v=i5sO-BOFVoo
    LOJZA
    LOJZA --- ---
    Ještě to tu lehce zaspamuju svým praktickým dotazem; pardon.

    Mám vyšší desítky hodin nahrávek školení v češtině. Jde o záznamy z Teams workshopů, čili videa. Potřeboval bych k tomu udělat anglický voiceover.

    Jak nejlépe postupovat s využitím AI a MacOS? Máte někdo zkušenost?

    Co jsem prozatím vyzkoušel:
    1) přes Adapter jsem si extrahoval zvukovou stopu do mp3.
    2) přes API OpenAI (Whisper) jsem si nechal vygenerovat "srt" titulky rovnou v angličtině. Cool, ale ne tak cool. S mluvenou češtinou si sice báječně poradí a anglický překlad nevypadá vůbec zle, ale je tu tvrdý limit na 1 soubor 25 MB, což v lepším případě pobere tak 30 minut záznamu. Což znamená u dvouhodinových školení řezat na čtyřikrát a pak ještě posouvat časové indexy v "srt" souborech. A ve finále se tím nedostávám k voiceoveru...
    3) nezávisle na předchozím jsem si vyzkoušel jednoduchý voiceover přes "say" v MacOS terminálu. Fajn výstup, ale nerozumí si to s časováním, takže je potřeba ručně ošetřovat text, vkládat příkazy pro pauzu... prostě nepoužitelné pro hromadné zpracování, byť strojového překladu.

    Long story short: nenapadá vás nějaký způsob, jak zpracovat třeba 100 hodin videí v češtině tak, že k nim dostanu synchronizované audio stopy v angličtině a zároveň mi to nezabere víc, než třeba 2 dny práce a náklady budou do cca 300 USD..? Díky.
    E2E4
    E2E4 --- ---
    LOJZA: super, diky moc. Holt na automatickou tvorbu infografik to jeste neni. :)
    LOJZA
    LOJZA --- ---
    LOJZA: Aha, tak ne, blbě jsem slovo "Sexual" detekoval já, protože jsem hledal case-sensitive :)

    Každopádně, z výsledku nadšený nebudeš:

    Kliknutím sem můžete změnit nastavení reklam