• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, DALL·E 2, Stable Diffusion, OpenAI
    Vše ohledně umění tvořeného pomocí umělé inteligence - obrázky, 'fotky', galerie, hudba, video, text + články, novinky apod.

    NSFW obsah prosím obalit spoiler tagem - <div class="spoiler">obrázek</spoiler>, a nemá to tu být klub na roštěnky a nahotinky bez nějaké přidané hodnoty

    Příbuzné diskuze:
    - [DALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]]
    - [I Hope This Does Not Exist ​ ​ ​ ▌​ ​ Vedlejší efekty v AI visuálech]
    - AI obecně [Artificial Intelligence AI]
    - Vtipy [Umělá inteligence, chatboti - vtipné konverzace aneb "Hoří hovno?"]
    - [generativní modely] Jak konstruovat prompty, kde získat váhy i jak to vše interpretovat


    Prosím zkusme pro vkládanou tvorbu používat tagy
    #galerie (2-3 obrázky na ukázku, další po rozkliku) #obrázek #video #hudba #text #hry #původní (pro vlastní tvorbu) #roštěnky

    #článek #nástroj

    (návrhy na další tagy apod. vítány)

    Texty, programování: https://beta.openai.com/playground | https://chat.openai.com/
    Obrázky online: https://www.midjourney.com/ | https://beta.dreamstudio.ai/
    Lokálně: Webui-Forge https://github.com/lllyasviel/stable-diffusion-webui-forge | ComfyUI https://github.com/comfyanonymous/ComfyUI | Civitai repository custom modelů pro SD
    AI na vytvoření textového zadání z existujícího obrázku: https://huggingface.co/spaces/pharma/CLIP-Interrogator
    rozbalit záhlaví
    KERRAY
    KERRAY --- ---
    DRAGON: stačilo mu tam dát jako audio zdroj právě tu znělku Návštěvníků :)
    KERRAY
    KERRAY --- ---
    DRAGON: jakože abys získal audio nahrávku toho midi? z fleku ne, ale pak ten výsledek prohnat přes suno v5 by mohlo být hodně zajímavý
    KERRAY
    KERRAY --- ---
    [KUBZ @ Artificial Intelligence AI]

    #nástroj #video

    > Veo 3 zvládá generaci videa se zvukem. Je private preview. Ukázky videí.
    >
    > VEO 3 AI Video Generation is Literally Insane with Perfect Audio! - 60 User Generated Wild Examples
    VEO 3 AI Video Generation is Literally Insane with Perfect Audio! - 60 User Generated Wild Examples
    https://m.youtube.com/watch?v=gFMUChHgXYk
    KERRAY
    KERRAY --- ---
    #hudba #nástroj #Suno má nově betaverzi v4.5 (pro předplatitele) - a mají za poslední dobu taky celkem vylepšené UI, nějakej jakože víc audio editor a tak

    (pozor, link má audio!)
    Introducing v4.5 – Suno
    https://suno.com/blog/introducing-v4-5
    KERRAY
    KERRAY --- ---
    ad KERRAY - takhle, jak to teď je, už je to imho použitelné na poslouchatelnou audioknihu, včetně hereckého výkonu (!), akorát si v češtině vtipně šlape na jazyk s Ř (a to jen některé pokusy)

    KERRAY
    KERRAY --- ---
    Suno taky umí audio vstup, takže kamarádova 'tvorba': #hudba

    Kúp mi knihu 2024 by @vancura | Suno
    https://suno.com/song/a16b5d8f-c3c6-4207-8b76-6283b52c5c53

    Létající Čestmír by @vancura | Suno
    https://suno.com/song/522ab699-14ea-40a5-84e5-61e67eeb6f1f
    KERRAY
    KERRAY --- ---
    KERRAY: https://www.udio.com/songs/iQiSxx4h2aCjqAijgFyQWr
    nahrál audio svého brnkání na piano a #Udio doplnilo zbytek #hudba
    KERRAY
    KERRAY --- ---
    #nástroj #hudba #udio
    Reddit - Dive into anything
    https://www.reddit.com/r/udiomusic/comments/1d8s4n1/new_features_audio_upload_improved_usability_and/
    Pro verze má audio upload, který asi umí doplňovat, a až 15m na song
    KERRAY
    KERRAY --- ---
    #nástroje #hudba
    Introducing Stable Audio 2.0 — Stability AI
    https://stability.ai/news/stable-audio-2-0
    ARAON
    ARAON --- ---
    This AI can make single image sing, talk, and rap from any audio file expressively!

    Introducing EMO: Emote Portrait Alive by Alibaba.

    10 wild examples:
    https://twitter.com/minchoi/status/1762812204884074979
    CABOWITZ
    CABOWITZ --- ---
    tohle se tyka primarne zvuku, ale zrovna nedavno byla konference na jedne instituci, kterou vzdalene sleduju. jsou tam popisy jazyku/workflow/howto...

    Programmable Audio Workshop 2023 (PAW)
    https://paw.grame.fr/
    LEXIK
    LEXIK --- ---
    Lenka Dusilová - Maria | Singl 2023 (official - audio visualizer)
    https://www.youtube.com/watch?v=5gign0Jn_dM
    KERRAY
    KERRAY --- ---
    PRAASHEK
    PRAASHEK --- ---
    text prompt to audio :)

    TextToSample | Samplab
    https://samplab.com/text-to-sample
    KERRAY
    KERRAY --- ---
    #audio #text
    Hlas Karla Gotta, který vytvořila umělá inteligence, už ve čtvrtek uslyší ve vysílání posluchači Českého rozhlasu. Bude součástí četby na pokračování ze zpěvákovy autobiografie „Má cesta za štěstím“. A je to vůbec poprvé, kdy bude v Česku takový hlas využitý v literárně-dramatickém díle.
    Gott se vrací. V Českém rozhlasu zazní text, který načetla umělá inteligence hlasem hudební legendy | iROZHLAS - spolehlivé zprávy
    https://irozhl.as/m7D
    KERRAY
    KERRAY --- ---
    a druhý #text #tts #nástroj je Suno Bark, který už jsem tu myslím dřív postoval, otevřeli Discord, kde jde generovat - to češtinu neumí, ale jinak to generovalo dost přirozené hlasy
    GitHub - suno-ai/bark: 🔊 Text-Prompted Generative Audio Model
    https://github.com/suno-ai/bark

    Suno
    https://www.suno.ai/
    KERRAY
    KERRAY --- ---
    #audio #text sice to samozřejmě nebude umět česky, ale je to teda drsný
    Notion – The all-in-one workspace for your notes, tasks, wikis, and databases.
    https://suno-ai.notion.site/Bark-Examples-5edae8b02a604b54a42244ba45ebc2e2

    Bark is a transformer-based text-to-audio model created by Suno. Bark can generate highly realistic, multilingual speech as well as other audio - including music, background noise and simple sound effects. The model can also produce nonverbal communications like laughing, sighing and crying. To support the research community, we are providing access to pretrained model checkpoints ready for inference.

    GitHub - suno-ai/bark: 🔊 Text-prompted Generative Audio Model
    https://github.com/suno-ai/bark
    LOJZA
    LOJZA --- ---
    Ještě to tu lehce zaspamuju svým praktickým dotazem; pardon.

    Mám vyšší desítky hodin nahrávek školení v češtině. Jde o záznamy z Teams workshopů, čili videa. Potřeboval bych k tomu udělat anglický voiceover.

    Jak nejlépe postupovat s využitím AI a MacOS? Máte někdo zkušenost?

    Co jsem prozatím vyzkoušel:
    1) přes Adapter jsem si extrahoval zvukovou stopu do mp3.
    2) přes API OpenAI (Whisper) jsem si nechal vygenerovat "srt" titulky rovnou v angličtině. Cool, ale ne tak cool. S mluvenou češtinou si sice báječně poradí a anglický překlad nevypadá vůbec zle, ale je tu tvrdý limit na 1 soubor 25 MB, což v lepším případě pobere tak 30 minut záznamu. Což znamená u dvouhodinových školení řezat na čtyřikrát a pak ještě posouvat časové indexy v "srt" souborech. A ve finále se tím nedostávám k voiceoveru...
    3) nezávisle na předchozím jsem si vyzkoušel jednoduchý voiceover přes "say" v MacOS terminálu. Fajn výstup, ale nerozumí si to s časováním, takže je potřeba ručně ošetřovat text, vkládat příkazy pro pauzu... prostě nepoužitelné pro hromadné zpracování, byť strojového překladu.

    Long story short: nenapadá vás nějaký způsob, jak zpracovat třeba 100 hodin videí v češtině tak, že k nim dostanu synchronizované audio stopy v angličtině a zároveň mi to nezabere víc, než třeba 2 dny práce a náklady budou do cca 300 USD..? Díky.
    KERRAY
    KERRAY --- ---
    text2audio, image2audio, video2audio, audio inpainting... zajímavé časy #hudba #audio
    https://twitter.com/_akhaliq/status/1619589070329348096
    Kliknutím sem můžete změnit nastavení reklam