• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, DALL·E 2, Stable Diffusion, OpenAI
    Vše ohledně umění tvořeného pomocí umělé inteligence - obrázky, 'fotky', galerie, hudba, video, text + články, novinky apod.

    NSFW obsah prosím obalit spoiler tagem - <div class="spoiler">obrázek</spoiler>, a nemá to tu být klub na roštěnky a nahotinky bez nějaké přidané hodnoty

    Příbuzné diskuze:
    - [DALL·E mini i Craiyon - having sex with AI since [date format unknown]]
    - [I Hope This Does Not Exist ​ ​ ​ ▌​ ​ Vedlejší efekty v AI visuálech]
    - AI obecně [Artificial Intelligence AI]
    - Vtipy [Umělá inteligence, chatboti - vtipné konverzace aneb "Hoří hovno?"]
    - [generativní modely] Jak konstruovat prompty, kde získat váhy i jak to vše interpretovat


    Prosím zkusme pro vkládanou tvorbu používat tagy
    #galerie (2-3 obrázky na ukázku, další po rozkliku) #obrázek #video #hudba #text #hry #původní (pro vlastní tvorbu) #roštěnky

    #článek #nástroj

    (návrhy na další tagy apod. vítány)

    Texty, programování: https://beta.openai.com/playground | https://chat.openai.com/
    Obrázky online: https://www.midjourney.com/ | https://beta.dreamstudio.ai/
    Lokálně: https://github.com/AUTOMATIC1111/stable-diffusion-webui | https://github.com/invoke-ai/InvokeAI | Civitai repository custom modelů pro SD
    AI na vytvoření textového zadání z existujícího obrázku: https://huggingface.co/spaces/pharma/CLIP-Interrogator
    rozbalit záhlaví
    KERRAY
    KERRAY --- ---
    #nástroje #hudba
    Introducing Stable Audio 2.0 — Stability AI
    https://stability.ai/news/stable-audio-2-0
    ARAON
    ARAON --- ---
    This AI can make single image sing, talk, and rap from any audio file expressively!

    Introducing EMO: Emote Portrait Alive by Alibaba.

    10 wild examples:
    https://twitter.com/minchoi/status/1762812204884074979
    CABOWITZ
    CABOWITZ --- ---
    tohle se tyka primarne zvuku, ale zrovna nedavno byla konference na jedne instituci, kterou vzdalene sleduju. jsou tam popisy jazyku/workflow/howto...

    Programmable Audio Workshop 2023 (PAW)
    https://paw.grame.fr/
    LEXIK
    LEXIK --- ---
    Lenka Dusilová - Maria | Singl 2023 (official - audio visualizer)
    https://www.youtube.com/watch?v=5gign0Jn_dM
    KERRAY
    KERRAY --- ---
    PRAASHEK
    PRAASHEK --- ---
    text prompt to audio :)

    TextToSample | Samplab
    https://samplab.com/text-to-sample
    KERRAY
    KERRAY --- ---
    #audio #text
    Hlas Karla Gotta, který vytvořila umělá inteligence, už ve čtvrtek uslyší ve vysílání posluchači Českého rozhlasu. Bude součástí četby na pokračování ze zpěvákovy autobiografie „Má cesta za štěstím“. A je to vůbec poprvé, kdy bude v Česku takový hlas využitý v literárně-dramatickém díle.
    Gott se vrací. V Českém rozhlasu zazní text, který načetla umělá inteligence hlasem hudební legendy | iROZHLAS - spolehlivé zprávy
    https://irozhl.as/m7D
    KERRAY
    KERRAY --- ---
    a druhý #text #tts #nástroj je Suno Bark, který už jsem tu myslím dřív postoval, otevřeli Discord, kde jde generovat - to češtinu neumí, ale jinak to generovalo dost přirozené hlasy
    GitHub - suno-ai/bark: 🔊 Text-Prompted Generative Audio Model
    https://github.com/suno-ai/bark

    Suno
    https://www.suno.ai/
    KERRAY
    KERRAY --- ---
    #audio #text sice to samozřejmě nebude umět česky, ale je to teda drsný
    Notion – The all-in-one workspace for your notes, tasks, wikis, and databases.
    https://suno-ai.notion.site/Bark-Examples-5edae8b02a604b54a42244ba45ebc2e2

    Bark is a transformer-based text-to-audio model created by Suno. Bark can generate highly realistic, multilingual speech as well as other audio - including music, background noise and simple sound effects. The model can also produce nonverbal communications like laughing, sighing and crying. To support the research community, we are providing access to pretrained model checkpoints ready for inference.

    GitHub - suno-ai/bark: 🔊 Text-prompted Generative Audio Model
    https://github.com/suno-ai/bark
    LOJZA
    LOJZA --- ---
    Ještě to tu lehce zaspamuju svým praktickým dotazem; pardon.

    Mám vyšší desítky hodin nahrávek školení v češtině. Jde o záznamy z Teams workshopů, čili videa. Potřeboval bych k tomu udělat anglický voiceover.

    Jak nejlépe postupovat s využitím AI a MacOS? Máte někdo zkušenost?

    Co jsem prozatím vyzkoušel:
    1) přes Adapter jsem si extrahoval zvukovou stopu do mp3.
    2) přes API OpenAI (Whisper) jsem si nechal vygenerovat "srt" titulky rovnou v angličtině. Cool, ale ne tak cool. S mluvenou češtinou si sice báječně poradí a anglický překlad nevypadá vůbec zle, ale je tu tvrdý limit na 1 soubor 25 MB, což v lepším případě pobere tak 30 minut záznamu. Což znamená u dvouhodinových školení řezat na čtyřikrát a pak ještě posouvat časové indexy v "srt" souborech. A ve finále se tím nedostávám k voiceoveru...
    3) nezávisle na předchozím jsem si vyzkoušel jednoduchý voiceover přes "say" v MacOS terminálu. Fajn výstup, ale nerozumí si to s časováním, takže je potřeba ručně ošetřovat text, vkládat příkazy pro pauzu... prostě nepoužitelné pro hromadné zpracování, byť strojového překladu.

    Long story short: nenapadá vás nějaký způsob, jak zpracovat třeba 100 hodin videí v češtině tak, že k nim dostanu synchronizované audio stopy v angličtině a zároveň mi to nezabere víc, než třeba 2 dny práce a náklady budou do cca 300 USD..? Díky.
    KERRAY
    KERRAY --- ---
    text2audio, image2audio, video2audio, audio inpainting... zajímavé časy #hudba #audio
    https://twitter.com/_akhaliq/status/1619589070329348096
    KERRAY
    KERRAY --- ---
    #hudba #nástroj

    Remove Vocals From Audio Files With Ultimate Vocal Remover GUI (AI-Powered) - Linux Uprising Blog
    https://www.linuxuprising.com/2023/01/remove-vocals-from-audio-files-with.html
    DOUPLE
    DOUPLE --- ---
    uf, okej. #článek #kampaň

    We are not anti-tech and we know this technology is here to stay one way or another but there are more ethical ways that these models can co-exist with visual artists. This is what we will be proposing these future models look like:

    • Ensure that all AI/ML models that specializes in visual works, audio works, film works, likenesses, etc. utilizes public domain content or legally purchased photo stock sets. This could potentially mean current companies shift, even destroy their current models, to the public domain.
    • Urgently remove all artist’s work from data sets and latent spaces, via algorithmic disgorgement. Immediately shift plans to public domain models, so Opt-in becomes the standard.
    • Opt-in programs for artists to offer payment (upfront sums and royalties) every time an artist’s work is utilized for a generation, including training data, deep learning, final image, final product, etc. AI companies offer true removal of their data within AI/ML models just in case licensing contracts are breached.
    • AI Companies pay all affected artists a sum per generation. This is to compensate/back pay artists for utilizing their works and names without permission, for as long as the company has been for profit.

    https://www.gofundme.com/f/protecting-artists-from-ai-technologies
    Kliknutím sem můžete změnit nastavení reklam