AI Art - Tvorba za pomocí umělé inteligence: Midjourney, Nanobanana, ComfyUI, Suno

Vše ohledně umění tvořeného pomocí umělé inteligence - obrázky, 'fotky', galerie, hudba, video, text + články, novinky apod.

NSFW obsah prosím obalit spoiler tagem - <div class="spoiler">obrázek</spoiler>, a nemá to tu být klub na roštěnky a nahotinky bez nějaké přidané hodnoty

Příbuzné diskuze:
- [DALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]]
- [I Hope This Does Not Exist ▌ Vedlejší efekty v AI visuálech]
- AI obecně [Artificial Intelligence AI]
- Vtipy [Umělá inteligence, chatboti - vtipné konverzace aneb "Hoří hovno?"]
- [generativní modely] Jak konstruovat prompty, kde získat váhy i jak to vše interpretovat

Prosím zkusme pro vkládanou tvorbu používat tagy
#galerie (2-3 obrázky na ukázku, další po rozkliku) #obrázek #video #hudba #text #hry #původní (pro vlastní tvorbu) #roštěnky

#článek #nástroj

(návrhy na další tagy apod. vítány)

Texty, programování: https://beta.openai.com/playground | https://chat.openai.com/
Obrázky online: https://www.midjourney.com/ | https://beta.dreamstudio.ai/
Lokálně: Webui-Forge https://github.com/lllyasviel/stable-diffusion-webui-forge | ComfyUI https://github.com/comfyanonymous/ComfyUI | Civitai repository custom modelů pro SD
AI na vytvoření textového zadání z existujícího obrázku: https://huggingface.co/spaces/pharma/CLIP-Interrogator

rozbalit záhlaví

SLASH --- --- 12:10:14 4.4.2026

1 odpověď +5

KAJJAK: dik.
Platform: Freepik
Picture: Nano Banana 2 / Pro
Video: VEO 3.1, Kling 3.0 Omni
Audio: Elevenlabs
Edit: VegasPro

KERRAY --- --- 16:35:29 2.10.2025

1 odpověď

DRAGON: stačilo mu tam dát jako audio zdroj právě tu znělku Návštěvníků :)

KERRAY --- --- 22:46:08 25.9.2025

1 odpověď

DRAGON: jakože abys získal audio nahrávku toho midi? z fleku ne, ale pak ten výsledek prohnat přes suno v5 by mohlo být hodně zajímavý

KERRAY --- --- 9:37:16 21.5.2025

1 odpověď +3

[KUBZ @ Artificial Intelligence AI]

#nástroj #video

> Veo 3 zvládá generaci videa se zvukem. Je private preview. Ukázky videí.
>
> VEO 3 AI Video Generation is Literally Insane with Perfect Audio! - 60 User Generated Wild Examples
VEO 3 AI Video Generation is Literally Insane with Perfect Audio! - 60 User Generated Wild Examples
https://m.youtube.com/watch?v=gFMUChHgXYk

KERRAY --- --- 10:13:19 2.5.2025

1 odpověď +2

#hudba #nástroj #Suno má nově betaverzi v4.5 (pro předplatitele) - a mají za poslední dobu taky celkem vylepšené UI, nějakej jakože víc audio editor a tak

(pozor, link má audio!)
Introducing v4.5 – Suno
https://suno.com/blog/introducing-v4-5

KERRAY --- --- 10:41:53 21.3.2025

ad KERRAY - takhle, jak to teď je, už je to imho použitelné na poslouchatelnou audioknihu, včetně hereckého výkonu (!), akorát si v češtině vtipně šlape na jazyk s Ř (a to jen některé pokusy)

openai-fm-ballad-audio.mp3

KERRAY --- --- 11:45:13 16.6.2024

1 odpověď

Suno taky umí audio vstup, takže kamarádova 'tvorba': #hudba

Kúp mi knihu 2024 by @vancura | Suno
https://suno.com/song/a16b5d8f-c3c6-4207-8b76-6283b52c5c53

Létající Čestmír by @vancura | Suno
https://suno.com/song/522ab699-14ea-40a5-84e5-61e67eeb6f1f

KERRAY --- --- 9:06:13 6.6.2024

KERRAY: https://www.udio.com/songs/iQiSxx4h2aCjqAijgFyQWr
nahrál audio svého brnkání na piano a #Udio doplnilo zbytek #hudba

KERRAY --- --- 21:18:33 5.6.2024

1 odpověď +2

#nástroj #hudba #udio
Reddit - Dive into anything
https://www.reddit.com/r/udiomusic/comments/1d8s4n1/new_features_audio_upload_improved_usability_and/
Pro verze má audio upload, který asi umí doplňovat, a až 15m na song

KERRAY --- --- 17:53:27 3.4.2024

1 odpověď +2

#nástroje #hudba
Introducing Stable Audio 2.0 — Stability AI
https://stability.ai/news/stable-audio-2-0

ARAON --- --- 0:42:33 29.2.2024

1 odpověď +4

This AI can make single image sing, talk, and rap from any audio file expressively!

Introducing EMO: Emote Portrait Alive by Alibaba.

10 wild examples:
https://twitter.com/minchoi/status/1762812204884074979

CABOWITZ --- --- 23:36:08 10.12.2023

tohle se tyka primarne zvuku, ale zrovna nedavno byla konference na jedne instituci, kterou vzdalene sleduju. jsou tam popisy jazyku/workflow/howto...

Programmable Audio Workshop 2023 (PAW)
https://paw.grame.fr/

LEXIK --- --- 14:32:35 5.11.2023

Lenka Dusilová - Maria | Singl 2023 (official - audio visualizer)
https://www.youtube.com/watch?v=5gign0Jn_dM

KERRAY --- --- 11:00:54 22.10.2023

rozdělování zvuku na jednotlivé nástroje #nástroj #hudba
Separate Anything You Describe
https://audio-agi.github.io/Separate-Anything-You-Describe/

https://twitter.com/dreamingtulpa/status/1715641298680504478

KERRAY --- --- 0:17:50 3.8.2023

#audio #text
https://twitter.com/MetaAI/status/1686776683398127616

PRAASHEK --- --- 19:55:36 28.7.2023

text prompt to audio :)

TextToSample | Samplab
https://samplab.com/text-to-sample

KERRAY --- --- 21:23:08 10.7.2023

#audio #text
Hlas Karla Gotta, který vytvořila umělá inteligence, už ve čtvrtek uslyší ve vysílání posluchači Českého rozhlasu. Bude součástí četby na pokračování ze zpěvákovy autobiografie „Má cesta za štěstím“. A je to vůbec poprvé, kdy bude v Česku takový hlas využitý v literárně-dramatickém díle.
Gott se vrací. V Českém rozhlasu zazní text, který načetla umělá inteligence hlasem hudební legendy | iROZHLAS - spolehlivé zprávy
https://irozhl.as/m7D

KERRAY --- --- 8:39:21 9.7.2023

a druhý #text #tts #nástroj je Suno Bark, který už jsem tu myslím dřív postoval, otevřeli Discord, kde jde generovat - to češtinu neumí, ale jinak to generovalo dost přirozené hlasy
GitHub - suno-ai/bark: 🔊 Text-Prompted Generative Audio Model
https://github.com/suno-ai/bark

Suno
https://www.suno.ai/

KERRAY --- --- 12:16:31 21.4.2023

1 odpověď +4

#audio #text sice to samozřejmě nebude umět česky, ale je to teda drsný
Notion – The all-in-one workspace for your notes, tasks, wikis, and databases.
https://suno-ai.notion.site/Bark-Examples-5edae8b02a604b54a42244ba45ebc2e2

Bark is a transformer-based text-to-audio model created by Suno. Bark can generate highly realistic, multilingual speech as well as other audio - including music, background noise and simple sound effects. The model can also produce nonverbal communications like laughing, sighing and crying. To support the research community, we are providing access to pretrained model checkpoints ready for inference.

GitHub - suno-ai/bark: 🔊 Text-prompted Generative Audio Model
https://github.com/suno-ai/bark

LOJZA --- --- 21:57:35 16.4.2023

2 odpovědi +1

Ještě to tu lehce zaspamuju svým praktickým dotazem; pardon.

Mám vyšší desítky hodin nahrávek školení v češtině. Jde o záznamy z Teams workshopů, čili videa. Potřeboval bych k tomu udělat anglický voiceover.

Jak nejlépe postupovat s využitím AI a MacOS? Máte někdo zkušenost?

Co jsem prozatím vyzkoušel:
1) přes Adapter jsem si extrahoval zvukovou stopu do mp3.
2) přes API OpenAI (Whisper) jsem si nechal vygenerovat "srt" titulky rovnou v angličtině. Cool, ale ne tak cool. S mluvenou češtinou si sice báječně poradí a anglický překlad nevypadá vůbec zle, ale je tu tvrdý limit na 1 soubor 25 MB, což v lepším případě pobere tak 30 minut záznamu. Což znamená u dvouhodinových školení řezat na čtyřikrát a pak ještě posouvat časové indexy v "srt" souborech. A ve finále se tím nedostávám k voiceoveru...
3) nezávisle na předchozím jsem si vyzkoušel jednoduchý voiceover přes "say" v MacOS terminálu. Fajn výstup, ale nerozumí si to s časováním, takže je potřeba ručně ošetřovat text, vkládat příkazy pro pauzu... prostě nepoužitelné pro hromadné zpracování, byť strojového překladu.

Long story short: nenapadá vás nějaký způsob, jak zpracovat třeba 100 hodin videí v češtině tak, že k nim dostanu synchronizované audio stopy v angličtině a zároveň mi to nezabere víc, než třeba 2 dny práce a náklady budou do cca 300 USD..? Díky.

Kliknutím sem můžete změnit nastavení reklam

přezdívka
heslo


pamatuj si mě
registrace
ztracené heslo?