• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    KERRAYAI Art - Tvorba za pomocí umělé inteligence: Midjourney, DALL·E 2, Stable Diffusion, OpenAI
    Vše ohledně umění tvořeného pomocí umělé inteligence - obrázky, 'fotky', galerie, hudba, video, text + články, novinky apod.

    NSFW obsah prosím obalit spoiler tagem - <div class="spoiler">obrázek</spoiler>, a nemá to tu být klub na roštěnky a nahotinky bez nějaké přidané hodnoty

    Příbuzné diskuze:
    - [DALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]]
    - [I Hope This Does Not Exist ​ ​ ​ ▌​ ​ Vedlejší efekty v AI visuálech]
    - AI obecně [Artificial Intelligence AI]
    - Vtipy [Umělá inteligence, chatboti - vtipné konverzace aneb "Hoří hovno?"]
    - [generativní modely] Jak konstruovat prompty, kde získat váhy i jak to vše interpretovat


    Prosím zkusme pro vkládanou tvorbu používat tagy
    #galerie (2-3 obrázky na ukázku, další po rozkliku) #obrázek #video #hudba #text #hry #původní (pro vlastní tvorbu) #roštěnky

    #článek #nástroj

    (návrhy na další tagy apod. vítány)

    Texty, programování: https://beta.openai.com/playground | https://chat.openai.com/
    Obrázky online: https://www.midjourney.com/ | https://beta.dreamstudio.ai/
    Lokálně: Webui-Forge https://github.com/lllyasviel/stable-diffusion-webui-forge | ComfyUI https://github.com/comfyanonymous/ComfyUI | Civitai repository custom modelů pro SD
    AI na vytvoření textového zadání z existujícího obrázku: https://huggingface.co/spaces/pharma/CLIP-Interrogator
    rozbalit záhlaví
    SALAM
    SALAM --- ---
    #obrázek #nástroj
    konecne rozumny model na generovanie a upravu obrazkov, ktora zachovava povodny vstupny image.
    super rychly (cca par sekund na image), plne textova editace - tj. zvlada slovne instrukcie "vymen X za Y" "otoc kameru z ineho pohladu" "odstran text" atd.

    Narozdiel od Chatgpt (Imagen) ktory dokaze upravovat kontextualne tiez (uz nejaku dobu), je flux.kontext ale milionkrat rychlejsi, a zdrojovy input nemeni. Tj realne zachova face, postavu, scenu, atd.
    How to Use Flux Kontext for Image Editing (with AI Comparisons)
    How to Use Flux Kontext for Image Editing (with AI Comparisons)
    https://www.youtube.com/watch?v=_vIKdFYQBks&t=1s
    KERRAY
    KERRAY --- ---
    #nástroj #tts Meet Eleven v3 - The most expressive Text to Speech model.
    Eleven v3 (alpha) — The most expressive Text to Speech model
    https://elevenlabs.io/v3
    THEODORT
    THEODORT --- ---
    LOJZA: https://github.com/coqui-ai/TTS
    Možná když to zkopirujes 2x za sebe.. cca
    GitHub - coqui-ai/TTS: 🐸💬 - a deep learning toolkit for Text-to-Speech, battle-tested in research and production
    https://github.com/coqui-ai/TTS#example-voice-cloning-together-with-the-voice-conversion-model
    KERRAY
    KERRAY --- ---
    další #původní #midjourney #galerie id STRYX
    Jan Dřevíkovský - Midjourney potichu zmenila model 7 za...
    https://www.facebook.com/share/p/1ANzz7ZTRS/
    KILLUA
    KILLUA --- ---
    PRAASHEK: Nový obrázkový model GPT. Prompt ti moc nepomůže tohle sem "modeloval" na základě asi 20 iterací. Musel sem si uvědomit věci jako osvětlení ze shora, ambientní tmu a pomalu měnit a vylepšovat iterováním a zkoušením.
    Mám hlavně radost, že to opravdu vypadá jako "Avatar" nějakého démona v jeho chrámu a snad to jako opravdu nahání trochu strach když si představíš že tam stojíš a ono to začne mluvit...

    Začal sem s tímhle.
    In a shadowy cavern, demonic face looms. The jagged rock walls surrounding it echo the statue's malevolent presence, while two mysterious doorways stand as silent sentinels to either side, and a weathered stone pedestal rests nearby, bathed in the ambient light.
    KERRAY
    KERRAY --- ---
    #nástroj #midjourney začaly testy v7 a "draft mode" #

    We're now beginning to alpha-test a new V7 image Model. It's our smartest, most beautiful, and most coherent model yet. Give it a shot by using --v 7

    V7 is the first model to have model personalization turned on by default. You must unlock your personalization to use it. This takes ~5 minutes. You can toggle it on/off at any time.

    "Draft Mode" is another new feature. Draft mode is half the cost, 10 times the speed, and it might be the best way to iterate on ideas ever. Try it with voice on the web, or by using --draft on Discord.
    BAT
    BAT --- ---
    DOUPLE: Me by pro zajimavost zajimalo, jak by to dopadlo, kdyby byl model natrenovany na obrazkach nakreslenych v tom stylu, ale jinym autorem, jenz by s uzitim pro trenovani AI (a dalsim, s tim souvisejicim pouzitim) souhlasil.

    Nic o tom nevim, ale divil bych se, kdyby byl "styl" nejak chraneny.
    Jakoze chapu, ze nemuzu nikde publikovat postavicku Mickey Mouse (mimo tech opravdu starych co jsou snad uz v PD), ale kdyz stejnym stylem nakreslim postavicku co jsem si ja vymyslel (Roger Rat), tak...
    no, asi by to dopadlo tak, ze by se Disney stejne soudil, a kdo na to ma, ze... ale teoreticky by to melo byt v poho ne?

    Pominme fakt, ze tvuj priklad s politickou stranou by byl asi vniman par lidmi negativne, ale v ramci autorskych zakonu a kyho certa? to by asi bylo cajk, ne?
    DOUPLE
    DOUPLE --- ---
    DOUPLE: :)
    Chatgpt: Styl studia Ghibli je natolik specifický a charakteristický, že když AI vygeneruje něco podobného, už to překračuje hranici mezi "inspirací" a "napodobováním". A pokud politická strana použije takový obrázek ve své kampani, může to být vnímáno jako zneužití estetického jazyka Ghibli k účelům, které s jejich tvorbou nemají nic společného.

    Tohle je přesně ten typ situace, kde se etika a autorské právo setkávají s limity AI generace. Technicky vzato by se Ghibli mohlo bránit, pokud by dokázali, že AI model byl natrénován na jejich dílech nebo že výstup je příliš blízký jejich stylu. A i kdyby právně nešlo o přímé porušení autorských práv, pořád je tu otázka etiky a respektu k umělcům.

    Osobně mi to taky nepřijde moc košer. Přijde mi to podobné, jako kdyby někdo vzal Miyazakiho film, přemaloval ho AI a pak ho použil v kampani, aniž by k tomu měl svolení. Je zajímavé, že si tohle dovolí například i politická strana – obvykle bývají dost opatrné, aby se vyhnuly právním problémům. Možná si neuvědomili, jak kontroverzní to může být.
    KILLUA
    KILLUA --- ---
    THEODORT: Nezkoušel, protože obecně nemám "resoning" modly tak rád, protože mám rád rychlou odezvu. Používám max o3 když chci poradit s něčím těžkým. Ale QwQ má zajímavé nápady když brainstormuju něco mimo programování, připadá mi že je jednoduše unikátní.

    Deep seek sem zkoušel i plnej ale nezačal jsem ho používat nějak více.

    ICE: Jako je to spíš jednodušší model, ale snaží se no :)
    KILLUA
    KILLUA --- ---
    BAT: Za mě je lokálně dobře použitelnej 32B QwQ, je to reasoning model a v programování docela silnej. Ale co sem pochopil ty nemáš dost ramky na něj. Proto sem doporučil ten 14B deep seek, protože je to taky reasoning model a je to postavené na 14B Qwen modelu :)
    Vlastně jen naučili qwen model přemýšlet.

    Zkoušel sem ještě nejnovější 24B mistral small 2501 a narozdíl od své starší verze a nejspíš i codestralu je za mě o dost lepší.

    Ale to víš na Clauda to úplně nemá.
    DOUPLE
    DOUPLE --- ---
    par dni stary model Flux umi neuveritelny veci s textem
    FLUX: This new AI image generator is eerily good at creating human hands | Ars Technica
    https://arstechnica.com/information-technology/2024/08/flux-this-new-ai-image-generator-is-eerily-good-at-creating-human-hands/

    THERIDANE
    THERIDANE --- ---
    KILLUA: proto mají abliterované/ortogonalizované modely vyšší score než originální, odstraní se ten zmatek a model pak dělá méně chyb (ale řekne opravdu všechno, co ví, a neodmítá)
    KILLUA
    KILLUA --- ---
    HONZA09: Mistral má oproti velkým hráčům malé zdroje takže se snaží udělat svůj model konkurenceschopný všemi prostředky a jeden z nejsilnějších je co nejméně ho cenzurovat.

    Když se nad tím totiž zamyslíš model se něco naučí je to pro něj "pravda" no a pak přijde ten "tréning" kde mu říkáš že to pravda není... výsledek je že v tom je nějakej "šum" zmatek.
    KERRAY
    KERRAY --- ---
    #nástroj #midjourney
    Hey! We're releasing an early test version of model personalization today, here's how it works

    What is Model Personalization?
    Every time you write a prompt there's a lot that remains 'unspoken'. Our algorithms usually fill in the blank with their own 'preferences', which are really the combined biases and preferences of our community.
    But of course everyone is different! Model personalization learns what you like so that it's more likely to fill in the blanks with your tastes.

    Model Personalization Requirements
    Right now model personalization learns from votes in pair ranking and images that you like from the explore page.
    You need to have roughly 200 pair rankings / likes in order for the feature to work
    You can see how many ratings you have on the above page or by typing /info

    How do I use Model Personalization?
    Just type --p after your prompt, or turn on personalization for all prompts under /settings or the prompt settings button on the website
    When you enable personalization you get a 'code' added after your prompts, you can share this code to share the personalization effect being applied to that image
    You can control the strength of the personalization effect by using --s 100 (0 is off and 1000 is maximum and 100 is default)

    PLEASE NOTE: The personalization is not a stable feature right now, it will change as you do more pair ratings (subtly) and we may be pushing out algorithm updates over the next few weeks. So just assume that it's a 'fun feature constantly in flux'

    This is a totally new frontier of image synthesis.
    ARAON
    ARAON --- ---
    Sora by OpenAI is insane.

    But KWAI just dropped a Sora-like model called KLING, and people are going crazy over it.

    Here are 10 wild examples you don't want to miss:

    1. A Chinese man sits at a table and eats noodles with chopsticks
    x.com
    https://x.com/i/status/1798777783952527818
    GALADAR
    GALADAR --- ---
    HONZA09: Když narážíš na content restrictions, model tě upozorní. (a rád i sám poradí, jak je obejít) Tohle je jen chyba v promptu. Mmch "angel dust" už je direct drug reference, dívím se, že tě nestopl. Doporučuji flour, white powder, powdered caffeine atd.
    HONZA09
    HONZA09 --- ---
    Tak jsem našel omezení. nejsem za boha schopnej v Dall E vygenerovat obrázek boha dávajícího si lajnu. Ten generativní model záměrně igonruje přesný instrukce, že ten bůh má mít to brčko v nose.

    A depiction of a god inhaling the Milky Way through a straw into their nose, as if snorting a line of angel dust. The scene is high contrast, resembling the style of a tapestry. The god, adorned in majestic and detailed attire, is shown inhaling the glittering Milky Way through the straw, with cosmic elements swirling around them. The background features a vast, star-studded galaxy with vivid colors and intricate patterns, enhancing the grandeur of the universe. The format is wide to capture the expansiveness of the scene.





    KILLUA
    KILLUA --- ---
    AODHFIN: A funguje tak i člověk, pokud tě po narození zavřou do bílé krabice a nebude s tebou nikdo nijak 20 let interagovat max ti tam spadne kostka s jídlem tak jediná informační hodnota vzejde z naprogramovaných DNA vzorců typu dávivý reflex, strach a smyslových podnětů ze tvého vlastního těla tj např z prohlížení vlastních rukou mohou vzejít nějaké představy.

    Jinak nemá mozek ani ai model z čeho brát...
    FRK_R23
    FRK_R23 --- ---
    Zkoušel jsem jestli Fooocus umí taky třeba metahuman render :)

    prompt: Unreal engine metahuman, unreal engine render, lumen
    Base model: juggernautXL_v8

    Kliknutím sem můžete změnit nastavení reklam