• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    PRAASHEKDALL·E mini je mrtvé, Dejve, ať žije Craiyon, mage.space, Stable Diffusion atd. - having sex with AI since [date format unknown]
    VOZKA
    VOZKA --- ---
    PRAASHEK: Já nevím o tom, že by dall-e někdo leaknul a dalo se to provozovat jinak než u nich na serveru. Jestli myslíš Dall-e mini alias craiyon, tak to by asi jít mělo, ale taky jsem nic nenašel a v diskuzi na hugging face někdo tvrdí, že to vyžaduje 12 GB RAM a je to pomalejší než Stable Diffusion.
    PRAASHEK
    PRAASHEK --- ---
    VOZKA: nevíš, zda existuje nějaký NKMD-GUI-like pro DALLE? Nějak jsem našel jenom hodně upruznyj návod jak to zprovnoznit na desktopu doma a do toho nejdu :)
    VOZKA
    VOZKA --- ---
    Vyšel Stable Diffusion 2.0. Zatím jsem ho nezkoušel, není to jen nový model ale i trošku jiný software okolo a dokud ho nezačne podporovat nějaké rozumné GUI, tak jsem na to moc líný.

    Změny:
    - dvě verze, jedna pro 512x512 obrázky, druhá pro 768x768 obrázky
    - vyměněná ta část modelu, která řeší porozumění textu: měla by být kvalitnější a přesnější, ale bude vyžadovat trochu se přeučit psát prompty
    - profiltrovaný dataset obrázků, na kterých se trénuje s cílem zvýšit kvalitu protože je tam obecně hromada bordelu (nekvalitní a blbě ořezané obrázky či vyloženě nesmysly)
    - CENZURA. Z datasetu zmizel všechen NSFW obraz, některé celebrity a současní umělci jako třeba nonstop propíraný Greg Rutkowski.

    Na jednu stranu si tu skoro zlomyslně mnu ruce protože už mám po krk lidí na redditu co jsou furt dokola hrozně nadšení z toho jak se jim podařilo vygenerovat buchtu s pěkným obličejíkem a obříma prsama by Greg Rutkowski. Na druhou stranu tohle samozřejmě omezí i generování různejch morbidních bizárů anebo třeba obrazů ve stylu H. R. Gigera.

    Emad ze Stability AI nicméně tvrdí, že účelem tohohle (a dalších vydaných) modelů je sloužit jako základ pro další dotrénování a že mají v plánu učinit komunitní trénování snadnějším a rychlejším. Taky říká, že tímhle vyřešením celebrit a NSFW byla odšpuntovaná jejich fronta modelů k vydání a nové verze budou vycházet častěji. K tomu prvnímu jsem trochu skeptický, protože jestli dotrénovávání modelu správně chápu, tak čím víc (i méně kvalitních) dat v modelu už je, tím snadnější je ho dotrénovat k lepšímu, takže například udělat ze SFW modelu NSFW bude v tomhle případě možná výrazně náročnější, ale to asi brzo zjistíme.

    ARAON
    ARAON --- ---
    NERD
    NERD --- ---
    A self-portrait of the artist. Music generated with Open AI Jukebox and stitched together in Garageband. Video produced with a green-screen and Deforum Stable Diffusion 2.

    I am the Wizardhead
    https://youtu.be/u6Y5bxGfcIk
    VOZKA
    VOZKA --- ---
    Týpek natrénoval model na svých vlastních fotkách bouří a teď si jím zdá se generuje nové a netušené atmosférické jevy:

    VOZKA
    VOZKA --- ---
    Tak ještě jeden post z redditu který mě zaujal. Tentokrát jakési staré nalezené fotografie neznámého původu.













    OMN
    OMN --- ---
    objasnil by mi prosim nekdo, na co ma nova verze dezgo dva posuvniky? Strength a guidance. Asi tomu nerozumim, protoze mi dava smysl mit guidance na maximum
    VOZKA
    VOZKA --- ---
    Stable Diffusion subreddit je většinou plnej nevkusnejch píčovin, ale tohle mě docela zaujalo. Takovej surrealistickej Americana styl, a přitom s překvapivou mírou fotorealismu.










    KAMAHL
    KAMAHL --- ---
    PRAASHEK: jsem našel na twitteru nevím, spíš pobavilo. údajně stable diffusion, prompt nevím
    PRAASHEK
    PRAASHEK --- ---
    KAMAHL: AI type? Prompt words?
    KAMAHL
    KAMAHL --- ---
    Tenistka

    MATT
    MATT --- ---
    “Too easy”—Midjourney tests dramatic new version of its AI image generator | Ars Technica
    https://arstechnica.com/information-technology/2022/11/midjourney-turns-heads-with-quality-leap-in-new-ai-image-generator-version/
    LAUNCHER
    LAUNCHER --- ---
    MATT: Neni jak si to spustit a overit. Jestli to spravne chapu, tak je zatim verejne k dispozici pouze nasledujici.

    Jednoducha webova stranka:

    eDiffi: Text-to-Image Diffusion Models with Ensemble of Expert Denoisers
    https://deepimagination.cc/eDiffi/

    White paper:

    https://arxiv.org/pdf/2211.01324.pdf

    YT kanal, aktualne ma 2 videa:

    https://www.youtube.com/channel/UCiT6KOdrOaVUzJ_P-I6Cp0w/videos
    MATT
    MATT --- ---
    Nvidia's eDiffi is an impressive alternative to DALL-E 2 or Stable Diffusion
    https://the-decoder.com/nvidias-ediffi-is-an-impressive-alternative-to-dall-e-or-stable-diffusion/
    PRAASHEK
    PRAASHEK --- ---
    LAUNCHER: jak nesmyslné? Jasně, někumu může připadat nesmyslné, že se puhnnckeo bipe řeší už druhý týden v US kongresu, ale je to vážné bezpečnostní riziko! A bunc song botten přispěl svého času k zlepšení nálady nejenom na blízkém východě.
    KID_MCHUTT
    KID_MCHUTT --- ---
    CDR: ale je fakt, že jsem ještě nezkoušel takové věci, jako kombinovat prompty, to by nemuselo být špatné - a mám starší verzi toho stable diffusion. Což snad půjde snadno napravit.
    LAUNCHER: to je promptem - stable diffusion to dělá, když je prompt krátký nebo málo popisný
    LAUNCHER
    LAUNCHER --- ---
    VOZKA: Mne tam mrzi to co je videt i na Tvych pics. Ty nesmyslne texty pres obrazky.
    VOZKA
    VOZKA --- ---
    Řekl jsem si, že zkusím vytvořit něco ve stylu tohohle memu, jestli to je fakt tak špatný: KAMAHL
    A alespoň s verzí 1.5 a tím novým CLIPem nebo čím bych se musel hodně snažit. Stále je běžné, že má ruka 6 prstů (či jiné počty), ale nic takhle hodně rozbitýho jsem nedostal. Když jsem zkoušel keywordy jako "mangled, morbid, mutated", obdržel jsem tyhle dobře vychované ghůly:




    Když jsem je někomu posílal, reakce byla že je hezké, že učím umělou inteligenci zdvořilosti. Tak jsem logicky začal zkoušet, co vyplivne prompt "fucking asshole shouting at you". Překvapilo mne, že SD na tenhle prompt generuje výhradně nějaká image makra:

    __


    Zkusil jsem k promptu přidat "punchable face" a zřejmě rozumí i tomu:

    __


    (pokud do negative promptu dáte "meme, text, image macro", tak to zhruba polovinu obrázků už vygeneruje bez textu, ale to není tak humorné)
    LAUNCHER
    LAUNCHER --- ---
    MATT: Tohle je snaha o povedeny a pricetny asistent. Kterou tez vitam.

    Ale nize jsem mel na mysli asistenta z pekla, ktery volajici s nevyzadanymi reklamnimi hovory co nejdele zdrzi a otravi. Neco na tenhle zpusob:

    Old Lady Makes Tech Scammer Lose Her Mind
    https://www.youtube.com/watch?v=3Tx5D8T-N2Y
    Kliknutím sem můžete změnit nastavení reklam