BRAMBOREENA: taky to tady zkouším, obměňuju a upravuju prompty, ale zaseknu se pokaždé v bodě, kdy to nepochopí věci, které jsou netradiční, zcela evidetně mimo tréninková data.
Obrazovým AI pořád chybí opravdové pochopení vstupu a hlavně kontextu. ChatGPT se svým jazykovým modelem se dá už celkem solidně dokopat k tomu, aby dělal, co chci. Upravím mu osobnost, styl, dostanu lepší odpovědi. Ve spojení s DALL-E se z toho pak dají vymáčknout i zajímavé obrazové výstupy (mám uložené vlákno, kde postupně vytváří a obměňuje obrázek svatého Martina).
Limit je v momentě, kdy po AI chci věci, které jsou úplně nové, které ještě nikdo nenapsal, nevytvořil (nebo ne v době, kdy vznikl soubor tréninkových dat). LLM, potažmo ChatGPT ještě jakž takž přesvědčím díky tomu, že celkem chápe a udržuje kontext v rámci debaty (zejména ChatGPT 4), jakmile to ale chci v obrazu, tak mám smůlu. Nechápe, co to znamená ucho, nechápe, co to je nos, natož věci, které jsou komplexní a úplně jiné. Občas z toho vypadne obrázek, který se docela trefí nebo aspoň vypadá zajímavě, ale vytváření úplně nových věcí nejde. Vždy z toho vypadne jen permutace něčeho, co už někdo někdy vytvořil. Změní se styl, pojetí, rozmístění, ale nevznikne nic úplně nového a jiného.
Začínám s tím trochu koketovat už pracovně, zatím jen lehce. Vidím v tom zcela jednoznačně budoucnost mnoha a mnoha oborů, určitě ten, kdo se naučí tyhle nástroje používat, bude mít možnost dělat svou práci snadněji nebo ve větší šířce. Ale samospasitelné to pochopitelně není a nebude. Přirovnal bych to k rozdílu toho, jestli budu kopat výkop ručně nebo jestli se naučím obsluhovat bagr a udělám víc a rychleji (přirovnání kulhá pochopitelně na všechny tři nohy, které AI umí postavám vykreslit).
Hraju si tu teď s Akkütlixem. Chci hmyzího boha v gotickém chrámu ze skla, oceli a černého kamene. Mám různé pavouky, vosy v kancelářských a nádražních halách, oltáře se nedaří.
Ještě si sem dovolím hodit video, jak to ta midjourney generuje... je to samo o sobě fascinující, jak to vzniká.
Typicky to jsou čtyři různé obrázky, různě pojaté. Pokud tam nevnutím tzv. seed, tak je generování pokaždé úplně jiné. Je to strašně zvláštní nástroj, výsledky jsou ve většině případů nepředvídatelné, drobná změna v promptu změní úplně kompletně všechno.