• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    SIRLOONAI modely - OpenAI, Google, Anthropic, Meta, Microsoft a dalsi
    Diskuze o modelech znamych i neznamych firem.
    Ktery model se vyplati vic? Jak si deploynout vlastni LLM nebo model zamereny na specificke akce?
    Vibe coding a dalsi nesmysle spojene s AI, co nam maji udajne pomoc, ale ve vysledku jsou spise pritezi.
    rozbalit záhlaví
    JARDABEREZA
    JARDABEREZA --- ---
    LAUNCHER: Tehle tam mám: https://www.amd.com/en/products/processors/laptop/ryzen/ai-300-series/amd-ryzen-ai-9-hx-370.html ...specifikace uvádí až 256GB ram, ale musel bych to dát do dvou slotů, ale takové ram se nevyrábí zatím. A nic není připájené.

    Spíš jsem si říkal, až zlevní RAM, zkusím co to zvládne. A třeba nebudu muset pálit tolik kreditů na programování :-D
    LAUNCHER
    LAUNCHER --- ---
    JARDABEREZA:

    Ad 2


    Rec je predpokladam o AMD Strix Halo, tzn max 128GB soldered RAM.

    Tu si v biosu "rozdelis" mezi "VRAM" a "RAM" pro OS. Nasledne doufas, ze se tohle rozdeleni tolik neresi. Nejdriv tohle nefungovalo vubec a respektovalo se nastaveni, pak se to zacalo lepsit, nevim kde to ted je.

    Nicmene... Na Strix Halo je zoufala rychlost pameti, jen ~256GB/s. A rychlost inference je primo umerna rychlosti pameti. Pro me ucely bych nemel nervy cekat na lokalni model s inferenci pod 50t/s, ale nazory a potreby se ruzni. V pricetnych testech litaly pro Strix Halo cisla i pod 10t/s, nerozumim vyuziti, ale co ja vim. Jeste vyraznejsi je to na modernich LLM s thinking thread, kdy budes ukrutne dlouho cekat nez dobehne thinking.

    Pokud to ma byt alespon trosku rychle na Strix Halo, rozhodne budes muset mit MoE (Mixture of Experts) model, tzn dotazuje se to jen casti modelu, ne celeho.

    Pro predstavu ja silne preferuji MoE i na moji NV 5090, coz ma 7* rychlejsi pamet. I ta je ale pro ucely LLM stale prilis pomala, ve srovnani s HBM, coz je pro AI Industry standard z velmi dobrych duvodu.


    Ad 1


    Nevim co presne se skryva pod "umí výborně češtinu". Jestli to ma generovat krasne ceske texty, spravne resit CERMAT zkousky z cestiny, nebo jen reagovat na cesky psane prikazy?

    Pro ~100GB se nabizi, napr.:

    Qwen 3.5 122b pripadne dalsi z Qwen rodiny
    Llama 4 Scout 109B
    GPT OSS 120b
    Nemotron 3 Super 120B
    atd atd atd

    Jestli nakup HW teprve zvazujes, tak ty modely si predem muzes vyzkouset v cloudu za par penez.

    --
    Pro predstavu, Gemma 4 26b MoE, zabira mi to ve VRAM 29GB pri maximalnim kontextu 262144 tokens.

    Kvalita odpovedi je misty dost hrozna, proste ten model je "26b komprese Gemini", ale na tyhle ucely to nemam...
    --
    Prompt:

    Stáhni si tento článek:

    Národní divadlo – Wikipedie
    https://cs.wikipedia.org/wiki/N%C3%A1rodn%C3%AD_divadlo

    Napiš shrnutí, 500 slov.

    Response:

    Zde je shrnutí článku o Národním divadle, které zachycuje jeho historický význam, architekturu i kulturní roli.

    Národní divadlo: Symbol české národní identity
    Národní divadlo v Praze není pouze prestižní hudební a dramatickou institucí; je to především hluboce zakořeněný symbol českého národního obrození a pilíř české kulturní identity. Jeho historie a samotná existence jsou úzce spjaty s bojem o kulturní nezávislost českých zemí v 19. století, kdy se divadlo stalo prostředkem pro upevnění českého jazyka a tradic v době nadvlády rakouské kultury.

    Historický kontext a vznik
    Základní kameny pod budowę divadla byly položeny v období, kdy se český národ snažil o vlastní politickou i kulturní suverenitu. Klíčovým momentem byla iniciativa vyvolaná potřebou mít vlastní scény pro český repertoár. Financování budovy bylo unikátním projevem národní solidarity – nepocházelo ze státního pokladny, ale díky masivní veřejné sbírce. Do projektu přispěly všechny vrstvy společnosti, od šlechty a bohatých průmyslníků až po chudé občany, což z procesu výstavby učinilo národní projekt. Slavnostní otevření budovy proběhlo v roce 1883 a stalo se triumfálním momentem pro celé české národobuditelství.

    Architektura a interiér
    Architektonický záměr byl svěřeno významnému architektovi Josefovi Zítkovi, který navrhl budovu v reprezentativním neo-renesančním stylu. Budova byla strategicky umístěna na prestižní lokalitě u Vltavy. Interiér Národního divadla je mistrovským dílem s bohatou a symbolickou dekorací. Celý prostor je prostladen uměleckými prvky, které oslavují českou historii a mytologii. Zvláštní pozornost si zaslouží zdobná malovaná stanová stropová pole a sochařská výzdoba, která vytváří monumentální a důstojný atmosféru vhodnou pro nejvyšší umělecké projevy.

    Struktura a umělecký repertoár
    Současné Národní divadlo není jednotným souborem, ale komplexním kulturním centrem, které zahrnuje několik klíčových složek: Divadelní soubor Drama, Divadelní soubor Opera a Divadelní soubor Balet. Tato rozmanitost umožňuje divadlu pokrývat široké spektrum žánrů – od klasických Shakespearovských dramat a tragédií přes operní díla světové velikosti až po moderní baletní choreografie. Repertoár je pečlivě konstruován tak, aby udržoval respekt k tradici (inscenace historických děl) a zároveň reflektoval současné světové i domácí umělecké trendy.

    Význam v současnosti
    Národní divadlo dnes plní roli ambasadora české kultury jak na domácí, tak na mezinárodní scéně. Přestože se musí vypořádovat s moderními výzvami, jako je digitalizace nebo silná konkurence jiných forem volnočasových aktivit, si udržuje svou pozici prestižního centra umění. Je to místo, kde se historická památka setkává s živým, neustále se vyvíjejícím uměním, a zůstává nezastupitelnou součástí kulturního dědictví České republiky.

    --
    Prompt: Napiš mi krátký příběh na 500 slov. Téma je příprava na zkoušku.

    Response:

    Kolem třetí ráno se svět zmenšil na rozměry pracovního stolu Adama. Jediným zdrojem světla byla studená LED lampička, která vrhala ostrý kužel do prostoru nad hromadou rozházených poznámek, rozepsaných příruček a prázdných plechovek od energetických nápojů. Všechno ostatní – byt, ulice, město – už dávno zaniklo v neprostupné temnotě noci.

    Adam cítil, že jeho mozek připomíná suchou houbu. Pokusil se přečíst si poslední odstavec o makroekonomických modelech, ale slova se mu pod očima začala rozmazávat a tančit. Jedno za druhým se mu v hlavě vracela ta stejná panická myšlenka: „Už to neuložíš. Všechno jsi zapomněl.“

    Zhluboka vydechl a opřel si čelo o chladnou dlaň. V pokoji bylo ticho, které až bolelo v uších. Bylo to ticho plné neustálého tikání hodin na stěně, které mu připomínalo, že každá minuta je neúvrratelná ztráta. Každý zvuk – šustění listů, vzdálené houknutí auta, jeho vlastní těžký dech – zněl v této izolaci nepřirozeně hlasitě.

    Zkusil si vzpomenout na to, co si četl před hodinou. Model nabídky a poptávky? Ano, něco tam bylo. Ale proč se ty grafy nyní zdály jako šifra od neznámého agenta?

    Vytáhl telefon, aby zkontroloval čas, ale místo toho narazil na zářící notifikaci ze skupiny spolužálů. „Kdo už má hotovou kapitolu čtyři? Já už jsem v totálním kolabsu.“ Krátká odpověď od někoho jiného: „Taky. Už nevidím ani na vlastní prsty.“

    Adam se na chvíli zastavil. Nebyl v tom sám. Tato kolektivní noční nesnáze, toto sdílené utrpení studentů před finální zkouškou, mu dodalo malou, nepatrnou dávku odvahy. Nebyla to radost, byla to spíš suchá, unavená sounáležitost.

    Zavřel oči a na minutu se vzdal. Nechtěl studovat. Chtěl jen spát – ten typ spánku, který vás vymaže a znovu složí zpět do funkčního člověka. Ale pak si představil ten pohled profesora, tu stručnou větu: „Zkuste to lépe.“

    Otevřel oči. Popadl tučnou fixu, vzal do druhé ruky zvýrazňovač a s novou, byť stále křehkou energií, začal znovu. Nezačal celou knihou. Začal jednou, jedinou větou. Jediným termínem.

    „Inflace je...“ začal šeptat nahlas, aby si svou vlastní pozornost udržel v postoji. „Inflace je proces zvyšování úrovně všeobecné cenové úrovně...“

    Postupně se svět kolem něj opět začal zmenšovat, ale tentokrát už to nebylo tak děsivé. Zmenšil se na jednu větu, pak na jeden graf, pak na jeden vzorec. Boj s nocí pokračoval, ale Adam už nebyl jen obětí času. Byl jeho protivníkem, který se rozhodl zůstat na hradě ještě o jednu hodinu déle.

    Venku začínalo šedivět. První paprsek svítání dopadl na okno a Adam, s očima rudýma od únavy, poprvé za tu noc skutečně polknul. Kapitola čtyři byla hotová.
    RUTHER
    RUTHER --- ---
    Anthropic says Claude Code subscribers will need to pay extra for OpenClaw usage
    It’s about to become more expensive for Claude Code subscribers to use Anthropic’s coding assistant with OpenClaw and other third-party tools.
    Anthropic says Claude Code subscribers will need to pay extra for OpenClaw usage | TechCrunch
    https://techcrunch.com/2026/04/04/anthropic-says-claude-code-subscribers-will-need-to-pay-extra-for-openclaw-support
    SIRLOON
    SIRLOON --- ---
    JARDABEREZA: jak uz bylo odpovezeno, do 100GB se vejdes i s qwenem 3 nebo 3.5. Popravde sem mezi nima nenasel zadnej extra velkej rozdil, co se tyce cestiny. Pouzivam jako test vypsani vyjmenovanych slov po P a vetny rozbor nejakeho delsiho souveti se dvema hlavnima vetama a vetou vedlejsi.
    Na me amd rx6600 si moc vyskakovat nemuzu, tak mam 70 GB normalni ram 🤷‍♂️
    JARDABEREZA
    JARDABEREZA --- ---
    MORPHLER: Mám Framework laptop a myslím, že ten už to dělá: https://community.frame.work/t/allocating-ram-to-gpu-on-amd-370/75965 CPU používá RAM jako unified memory. Oproti Apple má Framework tu výhodu, že za 5 minut jsem schopný si tam našroubovat jinou RAMku :-D
    MORPHLER
    MORPHLER --- ---
    MORPHLER: prehled nekterych modelu... https://ollama.com/search
    MORPHLER
    MORPHLER --- ---
    JARDABEREZA: 1) to vyborne je relativni, ale imho uz 8B modely cestinu doceal davaji. nabizi se treba 80B (50GB) qwen3 next ale jinak asi budes odkazan spise na 30-40B modely. mozna rozjedes i o neco vetsi model s MoE co aktivuje jen nektere experty
    ad 2) nevim jak amd, ale ollama umi k graficke navic vyuzivat i systemovou pamet. vysledek je samozrejme znatlene (az nepouzitelne) pomalejsi, ale rozjedes modely ktere bys jinak do pameti nedal. rozhodne kvuli archtekture jsou jablecne M1-M4 schopne spustit a bezet mnohem vetsi modely, jestli to plati pro nove amd nevim, ale byly by to super.
    JARDABEREZA
    JARDABEREZA --- ---
    Dvě otázky:
    1) Existují nějaký model do 100GB, který umí výborně češtinu?
    2) Chápu to správně, že nové procesory AMD si umí sáhnout na RAM, jako kdyby to byla VRAM, takže teoreticky při 2×64GB si můžu alokovat 100GB na VRAM?
    QWWERTY
    QWWERTY --- ---
    MONKEYFIGHTER: "motivovany uzivatelema prislusnejch agentu"
    spousta z nich ale nebyli "uzivatele agentu" ale proste lidi vydavajici se za AI agenty, kteri psali prispevky "manualne"
    viz [VOYTEX @ Artificial Intelligence AI]
    MONKEYFIGHTER
    MONKEYFIGHTER --- ---
    MORDINO: “Se ukazalo” Tak jako to ze posty na moltbooku jsou primarne motivovany uzivatelema prislusnejch agentu je asi jasny uz od zacatku kazdymu kdo tusi jak to funguje, na to nebyla uplne potreba nejaka velka detektivni prace.
    MORDINO
    MORDINO --- ---
    HIROSS: koupila to Meta a ve finále se ukázalo že většinu postů tam psali místo AI lidi :-)
    SIRLOON
    SIRLOON --- ---
    HARVIE: delal sem podobny research, ale ja se zameril primo na modely, co mely napsano ze sou code. Tam sem se pak vesel do 16GB ale pri pouzivani AnythingLM i llamacpp se mi obcas “odpojila”grafarna a musel sem stelovat nastaveni vyuziti karty aby to jelo bez problemu
    HARVIE
    HARVIE --- ---
    Zkousel jsem ve skriptech pouzivat lokalni LLM, je to nejaka vedlejsi automatizace na automatickou analyzu kodu v gitlabu (jen na CPU bez akcelerace), tak jsem hledal modely do ollamy kolem 1GB RAM, protoze primarni cil byl nevytezovat moc server. Z toho duvodu jsem v ollama zakazal thinking, aby ty skripty bezely rychlejc. Daval jsem modelum na analyzu skript se zamerne pridanou napadnou bezpecnostni hrozbou a sledoval jestli ji dokazou rozpoznat. Udelal jsem si takovej ciste subjektivni zebricek od nejlepsiho s komentarema ke kvalite vystupu:

    #Modely razene od nejlepsiho
    #MODEL: qwen2.5-coder:1.5b #tak akorat ukecany a chytry programator
    #MODEL: gemma3:1b #tak akorat ukecany a chytry
    #MODEL: llama3.2 #tak akorat ukecany, chytry, ale ne moc analyticky, neni to specialista na programovani
    #MODEL: deepseek-r1:1.5b #strucny, malo vecny, filozoficky-excentricky, umi najit zajimave souvislosti
    #Nasledujici se moc neosvedcily:
    #MODEL: qwen3.5:0.8b #prilis ukecany chytry
    #MODEL: qwen3:1.7b #prilis ukecany ne moc chytry
    #MODEL: llama3.2:1b #ne moc chytry
    #MODEL_RUN: ollama run ${MODEL} --hidethinking --think=false

    Ty prvni 4 jsou docela zajimavy (na to jak jsou maly) a stejny modely maj i vetsi varianty. Myslim, ze nekde v rozmezi 5-16GB RAM by se naslo neco fakt uzitecnyho na kazdodenni praci.
    Vsechny uvedeny modely a jejich alternativni varianty je mozny dohledat na https://ollama.com/search
    HIROSS
    HIROSS --- ---
    Uvnitř první AI sociální sítě se děje něco tajemného
    https://www.youtube.com/watch?v=VLc_Mf5myCc
    SIRLOON
    SIRLOON --- ---
    QWWERTY: v tom pripade to asi bude omyl, pac sem hledal ruzna jmena diskuzi a fakt sem je nenasel. ale primarne sem doufal, ze budu resit lokalni vytvareni LLM a zkusenosti s nima
    QWWERTY
    QWWERTY --- ---
    rozdil zamereni threadu oproti
    [Artificial Intelligence AI]
    [Vibe coding]
    ?
    TORI
    TORI --- ---
    Vítejte a ať se vám tu líbí.

    Můžete pozvat své přátele.
    Kliknutím sem můžete změnit nastavení reklam