AI modely - OpenAI, Google, Anthropic, Meta, Microsoft a dalsi

QWWERTY --- --- 13:08:22 8.5.2026

zkouseli jste nekdo interfacovat Ollamu s VSCode Copilotem?
model je Capabilities: completion, vision, tools, thinking ...ale porad se mi nedari ho dokopat, aby pouzival ty tools spravne
se samotnym modelem imho problem nebude. v Cline tool calling funguje - jak nacitani, tak editace souboru. ale Cline na naprosto otresne UI/UX :D

e.g. Cline vs VS Copilot

MAZDA --- --- 9:19:28 11.4.2026

1 odpověď

DUHOS: Soukromá sféra, vyplňování žádostí o povolení. Tam je zhruba 80 % informací vždycky stejných a liší se jen pár položek. To by si mohl model natáhnout z podkladové faktury.

Právě bezpečnost je jedna z otázek. Zatím si to představuji tak, že já se přihlásím do systému a pustím model k vyplnění jen těch formulářů. Takže žádný přístup k přihlášení (i když je 2 fázové).

Další otázkou jsou zápisy do evidenčního systému, kde policie k tomu snad dokonce má API, ale tam je to trochu složitější v tom, že je víc druhů zápisu, respektive různé úkoly. Ale asi tak nic, co by nešlo napromptovat.

MAZDA --- --- 14:24:07 10.4.2026

2 odpovědi +1

Řešil jste tu někdo model/asistenta na administrativní činnosti? Vyplňování formulářů podle opakujícího se zadání, například?

MORPHLER --- --- 15:35:28 8.4.2026

1 odpověď

DUHOS: muzes rozvest "že mám všechna data u sebe"? ja to chapu tak ze vse neustale pres API posilas (vzdy kdyz s tim agent pracuje) antrhropicu nebo nekomu, nebo to mas napojene na lokalne bezici model?

LAUNCHER --- --- 0:15:44 8.4.2026

1 odpověď +1

JARDABEREZA:

Ad 2

Rec je predpokladam o AMD Strix Halo, tzn max 128GB soldered RAM.

Tu si v biosu "rozdelis" mezi "VRAM" a "RAM" pro OS. Nasledne doufas, ze se tohle rozdeleni tolik neresi. Nejdriv tohle nefungovalo vubec a respektovalo se nastaveni, pak se to zacalo lepsit, nevim kde to ted je.

Nicmene... Na Strix Halo je zoufala rychlost pameti, jen ~256GB/s. A rychlost inference je primo umerna rychlosti pameti. Pro me ucely bych nemel nervy cekat na lokalni model s inferenci pod 50t/s, ale nazory a potreby se ruzni. V pricetnych testech litaly pro Strix Halo cisla i pod 10t/s, nerozumim vyuziti, ale co ja vim. Jeste vyraznejsi je to na modernich LLM s thinking thread, kdy budes ukrutne dlouho cekat nez dobehne thinking.

Pokud to ma byt alespon trosku rychle na Strix Halo, rozhodne budes muset mit MoE (Mixture of Experts) model, tzn dotazuje se to jen casti modelu, ne celeho.

Pro predstavu ja silne preferuji MoE i na moji NV 5090, coz ma 7* rychlejsi pamet. I ta je ale pro ucely LLM stale prilis pomala, ve srovnani s HBM, coz je pro AI Industry standard z velmi dobrych duvodu.

Ad 1

Nevim co presne se skryva pod "umí výborně češtinu". Jestli to ma generovat krasne ceske texty, spravne resit CERMAT zkousky z cestiny, nebo jen reagovat na cesky psane prikazy?

Pro ~100GB se nabizi, napr.:

Qwen 3.5 122b pripadne dalsi z Qwen rodiny
Llama 4 Scout 109B
GPT OSS 120b
Nemotron 3 Super 120B
atd atd atd

Jestli nakup HW teprve zvazujes, tak ty modely si predem muzes vyzkouset v cloudu za par penez.

--
Pro predstavu, Gemma 4 26b MoE, zabira mi to ve VRAM 29GB pri maximalnim kontextu 262144 tokens.

Kvalita odpovedi je misty dost hrozna, proste ten model je "26b komprese Gemini", ale na tyhle ucely to nemam...
--
Prompt:

Stáhni si tento článek:

Národní divadlo – Wikipedie
https://cs.wikipedia.org/wiki/N%C3%A1rodn%C3%AD_divadlo

Napiš shrnutí, 500 slov.

Response:

Zde je shrnutí článku o Národním divadle, které zachycuje jeho historický význam, architekturu i kulturní roli.

Národní divadlo: Symbol české národní identity
Národní divadlo v Praze není pouze prestižní hudební a dramatickou institucí; je to především hluboce zakořeněný symbol českého národního obrození a pilíř české kulturní identity. Jeho historie a samotná existence jsou úzce spjaty s bojem o kulturní nezávislost českých zemí v 19. století, kdy se divadlo stalo prostředkem pro upevnění českého jazyka a tradic v době nadvlády rakouské kultury.

Historický kontext a vznik
Základní kameny pod budowę divadla byly položeny v období, kdy se český národ snažil o vlastní politickou i kulturní suverenitu. Klíčovým momentem byla iniciativa vyvolaná potřebou mít vlastní scény pro český repertoár. Financování budovy bylo unikátním projevem národní solidarity – nepocházelo ze státního pokladny, ale díky masivní veřejné sbírce. Do projektu přispěly všechny vrstvy společnosti, od šlechty a bohatých průmyslníků až po chudé občany, což z procesu výstavby učinilo národní projekt. Slavnostní otevření budovy proběhlo v roce 1883 a stalo se triumfálním momentem pro celé české národobuditelství.

Architektura a interiér
Architektonický záměr byl svěřeno významnému architektovi Josefovi Zítkovi, který navrhl budovu v reprezentativním neo-renesančním stylu. Budova byla strategicky umístěna na prestižní lokalitě u Vltavy. Interiér Národního divadla je mistrovským dílem s bohatou a symbolickou dekorací. Celý prostor je prostladen uměleckými prvky, které oslavují českou historii a mytologii. Zvláštní pozornost si zaslouží zdobná malovaná stanová stropová pole a sochařská výzdoba, která vytváří monumentální a důstojný atmosféru vhodnou pro nejvyšší umělecké projevy.

Struktura a umělecký repertoár
Současné Národní divadlo není jednotným souborem, ale komplexním kulturním centrem, které zahrnuje několik klíčových složek: Divadelní soubor Drama, Divadelní soubor Opera a Divadelní soubor Balet. Tato rozmanitost umožňuje divadlu pokrývat široké spektrum žánrů – od klasických Shakespearovských dramat a tragédií přes operní díla světové velikosti až po moderní baletní choreografie. Repertoár je pečlivě konstruován tak, aby udržoval respekt k tradici (inscenace historických děl) a zároveň reflektoval současné světové i domácí umělecké trendy.

Význam v současnosti
Národní divadlo dnes plní roli ambasadora české kultury jak na domácí, tak na mezinárodní scéně. Přestože se musí vypořádovat s moderními výzvami, jako je digitalizace nebo silná konkurence jiných forem volnočasových aktivit, si udržuje svou pozici prestižního centra umění. Je to místo, kde se historická památka setkává s živým, neustále se vyvíjejícím uměním, a zůstává nezastupitelnou součástí kulturního dědictví České republiky.

--
Prompt: Napiš mi krátký příběh na 500 slov. Téma je příprava na zkoušku.

Response:

Kolem třetí ráno se svět zmenšil na rozměry pracovního stolu Adama. Jediným zdrojem světla byla studená LED lampička, která vrhala ostrý kužel do prostoru nad hromadou rozházených poznámek, rozepsaných příruček a prázdných plechovek od energetických nápojů. Všechno ostatní – byt, ulice, město – už dávno zaniklo v neprostupné temnotě noci.

Adam cítil, že jeho mozek připomíná suchou houbu. Pokusil se přečíst si poslední odstavec o makroekonomických modelech, ale slova se mu pod očima začala rozmazávat a tančit. Jedno za druhým se mu v hlavě vracela ta stejná panická myšlenka: „Už to neuložíš. Všechno jsi zapomněl.“

Zhluboka vydechl a opřel si čelo o chladnou dlaň. V pokoji bylo ticho, které až bolelo v uších. Bylo to ticho plné neustálého tikání hodin na stěně, které mu připomínalo, že každá minuta je neúvrratelná ztráta. Každý zvuk – šustění listů, vzdálené houknutí auta, jeho vlastní těžký dech – zněl v této izolaci nepřirozeně hlasitě.

Zkusil si vzpomenout na to, co si četl před hodinou. Model nabídky a poptávky? Ano, něco tam bylo. Ale proč se ty grafy nyní zdály jako šifra od neznámého agenta?

Vytáhl telefon, aby zkontroloval čas, ale místo toho narazil na zářící notifikaci ze skupiny spolužálů. „Kdo už má hotovou kapitolu čtyři? Já už jsem v totálním kolabsu.“ Krátká odpověď od někoho jiného: „Taky. Už nevidím ani na vlastní prsty.“

Adam se na chvíli zastavil. Nebyl v tom sám. Tato kolektivní noční nesnáze, toto sdílené utrpení studentů před finální zkouškou, mu dodalo malou, nepatrnou dávku odvahy. Nebyla to radost, byla to spíš suchá, unavená sounáležitost.

Zavřel oči a na minutu se vzdal. Nechtěl studovat. Chtěl jen spát – ten typ spánku, který vás vymaže a znovu složí zpět do funkčního člověka. Ale pak si představil ten pohled profesora, tu stručnou větu: „Zkuste to lépe.“

Otevřel oči. Popadl tučnou fixu, vzal do druhé ruky zvýrazňovač a s novou, byť stále křehkou energií, začal znovu. Nezačal celou knihou. Začal jednou, jedinou větou. Jediným termínem.

„Inflace je...“ začal šeptat nahlas, aby si svou vlastní pozornost udržel v postoji. „Inflace je proces zvyšování úrovně všeobecné cenové úrovně...“

Postupně se svět kolem něj opět začal zmenšovat, ale tentokrát už to nebylo tak děsivé. Zmenšil se na jednu větu, pak na jeden graf, pak na jeden vzorec. Boj s nocí pokračoval, ale Adam už nebyl jen obětí času. Byl jeho protivníkem, který se rozhodl zůstat na hradě ještě o jednu hodinu déle.

Venku začínalo šedivět. První paprsek svítání dopadl na okno a Adam, s očima rudýma od únavy, poprvé za tu noc skutečně polknul. Kapitola čtyři byla hotová.

MORPHLER --- --- 9:26:37 31.3.2026

2 odpovědi

JARDABEREZA: 1) to vyborne je relativni, ale imho uz 8B modely cestinu doceal davaji. nabizi se treba 80B (50GB) qwen3 next ale jinak asi budes odkazan spise na 30-40B modely. mozna rozjedes i o neco vetsi model s MoE co aktivuje jen nektere experty
ad 2) nevim jak amd, ale ollama umi k graficke navic vyuzivat i systemovou pamet. vysledek je samozrejme znatlene (az nepouzitelne) pomalejsi, ale rozjedes modely ktere bys jinak do pameti nedal. rozhodne kvuli archtekture jsou jablecne M1-M4 schopne spustit a bezet mnohem vetsi modely, jestli to plati pro nove amd nevim, ale byly by to super.

JARDABEREZA --- --- 21:27:36 30.3.2026

3 odpovědi

Dvě otázky:
1) Existují nějaký model do 100GB, který umí výborně češtinu?
2) Chápu to správně, že nové procesory AMD si umí sáhnout na RAM, jako kdyby to byla VRAM, takže teoreticky při 2×64GB si můžu alokovat 100GB na VRAM?

HARVIE --- --- 18:30:21 4.3.2026

1 odpověď +2

Zkousel jsem ve skriptech pouzivat lokalni LLM, je to nejaka vedlejsi automatizace na automatickou analyzu kodu v gitlabu (jen na CPU bez akcelerace), tak jsem hledal modely do ollamy kolem 1GB RAM, protoze primarni cil byl nevytezovat moc server. Z toho duvodu jsem v ollama zakazal thinking, aby ty skripty bezely rychlejc. Daval jsem modelum na analyzu skript se zamerne pridanou napadnou bezpecnostni hrozbou a sledoval jestli ji dokazou rozpoznat. Udelal jsem si takovej ciste subjektivni zebricek od nejlepsiho s komentarema ke kvalite vystupu:

#Modely razene od nejlepsiho
#MODEL: qwen2.5-coder:1.5b #tak akorat ukecany a chytry programator
#MODEL: gemma3:1b #tak akorat ukecany a chytry
#MODEL: llama3.2 #tak akorat ukecany, chytry, ale ne moc analyticky, neni to specialista na programovani
#MODEL: deepseek-r1:1.5b #strucny, malo vecny, filozoficky-excentricky, umi najit zajimave souvislosti
#Nasledujici se moc neosvedcily:
#MODEL: qwen3.5:0.8b #prilis ukecany chytry
#MODEL: qwen3:1.7b #prilis ukecany ne moc chytry
#MODEL: llama3.2:1b #ne moc chytry
#MODEL_RUN: ollama run ${MODEL} --hidethinking --think=false

Ty prvni 4 jsou docela zajimavy (na to jak jsou maly) a stejny modely maj i vetsi varianty. Myslim, ze nekde v rozmezi 5-16GB RAM by se naslo neco fakt uzitecnyho na kazdodenni praci.
Vsechny uvedeny modely a jejich alternativni varianty je mozny dohledat na https://ollama.com/search

Kliknutím sem můžete změnit nastavení reklam

přezdívka
heslo


pamatuj si mě
registrace
ztracené heslo?