• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    HNIZDOnVIDIA - grafické karty, technologie, aplikace, hry
    Informace o grafických kartách nVidia - benchmarky, recenze, zkušenosti, přetaktování, chlazení, ovladače, hry, akcelerované aplikace.
    Cyberpunk2077 - technická stránka a nastavení, gameplay. Důvodem je svévolné a neodůvodněné omezení přispívání moderátorem do původního fóra.

    PhysX
    CUDA, vývoj

    Ovladače: nVidia download

    NVCUVENC dll download

    Trolling, OT a napadání se odměňují zahnutým ovocem.
    rozbalit záhlaví
    LAUNCHER
    LAUNCHER --- ---
    RUDOLF: MacBook Pro jde nakonfigurovat na 128 GB, jako vždycky.

    Na podzim bude nejspíš uvedené Apple Studio M5 Ultra 512 GB. Mmnt pro Studio koukáš na doprodeje M4, M3 - vyšší konfigurace jsou už nejspíš vyprodané.
    RUDOLF
    RUDOLF --- ---
    LAUNCHER: nice.. to vypadá už hodně použitelně. ale 400k je furt moc na hobby projekt..

    Vtipný, apple už nejde nakonfigurovat na 512 GB:-(( Čekal jsem, že Apple zdraží. Ale oni prostě všechno omezili na 98 GB paměti..
    LAUNCHER
    LAUNCHER --- ---
    RUDOLF: Pokud by Ti stacila inference 30 toks/s a nevadilo by Ti za to zaplatit ~ 400k CZK bez dane (4* Spark DGX), tak to muzes mit uz dneska.

    Nedavno uvedeny Minimax M3. S kvalitou bys mohl byt opravdu spokojeny, mnozi pisi o tom, ze to ma vyborny coding.

    MiniMax M3 - How to Run Locally | Unsloth Documentation
    https://unsloth.ai/docs/models/minimax-m3

    MiniMax M3 : NVFP4 for Quad DGX Spark - DGX Spark / GB10 - NVIDIA Developer Forums
    https://forums.developer.nvidia.com/t/minimax-m3-nvfp4-for-quad-dgx-spark/372123/

    Bude s tim vic prace nez s 1ks M3 Ultra 512GB, ale bude to o dost rychlejsi v tech 4 kusech. DGX Spark pak skladem treba na Alza, ted maji 5ks:

    https://www.alza.cz/nvidia-dgx-spark-d13165934.htm?o=1

    LAUNCHER
    LAUNCHER --- ---
    HNIZDO: Rozumim, ale byl bych spoko se Samsung i TSMC. Verim tomu, ze jestli nekdo tohle rozlouskne, tak prave Nvidia. 3090 se vyrabela v Samsung foundry, zadny problem jsem nezanamenal.

    Velmi se ale obavam dostatku pameti pri prichodu 6090. Pral bych si 48GB, ale IMHO to bude tezke, velmi tezke.
    RUDOLF
    RUDOLF --- ---
    RUDOLF
    RUDOLF --- ---
    Tak hlavně správný krok je ta unfikace paměti pro cpu/gpu. Vlastně konec konců, koupím neco, kde bude několik stovek GB a pokud OS modely mají proti komerčním rok zpoždění, tak příští rok je první rok, kde bych nechal lokální model něco tvořit skoro nonstop. Nejde nutně o rychlost, ale cost efficiency versus tokeny. Ted me stála debug session me simulace asi $20. S codebase co plánují, bych chtěl 1m context. Preferoval bych Apple, ale netuším jestli plánuje takový stroj. Přitom ekosystém už má slušný a co plánuje je super. DGX station jsou ale na me drah a obecně než bude levná RAM, tak si roky počkáme.
    HNIZDO
    HNIZDO --- ---
    TSMC's Steep 2nm Price Hikes Could Push NVIDIA and Apple Toward Samsung, as GAA Pricing Opens the Door
    https://wccftech.com/samsung-price-advantage-over-tsmc-2nm-3nm-processes-could-pull-customers-away/

    2nm proces TSMC bude tak drahý, že se možná Nvidia pro průmyslové a Edge produkty (herní GPU) vrátí k Samsungu (2 a 3nm GAA), jehož ceny jsou podstatně příznivější, naznačují zdroje z průmyslu

    fingers crossed, jinak se nedoplatíme, nebo ani nebude za co se nedoplatit
    HNIZDO
    HNIZDO --- ---
    RUDOLF: Obojí
    LAUNCHER
    LAUNCHER --- ---
    My 5¢:

    6090 přijde nejdřív za rok, spíš až ve druhé půlce 2027. Chip bude Rubin, paměti budou buď 16x2GB (to by mě mrzelo, stejně jako 5090), nebo nV příjemně překvapí a 16x3GB, nebo 16x4GB (too good to be true).

    Cenu Nvidia nastaví podle konkurence a podle vlastní marže (segmentace trhu). Reálná konkurence v compute je dnes Google, Meta a Amazon s jejich TPU, lokálně čím dál více i Apple.

    Možná ještě jestli Microsoft přes AMD udělá nějakou variantu Xbox Helix s compute a dost paměti? Po dvou posledních generacích AMD mi to přijde jako spíš snaha MLID nahnat views, rád se v tom spletu. U MLID hrozí, že si opět vysnil varianty s více paměti, které neexistují (stejně jako to udělal s AMD 9090XT 32GB).

    Cena se nastaví na to, co trh unese. To si Nvidia bude analyzovat až blízko launch date.
    RUDOLF
    RUDOLF --- ---
    RUDOLF: první graf co jsme našel

    Video Card Price Trends - PCPartPicker
    https://pcpartpicker.com/trends/price/video-card/#gpu.chipset.geforce-rtx-5090
    RUDOLF
    RUDOLF --- ---
    HNIZDO: cenu 5090 v době uvedení na trh nebo dnes?;-)
    HNIZDO
    HNIZDO --- ---
    RUDOLF: 6090 dostupná bude, pokud dostupností myslíš o 20-30 procent vyšší cenu než 5090.
    TRAGED
    TRAGED --- ---
    MCKIDNEY: Tak nad win jsem neuvazoval ani na vteřinu :-)
    RUDOLF
    RUDOLF --- ---
    Hmm.. já dost přemýšlím, jak zvolím strategii na svůj domácí hobby gaming projekt. Vlastně bych chtěl jet LLM defakto 24h denně. Pokud dám 100$ měsíčně na tokeny tak v pohodě, pokud 1000$ tak asi začnu znova prgat ručně;-)

    Doufám, že 6090 bude dostupná. Ale bojím ze, že jsme zase v cyklu ala BTC mining a high-end bude mít stejný trh s AI nadšencema. Reálně bych doma potřeboval dgx station, ale nemůžu to ospravedlnit jako investici, když dělám jen prototyp;-)

    Chtěl bych dedikovaný chipset na domácí inference, ale to je daleko.
    LAUNCHER
    LAUNCHER --- ---
    Google pro LLM komunitu zachranuje Nvidia N1X (RTX Spark Laptopy), Strix Halo, pripadne M5 Pro. Je to prvni vlastovka, ma to sve problemy, ale ono to pujde. Vyuziva se toho, ze lokalne nemas frontu dotazu od hodne uzivatelu, takze pocitas na jednom promptu 256 tokenu naraz, difuzne. Tzn pokud mas neco, co ma vyrazne vyssi performance chipu nez rychlosti pameti, vice vytezis ten performance a mene trapis tam a zpatky pameti. Vyznamne zabira jak na moji milovanou 5090, tak na RTX Spark.

    U nVidia podpora samozrejme od day 0, protoze spoluprace s Google.

    Run DiffusionGemma on NVIDIA for Developer-Ready, High-Throughput Text Generation | NVIDIA Technical Blog
    https://developer.nvidia.com/blog/run-diffusiongemma-on-nvidia-for-developer-ready-high-throughput-text-generation/

    Reci cisel, inference:
    5090: 700 tokenu / sekundu
    DGX (+RTX) Spark: 150 t/s
    DGX Station: 2000 t/s

    Detail:

    A Visual Guide to DiffusionGemma - by Maarten Grootendorst
    https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-diffusiongemma

    MCKIDNEY
    MCKIDNEY --- ---
    50/50 Ze dostanete thumbnail NVidia is helping AMD :)

    TL;DR Windows neumi dobre pracovat se sdilenou pameti a NV s Microslop to opravili. AMD by melo byt v opravach taky.

    NVIDIA's Secret Windows Upgrades for N1/N1X Laptops Help Everyone; AMD Could Benefit the Most
    https://youtu.be/vO3BX58GIw0
    MCKIDNEY
    MCKIDNEY --- ---
    IMHO je brzo. Windows teprve opravuji veci (protoze narozdil od Strix Halo za timto stoji sentiment)

    Orezana 5070 v ARM notebooku a vychazi v dobe kdy M3 dosahne likvidacnich cen v korpo.
    Windows bezi dobre na MacBooku ve VM (proto vim, ze translation layer neni zdroj problemu - Microsofti se tam uz pouziva.)

    Nemyslim si, ze to stoji za tech leaknutych 3000$
    TRAGED
    TRAGED --- ---
    (Vážně uvazuju že si jako další nb nechám něco se Šparkem pořídit, takže jsem na NV přístup zvědav )
    MCKIDNEY
    MCKIDNEY --- ---
    TRAGED: NV si proda HW a mozna nejake licence mrkvosoftu.

    Ja mluvim o per-user licence a cloud-billing. Uz to zacalo Microslop vi, ze nemuzes udrzet vse v datacentru. Prodavat licence a ty platis zbytek je zaklad uspesneho SW :)

    NPU, Spark, Strix Halo nikdy nebude skvela platforma - ale dost vykonna pro akceleraci prodanych modelu.
    TRAGED
    TRAGED --- ---
    MCKIDNEY: Myslíš licenci na CoPilot, nebo na Spark akceleraci? :-] Nebo už se ví, že NV za to nebude chtít desátek, tak jako za možnost akcelerace na VMs?
    LAUNCHER
    LAUNCHER --- ---
    RUDOLF: Fair enough.

    Popisovane problemy v nekterych konkretnich CZ firmach - Bohuzel, no. Ale tak on ten problem i zacina a konci penezma... ostatne kolik lidi treba z Nyxu uz nedela pro CZ trh, ac si piseme v CZ.

    6k - Gratuluji, parada.
    Kliknutím sem můžete změnit nastavení reklam