• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    HNIZDOnVIDIA - grafické karty, technologie, aplikace, hry
    Informace o grafických kartách nVidia - benchmarky, recenze, zkušenosti, přetaktování, chlazení, ovladače, hry, akcelerované aplikace.
    Cyberpunk2077 - technická stránka a nastavení, gameplay. Důvodem je svévolné a neodůvodněné omezení přispívání moderátorem do původního fóra.

    PhysX
    CUDA, vývoj

    Ovladače: nVidia download

    NVCUVENC dll download

    Trolling, OT a napadání se odměňují zahnutým ovocem.
    rozbalit záhlaví
    LAUNCHER
    LAUNCHER --- ---
    HNIZDO: Rozumim, ale byl bych spoko se Samsung i TSMC. Verim tomu, ze jestli nekdo tohle rozlouskne, tak prave Nvidia. 3090 se vyrabela v Samsung foundry, zadny problem jsem nezanamenal.

    Velmi se ale obavam dostatku pameti pri prichodu 6090. Pral bych si 48GB, ale IMHO to bude tezke, velmi tezke.
    HNIZDO
    HNIZDO --- ---
    TSMC's Steep 2nm Price Hikes Could Push NVIDIA and Apple Toward Samsung, as GAA Pricing Opens the Door
    https://wccftech.com/samsung-price-advantage-over-tsmc-2nm-3nm-processes-could-pull-customers-away/

    2nm proces TSMC bude tak drahý, že se možná Nvidia pro průmyslové a Edge produkty (herní GPU) vrátí k Samsungu (2 a 3nm GAA), jehož ceny jsou podstatně příznivější, naznačují zdroje z průmyslu

    fingers crossed, jinak se nedoplatíme, nebo ani nebude za co se nedoplatit
    HNIZDO
    HNIZDO --- ---
    RUDOLF: Obojí
    LAUNCHER
    LAUNCHER --- ---
    My 5¢:

    6090 přijde nejdřív za rok, spíš až ve druhé půlce 2027. Chip bude Rubin, paměti budou buď 16x2GB (to by mě mrzelo, stejně jako 5090), nebo nV příjemně překvapí a 16x3GB, nebo 16x4GB (too good to be true).

    Cenu Nvidia nastaví podle konkurence a podle vlastní marže (segmentace trhu). Reálná konkurence v compute je dnes Google, Meta a Amazon s jejich TPU, lokálně čím dál více i Apple.

    Možná ještě jestli Microsoft přes AMD udělá nějakou variantu Xbox Helix s compute a dost paměti? Po dvou posledních generacích AMD mi to přijde jako spíš snaha MLID nahnat views, rád se v tom spletu. U MLID hrozí, že si opět vysnil varianty s více paměti, které neexistují (stejně jako to udělal s AMD 9090XT 32GB).

    Cena se nastaví na to, co trh unese. To si Nvidia bude analyzovat až blízko launch date.
    RUDOLF
    RUDOLF --- ---
    RUDOLF: první graf co jsme našel

    Video Card Price Trends - PCPartPicker
    https://pcpartpicker.com/trends/price/video-card/#gpu.chipset.geforce-rtx-5090
    RUDOLF
    RUDOLF --- ---
    HNIZDO: cenu 5090 v době uvedení na trh nebo dnes?;-)
    HNIZDO
    HNIZDO --- ---
    RUDOLF: 6090 dostupná bude, pokud dostupností myslíš o 20-30 procent vyšší cenu než 5090.
    TRAGED
    TRAGED --- ---
    MCKIDNEY: Tak nad win jsem neuvazoval ani na vteřinu :-)
    RUDOLF
    RUDOLF --- ---
    Hmm.. já dost přemýšlím, jak zvolím strategii na svůj domácí hobby gaming projekt. Vlastně bych chtěl jet LLM defakto 24h denně. Pokud dám 100$ měsíčně na tokeny tak v pohodě, pokud 1000$ tak asi začnu znova prgat ručně;-)

    Doufám, že 6090 bude dostupná. Ale bojím ze, že jsme zase v cyklu ala BTC mining a high-end bude mít stejný trh s AI nadšencema. Reálně bych doma potřeboval dgx station, ale nemůžu to ospravedlnit jako investici, když dělám jen prototyp;-)

    Chtěl bych dedikovaný chipset na domácí inference, ale to je daleko.
    LAUNCHER
    LAUNCHER --- ---
    Google pro LLM komunitu zachranuje Nvidia N1X (RTX Spark Laptopy), Strix Halo, pripadne M5 Pro. Je to prvni vlastovka, ma to sve problemy, ale ono to pujde. Vyuziva se toho, ze lokalne nemas frontu dotazu od hodne uzivatelu, takze pocitas na jednom promptu 256 tokenu naraz, difuzne. Tzn pokud mas neco, co ma vyrazne vyssi performance chipu nez rychlosti pameti, vice vytezis ten performance a mene trapis tam a zpatky pameti. Vyznamne zabira jak na moji milovanou 5090, tak na RTX Spark.

    U nVidia podpora samozrejme od day 0, protoze spoluprace s Google.

    Run DiffusionGemma on NVIDIA for Developer-Ready, High-Throughput Text Generation | NVIDIA Technical Blog
    https://developer.nvidia.com/blog/run-diffusiongemma-on-nvidia-for-developer-ready-high-throughput-text-generation/

    Reci cisel, inference:
    5090: 700 tokenu / sekundu
    DGX (+RTX) Spark: 150 t/s
    DGX Station: 2000 t/s

    Detail:

    A Visual Guide to DiffusionGemma - by Maarten Grootendorst
    https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-diffusiongemma

    MCKIDNEY
    MCKIDNEY --- ---
    50/50 Ze dostanete thumbnail NVidia is helping AMD :)

    TL;DR Windows neumi dobre pracovat se sdilenou pameti a NV s Microslop to opravili. AMD by melo byt v opravach taky.

    NVIDIA's Secret Windows Upgrades for N1/N1X Laptops Help Everyone; AMD Could Benefit the Most
    https://youtu.be/vO3BX58GIw0
    MCKIDNEY
    MCKIDNEY --- ---
    IMHO je brzo. Windows teprve opravuji veci (protoze narozdil od Strix Halo za timto stoji sentiment)

    Orezana 5070 v ARM notebooku a vychazi v dobe kdy M3 dosahne likvidacnich cen v korpo.
    Windows bezi dobre na MacBooku ve VM (proto vim, ze translation layer neni zdroj problemu - Microsofti se tam uz pouziva.)

    Nemyslim si, ze to stoji za tech leaknutych 3000$
    TRAGED
    TRAGED --- ---
    (Vážně uvazuju že si jako další nb nechám něco se Šparkem pořídit, takže jsem na NV přístup zvědav )
    MCKIDNEY
    MCKIDNEY --- ---
    TRAGED: NV si proda HW a mozna nejake licence mrkvosoftu.

    Ja mluvim o per-user licence a cloud-billing. Uz to zacalo Microslop vi, ze nemuzes udrzet vse v datacentru. Prodavat licence a ty platis zbytek je zaklad uspesneho SW :)

    NPU, Spark, Strix Halo nikdy nebude skvela platforma - ale dost vykonna pro akceleraci prodanych modelu.
    TRAGED
    TRAGED --- ---
    MCKIDNEY: Myslíš licenci na CoPilot, nebo na Spark akceleraci? :-] Nebo už se ví, že NV za to nebude chtít desátek, tak jako za možnost akcelerace na VMs?
    LAUNCHER
    LAUNCHER --- ---
    RUDOLF: Fair enough.

    Popisovane problemy v nekterych konkretnich CZ firmach - Bohuzel, no. Ale tak on ten problem i zacina a konci penezma... ostatne kolik lidi treba z Nyxu uz nedela pro CZ trh, ac si piseme v CZ.

    6k - Gratuluji, parada.
    RUDOLF
    RUDOLF --- ---
    LAUNCHER: v poho, ale argumentačními fails, kdy jsi reagoval na to, co jsme netvrdil, jsi vinen též;-) ono, tohle prostředí, kdy píšu z tabletu na záchodě, vytváří obrovský prostor na neporozumění ze všech stran;-) V energetice budou specifika o kterých vím prd žejo;-) a peníze tam budou;-) Ale chápu, že v energetic chceš mít core compute co nejblíž, to dává smysl.

    Já rozhodně nejsem proti edge compute a v tý farmacii, v kterŷ jsme byl, když LLM začali vstupovat do zajetých ML konceptu. Je spousta use cases. Notabene domácí edge mi přijde taky jako budoucnost ale paměťové omezení xx90 a cena Spark, mi doma nedávají smysl. Xx90 koupím, protože jsme přešel na 6k.

    Moje kritika směřovala, na firmičky co se brojí proti cloudu, ale nezaplatí ani vlastní IT lidi aby vytvořili procesy a řešení, na security operations atd. Coz není tvůj případ. Ale tyhle mají děraví sítě a služby a remcají nad cloudem. Kde je tuna compliance tools, co ti udělají automaticky bezpečnostní audit. Protože v tom je business.

    Mě by nevadil ani český cloud provider, jedna z nabídek byla něco takovýho postavit v čR a v dobe AI, by to mohl být krásný produkt, bez montr týmu. Ale situace je tady trochu pozadu, startupy jsou lákány do AWS/Azure kredit. A nevím kdo by v ČR konkurovali free 25 mega v kreditek na 3 roky, včetně rozpoztu na migraci do hyperscalers. To je imho pro český cloud providery likvidační. A podle toho co jsem slyšel. Český firmy teprve naskakují na manged kubernetes jako službu:-) v době kdy jsem poprve začal s AWS, tak EKS taky nebylo.

    Je to tu hrozně rozdílný, vidím technologicky a procesně vyspělí firmy a pak takový relikty mínulaoti. Takže je těžky odhadnout s kým se vlastně bavím;-)
    LAUNCHER
    LAUNCHER --- ---
    Regionalni deployment - resi residency, ne jurisdikci. CLOUD Act dosahne na US-controlled providera extrateritorialne bez ohledu na to, v jakem regionu data lezi. Uloziste v EU nevyleci pristup US vlady (FISA 702, NSL, casto s gag orderem - ani se to nedozvis). Proto existuji pozadavky na suverenni cloud a proto cast EU trhu na US hyperscalery nesahne ani s EU regionem. „Compliant v regionalnim frameworku" je vendor claim, ne konec debaty.

    "Ale nic z toho co popisujes nebylo relevantni. Open modely se pouzivali a trenovali v cloudu. Protoze na to proste ani s nekolika rack nebyla kapacita." - Rikas neco co jsem nerekl a pak si to sam vyvracis.

    Dal nemam zajem na pokracovani debaty, ostatne cele mi to prijde naivni "HW pro trh, ktery existuje a ja nevidim, vskutecnosti neexistuje - duvod je ten, ze JA ho nevidim", kombinovano s argumentacnimi fauly. Co se tyka me, delam primarne energetiku pro DACH. Predpokladam, ze pro tebe stejna jednoduchost jako pocitani ROI v tvem prvnim odstavci. Nebo compliance, nebo cokokoliv z toho cos tu stvoril. Jsem s tim uplne v klidu a miru.
    MCKIDNEY
    MCKIDNEY --- ---
    V tohle contextu Spark v miniPC i v corp. notebooku dava smysl.
    MCKIDNEY
    MCKIDNEY --- ---
    Na rovinu, tohle ocekavam ze bude copilot model - Microsoft Office, ale s AI. Plan do delsi budoucnosti, kdy AI je nutna pro zamestnance, ale nenahradi je.

    Spark + Licence = CoPilot offloaduje cast.
    Edge + License = CoPilot offloaduje cast.
    Cloud only = platis 100% vseho
    RUDOLF
    RUDOLF --- ---
    ROI v kontextu provozy edge versus provider je snad jednoduchá matematika. Zvolíš model a porovnáš amortizaci, elektřinu a lidi versus usage tokenů od providera.

    V T&C je hlavně zakázaný reverse engineeeimg a stavění nových modelů. Pak military a hacking. Jestli je to field kam dodáváš, tak chápu.

    Deployment se dělá regionálně a je compliant v regionálním framework jako GDPR apod. Co se týče security, tak mi šlo o praktickou bezpečnost. Pokud firma porusuje zákon, tak je snad normální, že jde mezinárodně požádat providera o vydání dat co má. Pokus máš něco v CN, tak samo, je to straně k dispozici.

    Pokud mluvíš o situaci ,kdy jsme ve vojenským sporu, podívej se, že obchod funguje dobře i za války mezi protivníky.

    Zatím jsi mluvil o dost levém HW, takže nemyslím, že děláš pro někoho sofistikovaného. V posledním korporátu samozřejmě měli lokální Nvidia clustery. A dělali pokročilé věci. Ale nic z toho co popisuješ nebylo relevantní. Open modely se používali a trénovali v cloudu. Protože na to prostě ani s několika rack nebyla kapacita.

    Proto mám jisté pochybnosti o usecase, lokální compute hurrdurr. Nebo o zkaznikach, který se rádi jedou podívat na svůj server v DC;-) nějak jsem tenhle mindset zahlid, když jsem hledal práce v lednu. A nic sofistikovaného za tím nebylo.
    Kliknutím sem můžete změnit nastavení reklam