• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    XCHAOSANSI C/C99 (specifikace), GNU C (gcc, glibc), Tiny C (tcc) a POSIX - ne nutně C++,g++,libstdc++ nebo Win32 API
    XCHAOS
    XCHAOS --- ---
    REDGUY: dobře, ale u 32bit kódu se to dnes min. dvěma lidem prostě neprojevilo....
    XCHAOS
    XCHAOS --- ---
    njn, hezké, ale na mě moc lowlevel. já jsem spíš middle-level orientovaný :-) nižší level, než psát ve skriptovacích jazycích, vyšší level, než ASM...
    DAVIDOWITCH
    DAVIDOWITCH --- ---
    A, abych si prihral polivcicku, tohle se uci na APSkach na bakalari a pak pripadne na PAPech na magistru, CVUT FEL a ted CVUT FIT.. a prestoze se tem predmetum spousta lidi vyhejba bo jsou tezky (a magisterskej teda asi moc HW zamerenej), tak delaj chybu, jsou tam zajimavy veci.
    DAVIDOWITCH
    DAVIDOWITCH --- ---
    XCHAOS: Ne. Branch predict ma kdeco, mmj. uz obyc Pentia. Sice ne zazracnej, ale nejakej. On i pitomej "statickej" branch predict stylem "vzdycky skoci" (namisto bezneho "nikdy neskoci") ma prekvapive vysokou uspesnost.
    Moderni branch predicty maj vysoce pres 90%.

    Muzu doporucit napriklad:
    Amazon.com: Computer Architecture, Fifth Edition: A Quantitative Approach (The Morgan Kaufmann Series in Computer Architecture and Design) (9780123838728): John L. Hennessy, David A. Patterson: Books
    http://www.amazon.com/Computer-Architecture-Fifth-Edition-Quantitative/dp/012383872X/ref=dp_ob_title_bk
    http://www.amazon.com/MODERN-PROCESSOR-DESIGN-Fundamentals-Superscalar/dp/0072829680 (tohle byla literatura k nasemu predmetu o procesorech)

    Je tam spousta fakt zajimavejch veci o tom jak se co dela.

    Ten rozdil neni v tom jestli se pouzije nebo nepouzije branch predictor, ale v tom jestli se pouzije branch nebo conditional move (kterej nepotrebuje branch predict, protoze nedela pipeline stall, protoze nema dependence, protoze RAW hazard kterej to umi zpusobit se udela pres premapovavani registru).
    REDGUY
    REDGUY --- ---
    XCHAOS: já dopoňuju jen to, že je to zřejmě vlastnost 64bit procesorů - ne, neni. Branch predictor meli uz stary Pentia. Jestli se to tady projevuje nebo ne je jina vec.

    mě to zajímá jen okrajově - coz od cloveka kterej porad rika jak mu hrozne zalezi rychlosti je vcelku bizarni. Ale aspon se potvrdilo co jsem psal na zacatku, totiz ze si z toho vezmes spatne ponauceni. Sice jinak spatne nez jsem cekal, ale aspon neco 8)
    XCHAOS
    XCHAOS --- ---
    REDGUY: ano, já dopoňuju jen to, že je to zřejmě vlastnost 64bit procesorů (u 32bitových to bylo prostě stejně pomalé oboje).

    mě to zajímá jen okrajově - je to zajímavé, přeložil jsem to, vyzkoušel jsem to, zabil jsem tím spoustu času, a za sebe tím debatu končím.
    REDGUY
    REDGUY --- ---
    XCHAOS: podle manuálové stránky je branch-predict pouze mezi MMIX Options - hele, vis co je MMIX? Divals ses co to je? To je _teoreticka_ RISCova architektura, ke ktery podle wikipedie neexistuje krome nejakyho FPGA neexistuje zadnej kremik. Cili neco, co _vubec_ nesouvisi s tim, co tady resime, tj. tim jak se ten kod chova na x86 nebo x64.

    A vysvetleni co je to branch prediction (na urovni procesoru, ne prekladace) samozrejme mas (i s obrazkem) v tom linku. S cimz souvisi nasledujici...

    třeba jen hledání ve spojovém seznamu s a bez branch prediction ...ach jo, ach jo, ach jo. Branch prediction je vlastnost _procesoru_, ktera proste funguje _porad_. Cili nejake "hledani bez branch prediction" je nesmysl, na rozdil od "hledani, ktere minimalizuje selhani branch prediction a nevede k patologickym prikladum, jako je ten co ukazal redguy".
    XCHAOS
    XCHAOS --- ---
    REDGUY: dobře, bylo to o branch prediction... co mě ale mate, je že podle manuálové stránky je branch-predict pouze mezi MMIX Options - a není tam zmínka, že by tam byl rozdíl mezi tím O2 a O3

    já se spokojím s přiznáním, že úplně přesně co se tam děje, nechápu. ale beru na vědomí, že podobné věci musím ve svých úvahách brát na vědomí - třeba jen hledání ve spojovém seznamu s a bez branch prediction, a navíc setříděném-nesetříděném - jo, to je něco, co by zase zajímalo mě, jak dopadne...
    REDGUY
    REDGUY --- ---
    XCHAOS: no, nečetl. chjo. Co dodat. Dokonce i kdyz ve zprave primo tobe urcene napisu link na podrobne a srozumitelne vysvetleni nejakeho jevu, tak se ani neobtezujes si ho precist a misto toho spradas vlastni, samozrejme mylne teorie.

    Do prdele prace, jeste se mi nekdo divi ze jsem na XChaose hnusnej?
    XCHAOS
    XCHAOS --- ---
    REDGUY: no, nečetl. teď koukám, že to "With O3, both versions (sort/non sort) are the same speed (4.5) but with O2, both are differen" píší i tam... takže je to napadlo zkusit taky.
    REDGUY
    REDGUY --- ---
    XCHAOS: můžeš tady zpovídat ostatní, jestli to pochopili. - ja te nezpovidam. Ja mel proste dojem, ze duvod proc se ten program chova tak jak se chova uz tady byl velmi dobre vysvetlen, minimalne v tom linku na stackoverflow co jsem sem daval (cetl jsi ho?) a vsichni pritomni tomu rozumi. Takze ted me mate, kdyz najednou mluvis o nejake onchip cache, ktera s tim nema nic spolecneho. Jestli nechces vedet proc se to chova jak se to chova, staci rict.
    XCHAOS
    XCHAOS --- ---
    JANFROG: klub vznikl totiž tak, že jsem před lety dostal ban v klubu o C++ ... důvody si už přesně nepamatuji, ale chtěl jsem ukázat, že to jde i bez (trvalých) banů, a navíc čisté C pokládám za více srozumitelnější pro "začátečníky" (rozuměj: lidi,kteří dosud nic nekompilovali, ale třeba jen skriptovali v PHP apod. - i když třeba i hodně rozsáhlé projekty), než C++ se všemi se všemi jeho romantickými zákoutími a pětihvězdičkovými turistickými atrakcemi.
    REDGUY
    REDGUY --- ---
    JANFROG: Guilty as charged. Na moji obranu budiz receno, ze podobny veci predvadi prilis casto a ze v tomhle konkretnim pripade neslo ani tak o preklep ve velikosti pismenek, ale ze se nezamyslel nad tim, proc mu to dava stejnej vysledek (dve setiny sekundy jsou v tomhle kontextu "stejne") a proc o tom s D. mluvime jako o necem zajimavej. Ale jo, mas pravdu. Byt to s nekym jinym, s kym mam lepsi zkusenosti, jsem milejsi, prijemnejsi a slunickovatejsi 8)
    XCHAOS
    XCHAOS --- ---
    REDGUY: no.. min. jestli se použije ta mýtická instrukce, tak s -O3 se nepoužije... na 32bit platformě se taky nepoužije.

    hele, mě je to jedno. můžeš tady zpovídat ostatní, jestli to pochopili. na mě je čtení ASM moc lowlevel... nicméně k testování svých různých "minioptimalizací" na úrovni použitých algoritmů jste mě donutili testovat to proti různým -O switchům už dříve.

    jinak ladění přepínačů compileru je koukám zábava pro pokročilé...podobného typu jako vymýšlení klíčů do SQL tabulek :-)
    REDGUY
    REDGUY --- ---
    KEYMASTER
    KEYMASTER --- ---
    já si dovolím odvážně tipnout, že ten overhead sčítání bude neměřitelnej proti tý branch misprediction...
    JANFROG
    JANFROG --- ---
    Dovolim si mirny oftopic :-) Sem tam se sem podivam a nemuhu se zbavit dojmu, ze nekteri lide proste nevynechaji jedinou moznost XCHAOSe insultovat. Nerikam, ze s XCHAOSem souhlasim, nekdy mam pocit, ze je hodne mimo, ale...

    REDGUY: komu se to nikdy nestalo, necht hodi kamenem!

    K optimalizacim GCC: jak pravi klasik, kdo pouziva -O2 a si musi hodne verit a -O3 uz je hazard :-) Prikladny vyklad asi nikdo neda, nebot myslim, ze nikdo moc nevi co se v GCC deje
    REDGUY
    REDGUY --- ---
    XCHAOS: Pockej, ty porad jeste nevis proc ten test dava ruzne vysledky? Ja myslel ze uz se to tady dostatecne vysvetlilo? Proc do toho tahas nejakou cache?
    XCHAOS
    XCHAOS --- ---
    REDGUY: ne, vy mě ukážete. já vám ukázal, že s -O3 se to chová jinak :-) teda na 64bit CPU.
    XCHAOS
    XCHAOS --- ---
    REDGUY: no... prostě se sčítají čísla. nemůže hrát roli to, že když jsou blízko sebe, tak se v některých režimech projeví onchip cache - prostě že se rychleji tahají z paměti? ne, to je blbost. blízko sebe jsou furt.
    Kliknutím sem můžete změnit nastavení reklam