• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    XCHAOSANSI C/C99 (specifikace), GNU C (gcc, glibc), Tiny C (tcc) a POSIX - ne nutně C++,g++,libstdc++ nebo Win32 API
    REDGUY
    REDGUY --- ---
    XCHAOS: podle manuálové stránky je branch-predict pouze mezi MMIX Options - hele, vis co je MMIX? Divals ses co to je? To je _teoreticka_ RISCova architektura, ke ktery podle wikipedie neexistuje krome nejakyho FPGA neexistuje zadnej kremik. Cili neco, co _vubec_ nesouvisi s tim, co tady resime, tj. tim jak se ten kod chova na x86 nebo x64.

    A vysvetleni co je to branch prediction (na urovni procesoru, ne prekladace) samozrejme mas (i s obrazkem) v tom linku. S cimz souvisi nasledujici...

    třeba jen hledání ve spojovém seznamu s a bez branch prediction ...ach jo, ach jo, ach jo. Branch prediction je vlastnost _procesoru_, ktera proste funguje _porad_. Cili nejake "hledani bez branch prediction" je nesmysl, na rozdil od "hledani, ktere minimalizuje selhani branch prediction a nevede k patologickym prikladum, jako je ten co ukazal redguy".
    XCHAOS
    XCHAOS --- ---
    REDGUY: dobře, bylo to o branch prediction... co mě ale mate, je že podle manuálové stránky je branch-predict pouze mezi MMIX Options - a není tam zmínka, že by tam byl rozdíl mezi tím O2 a O3

    já se spokojím s přiznáním, že úplně přesně co se tam děje, nechápu. ale beru na vědomí, že podobné věci musím ve svých úvahách brát na vědomí - třeba jen hledání ve spojovém seznamu s a bez branch prediction, a navíc setříděném-nesetříděném - jo, to je něco, co by zase zajímalo mě, jak dopadne...
    REDGUY
    REDGUY --- ---
    XCHAOS: no, nečetl. chjo. Co dodat. Dokonce i kdyz ve zprave primo tobe urcene napisu link na podrobne a srozumitelne vysvetleni nejakeho jevu, tak se ani neobtezujes si ho precist a misto toho spradas vlastni, samozrejme mylne teorie.

    Do prdele prace, jeste se mi nekdo divi ze jsem na XChaose hnusnej?
    XCHAOS
    XCHAOS --- ---
    REDGUY: no, nečetl. teď koukám, že to "With O3, both versions (sort/non sort) are the same speed (4.5) but with O2, both are differen" píší i tam... takže je to napadlo zkusit taky.
    REDGUY
    REDGUY --- ---
    XCHAOS: můžeš tady zpovídat ostatní, jestli to pochopili. - ja te nezpovidam. Ja mel proste dojem, ze duvod proc se ten program chova tak jak se chova uz tady byl velmi dobre vysvetlen, minimalne v tom linku na stackoverflow co jsem sem daval (cetl jsi ho?) a vsichni pritomni tomu rozumi. Takze ted me mate, kdyz najednou mluvis o nejake onchip cache, ktera s tim nema nic spolecneho. Jestli nechces vedet proc se to chova jak se to chova, staci rict.
    XCHAOS
    XCHAOS --- ---
    JANFROG: klub vznikl totiž tak, že jsem před lety dostal ban v klubu o C++ ... důvody si už přesně nepamatuji, ale chtěl jsem ukázat, že to jde i bez (trvalých) banů, a navíc čisté C pokládám za více srozumitelnější pro "začátečníky" (rozuměj: lidi,kteří dosud nic nekompilovali, ale třeba jen skriptovali v PHP apod. - i když třeba i hodně rozsáhlé projekty), než C++ se všemi se všemi jeho romantickými zákoutími a pětihvězdičkovými turistickými atrakcemi.
    REDGUY
    REDGUY --- ---
    JANFROG: Guilty as charged. Na moji obranu budiz receno, ze podobny veci predvadi prilis casto a ze v tomhle konkretnim pripade neslo ani tak o preklep ve velikosti pismenek, ale ze se nezamyslel nad tim, proc mu to dava stejnej vysledek (dve setiny sekundy jsou v tomhle kontextu "stejne") a proc o tom s D. mluvime jako o necem zajimavej. Ale jo, mas pravdu. Byt to s nekym jinym, s kym mam lepsi zkusenosti, jsem milejsi, prijemnejsi a slunickovatejsi 8)
    XCHAOS
    XCHAOS --- ---
    REDGUY: no.. min. jestli se použije ta mýtická instrukce, tak s -O3 se nepoužije... na 32bit platformě se taky nepoužije.

    hele, mě je to jedno. můžeš tady zpovídat ostatní, jestli to pochopili. na mě je čtení ASM moc lowlevel... nicméně k testování svých různých "minioptimalizací" na úrovni použitých algoritmů jste mě donutili testovat to proti různým -O switchům už dříve.

    jinak ladění přepínačů compileru je koukám zábava pro pokročilé...podobného typu jako vymýšlení klíčů do SQL tabulek :-)
    REDGUY
    REDGUY --- ---
    KEYMASTER
    KEYMASTER --- ---
    já si dovolím odvážně tipnout, že ten overhead sčítání bude neměřitelnej proti tý branch misprediction...
    JANFROG
    JANFROG --- ---
    Dovolim si mirny oftopic :-) Sem tam se sem podivam a nemuhu se zbavit dojmu, ze nekteri lide proste nevynechaji jedinou moznost XCHAOSe insultovat. Nerikam, ze s XCHAOSem souhlasim, nekdy mam pocit, ze je hodne mimo, ale...

    REDGUY: komu se to nikdy nestalo, necht hodi kamenem!

    K optimalizacim GCC: jak pravi klasik, kdo pouziva -O2 a si musi hodne verit a -O3 uz je hazard :-) Prikladny vyklad asi nikdo neda, nebot myslim, ze nikdo moc nevi co se v GCC deje
    REDGUY
    REDGUY --- ---
    XCHAOS: Pockej, ty porad jeste nevis proc ten test dava ruzne vysledky? Ja myslel ze uz se to tady dostatecne vysvetlilo? Proc do toho tahas nejakou cache?
    XCHAOS
    XCHAOS --- ---
    REDGUY: ne, vy mě ukážete. já vám ukázal, že s -O3 se to chová jinak :-) teda na 64bit CPU.
    XCHAOS
    XCHAOS --- ---
    REDGUY: no... prostě se sčítají čísla. nemůže hrát roli to, že když jsou blízko sebe, tak se v některých režimech projeví onchip cache - prostě že se rychleji tahají z paměti? ne, to je blbost. blízko sebe jsou furt.
    REDGUY
    REDGUY --- ---
    XCHAOS: napíšeme druhý test, zda se různě velká čísla sčítají stejně rychle? to veru nepotrebuju benchmarkovat, to vim. Ale jestli chces, klidne si to napis, rekl bych ze je cca 30% sance ze nejdriv dostanes vysledky ktere budou vypadat ze potvrzuji tvoji predstavu o ruzne delce scitani a pak ti ukazeme, ze to byla jen nejaka optimalizace prekladace. Coz by mohla bejt docela zabava 8)
    REDGUY
    REDGUY --- ---
    XCHAOS: měří se čas, ne součet. - meri se cas dvou ruznych behu jednoho programu. Kdybys generoval skutecne nahodna cisla, v kazdem behu by se jich scitalo ruzne mnozstvi, na coz by se spotrebovalo ruzne mnozstvi operaci, tudiz by srovnani nemelo smysl (tedy, melo, protoze ten pocet by se lisil max o pul procenta, ale uvazujme teoreticky).
    Precetl sis ten testovaci program? Vis co se v nem deje? Vsiml sis ze se nescitaji VSECHNA nahodna cisla v tom poli, ale jen NEKTERA?
    XCHAOS
    XCHAOS --- ---
    REDGUY: měří se čas, ne součet. resp. rozdíl času. relativní. tento relativní rozdíl je stejný.

    (dokud se neshodneme, co bylo vlastně měřenou veličinou, je dost nesmysl bavit se, zda jsou výsledky stejné, nebo ne)

    ...a jak je to teda s tím benchmarkováním sčítání? napíšeme druhý test, zda se různě velká čísla sčítají stejně rychle? :-)
    REDGUY
    REDGUY --- ---
    XCHAOS: příkladný výklad toho, co dělá -O3 místo použití té ASM magie, by mě taky zajímal.: njn. To uz rovnou muzes chtit aby ti nekdo vysvetlil jakej je rozdil mezi vznetovym a zazehovym spalovacim motorem aniz by pri tom pouzil magicka slova "horeni", "valec", "pist" a "svicka".
    REDGUY
    REDGUY --- ---
    XCHAOS: po změně seedu jsou výsledky úplně stejné. - ne, nejsou. Vysledny soucet je jiny 8), stejne jako pocet scitanejch cisel.
    Ale samozrejme, vzhledem k tomu kolik tech nahodnejch cisel generuju, tak ruzne seedy nemaji nejak zasadni vyznam. Co jsem si prave vyzkousel, tak pocty scitanej cisel se pro ruzne seedy lisi max o cca 0.6%, coz bude asi pod chybou mereni.

    Cili prakticky vzato, ten seed neni potreba. Teoreticky vzato tam ale patri. A tech par pismenek me nezabije.
    ISTEVE
    ISTEVE --- ---
    XCHAOS: Ber to jako prilezitost pro studium :)
    XCHAOS
    XCHAOS --- ---
    ještě co mi nejde na rozum, že s tím -O3 jsou fakt výsledky pro setříděné i nesetříděné pole nejen stejné - ale v obou případech o polovinu pomalejší, než to sčítání setříděného pole s -O2 :-) příkladný výklad toho, co dělá -O3 místo použití té ASM magie, by mě taky zajímal.
    REDGUY
    REDGUY --- ---
    XCHAOS: Moment, ted nerozumim na co se ptas. Resp, mozna rozumim, ale prijde mi to tak trivialni otazka ze se mi nechce verit 8)

    Opravdu se ptas proc generuju ta cisla pokazdy stejny? Nebo je to jen nejakej vtip co mi unikl?
    XCHAOS
    XCHAOS --- ---
    (odpovím si sám: po změně seedu jsou výsledky úplně stejné. a tartarus jsem radši přejmenoval na tartaros ... římský militarismus mi není blízký, to už jsou lepší klasičtí řečtí sofisté, ze kterých si řada online diskutérů bere příklad dodnes)
    XCHAOS
    XCHAOS --- ---
    KEYMASTER: a sakra, vida... :-)

    REDGUY: hele... jak to tedy doopravdy je, s tím ovlivněním benchmarku tím, že ta čísla pro jistotu budou stejná ? :-))
    KEYMASTER
    KEYMASTER --- ---
    jo, protože jinak by se mohly náhodně vygenerovat čísla s moc bity, a pak by sčítání trvalo dýl :D
    XCHAOS
    XCHAOS --- ---
    REDGUY: no, tak myslím, no.
    REDGUY
    REDGUY --- ---
    XCHAOS: seeduje to pořád tím samým Coz je zcela umyslne, protoze u benchmarku mi to prijde jako velmi vhodne, nemyslis?
    REDGUY
    REDGUY --- ---
    DAVIDOWITCH: ad ten XOR reg, reg; Tohle je presne duvod, proc je celej x86 a compatible v prdeli. - jo, to me vzdycky pobavi, ta predstava ze soucasny nekolika GHz hyperthreadovy multijadrovy superpipelinovany x64 procesory jsou s primhourenim oci kompatibilini jeste s prastarou 8008 8)
    XCHAOS
    XCHAOS --- ---
    NE0: viz předchozí. na 64bit CPU to dělá (ale s tou zvláštnůstkou, že s -O3 to "anuluje" tu popisovanou zvláštnůstku), na 32bit to nedělá (asi ani tu první zvláštnůstku)
    NE0
    NE0 --- ---
    XCHAOS: To by me asi zajimalo, ja jsem na 32b, Linux version 3.3.5-1-ARCH (tobias@T-POWA-LX) (gcc version 4.7.0 20120505 (prerelease) (GCC) ) #1 SMP PREEMPT Tue May 8 05:10:33 UTC 2012
    A zcela jasne to potvrzuje, ze "popravdě... nemít přístup k Debian-style systému, kde bylo provedeno apt-get install build-essential znamená být v tomto klubu offtopic. fakt sorry..." opravdu VUBEC neresi, ze ten ASM vystup pak ma kazdej stejne uplne jinej, ze jo...
    Kliknutím sem můžete změnit nastavení reklam