• úvod
  • témata
  • události
  • tržiště
  • diskuze
  • nástěnka
  • přihlásit
    registrace
    ztracené heslo?
    XCHAOSANSI C/C99 (specifikace), GNU C (gcc, glibc), Tiny C (tcc) a POSIX - ne nutně C++,g++,libstdc++ nebo Win32 API
    XCHAOS
    XCHAOS --- ---
    DAVIDOWITCH: no, tak nějak jsem to prolétl. je to takové šalamounské, no. je fakt, že jestli se nějaká instrukce týká např. každého packetu, který projde routerem třeba 2000x nebo např. jen 7x, je docela rozdíl ... nevím, co na to říká Mooreův zákon, ale pokud nějakého produktu jste schopni prodat se stejnými náklady třeba 100x tolik, tak optimalizace asi smysl měla.
    DAVIDOWITCH
    DAVIDOWITCH --- ---
    JANFROG: Tak clanek predpoklada ze lidi vedi. Respektive, prislo mi ze to ze se lidi neobtezuji vedet (a nemuzou potom spravne rozhodnout) povazuje za velkou chybu.
    Tj. to ze nevybiraji "rychlejsi" je na stejny urovni jako ze vybiraji "rychlejsi", ale delaj to blbe. Oboje znamena ze nemaj dost znalosti na to optimalizovat.

    XCHAOS: Z tveho komentare bych odvodil, ze si necetl ani prvni odstavce clanku...
    XCHAOS
    XCHAOS --- ---
    DAVIDOWITCH: no ale některé z nás prostě baví optimalizovat. (ostatně, řada projektů ve světě free software vzniká dobrovolně, a ne na zakázku.. i když částečně je to mýtus a některé podstatné komponenty dnešních linuxových distribucí jsou původně komerční projekty, později abandonware uvolněný pod GPL...)
    XCHAOS
    XCHAOS --- ---
    JANFROG: :-)))
    JANFROG
    JANFROG --- ---
    A jeste jedna usmevna historka: doted si vzpominam, jak me muj "guru" sprdnul stylem: "Ach ne, hlavne zadny if-else. Kdyz uz nusis, tak jedine goto! :-) Kazdej jsme nejak zacinal :-)
    JANFROG
    JANFROG --- ---
    DAVIDOWITCH: Zajimavy cteni. Necetl jsem to dukladne, s radou veci souhlasim, ale jsou tam i veci, se kteryma nesouhlasim. Napr. ze programator (v HLL) by mel vybirat se dvou semanticky ekvivalentnich konstrukci ty "rychlejsi". Moje zkusenost je, ze spousta "programatoru" to "dela", v zasade ale spatne, protoze netusi co se dole deje (resp si mysli, ze tusi). Typicke priklady co jsem mel tu cest videt/slyset:
    * hlavne nevytvarejte zbytecne objekty, zbytecne to zatezuje GC, kdyz uz, znovu pouzijte existujici!
    * hlavne ne vyjimky, jsou pomale!
    * nikdy nepouzivejte konkatenaci stringu, vzdycky jen pres stringbuffer!

    a podobne perly ;-)
    WILD_A
    WILD_A --- ---
    ANT_39: tohle tema je hlavne otazka osobnich preferenci a ja osobne uprednostnuju aby kod pokud mozno neschovaval slozitosti coz imo pretezovani operatoru dela, akceptoval jsemto do nejaky miry, nicmene pokud se jedna o specifickou tridu takmam radsi jasny volani funkce at mne to tukne do oka driv nez rozjedu profiler. Jasny, ze muzu tuhle debatu vzdycky smest tim, ze profiler mi odhali vsechno nebo, ze kdyz koukmu na ten asm tak mi to ukaze pravdu, ale kdyz je to kasny z kodu tak anijedno delat nemusim a usetril jsem si praci. Takze za mme je to nepretezovat pokud to neni jasny nebo se to nechova obvyklym, ocekavanym zpusobem.
    DAVIDOWITCH
    DAVIDOWITCH --- ---
    JANFROG: Jasny, a jo, tvoje aproximace rozhodne dava smysl.

    A ja tu prihodim clanek na tema optimalizace, je to hezky cteni:
    The Fallacy of Premature Optimization
    http://ubiquity.acm.org/article.cfm?id=1513451
    JANFROG
    JANFROG --- ---
    DAVIDOWITCH: Ja vim ze to vis. Jen jsem chtel poukazat na to, ze v instrukcich je trosku nesmysl dneska pocitat.

    I kdyz, musim se priznat, ja to sam delam :-) Kdyz generuji / pisu kod, obvykle jen pocitam pocet taken-jumpu ve fast path + kouknu na efektivitu vyuziti cache. V mem konkretnim pripade je to docela dobra aproximace...
    DAVIDOWITCH
    DAVIDOWITCH --- ---
    JANFROG: Vim. Jen sem rozvadel napad ze [] v C je lepsi protoze trva jen instrukci. To ze mnohem vic zalezi na tom jestli mas to kam tim [] pristupujes v cache nebo ne nez na tom pres kolik instrukci spocitas presnou adresu je trochu soucasti pointy. (A ja bych asi vytahl ze spojaky jsou na ten pristup kor blby, protoze nepouzivaj datovou lokalitu.. ale to uz tu nekolikrat bylo)
    ANT_39
    ANT_39 --- ---
    WILD_A: Tak jestli se ten celek tvaril jako kontejner... IMHO je fakt jedno, jestli je to get, at, operator[] nebo co, stejne z nazvu tu cenu toho volani presne nepoznas, a profiler se zmast nenecha. Konzistence ma IMHO vetsi vahu, nez anotovat jmeno funkce podle toho, jak je implementovana.

    Jestli ten double lookup o kterym mluvis byl opravnenej je samozrejme uplne jina otazka. Mohl, nemusel.
    JANFROG
    JANFROG --- ---
    DAVIDOWITCH: Ono ani tak nejde o to kolik instrukci to ci ono trva, spis jde o to, kolik taktu to trva :-) Neni instrukce jako instrukce, ani na RISC :-)
    A nakonec ani nejde ani tak o to kolik taktu trva to ci ono, jako spis jak dlouho se bude cekat na pamet :-)
    DAVIDOWITCH
    DAVIDOWITCH --- ---
    WILD_A: Potrebujes par instrukci abys spocital adresu a pak udelal ten load. (A jo, myslim tim RISC instrukce, ze ma x86 zbesily instrukce co nejenze natahnout z pameti dany bazi a offsetem do registru, ale jeste ti vycistej boty.. to vim a neprijde mi to az tak zajimavy)
    WILD_A
    WILD_A --- ---
    DAVIDOWITCH: Nedokaze nacist data z pole do registru? nebo jsem te spatbne pochopil?
    WILD_A
    WILD_A --- ---
    ANT_39: No ono to brikule jsou, to mas pravdu, ale v dnesni dobe mne to neprekvapi, viz STL kontejnery, ja se tomu osobne vyhybam to delat takhle, ale realita kolem mne je jaka je. Nicmene konkretni brikule co jsem videl a resil bylo nejdrive vyhledani daneho prvku v jinem STL kontejneru, nacteni dalsiho indexu do jineho kontejneru a z nej vytazeni finalniho udaje ... jako bylo to cely spatne, to nerozporuju, ale vypadalo to na prvni pohled naprosto elegantni a optimalni kod :)
    ANT_39
    ANT_39 --- ---
    WILD_A: Prekvapuje me, ze pristup do hashe a do mapy nepovazujes za brikule. To je o rad horsi, z hlediska slozitosti kodu, nez prostej pristup do pole. Co se v tom pripade jako brikule kvalifikuje?
    DAVIDOWITCH
    DAVIDOWITCH --- ---
    XCHAOS: Jo, dela, precti si neco o SSA.

    Ale pokud mas vlevo treba prave tu indexaci, a prirazujes do toho z pameti a ne z aritmeticky jednotky, tak uz to nedas. Pokud jen mas nejakou matiku a do promennych ukladas mezivysledky, tak to je vesmes cely jen asignovani registru (ala to co dela procesor kvuli out-of-order exekuci, kde ma vyrazne vic fyzickejch nez logickejch registru a prejmenovava si je jak zrovna potrebuje)
    XCHAOS
    XCHAOS --- ---
    DAVIDOWITCH: no, pokud mu přiřazovaná hodnota zbyde v registru, tak podle mě dokáže. dokonce, pokud v rámci optimalizace je přiřazováno do proměnné uložené v registru (buď explicitně vyžádáno klíčovým slovem "register" nebo nějak zoptimalizováno) , tak výraz vpravo od rovnítka mohl compiler zpracovat tak, že následná operace přiřazení spotřebuje 0 instrukcí :-) (ale toto tvrdím bez jakékoliv záruky, že nějaký compiler skutečně takovou optimalizaci dělá, teda...)
    DAVIDOWITCH
    DAVIDOWITCH --- ---
    XCHAOS: Procesor vetsinou nedokaze prirazeni/indexovani jednou operaci na registrech ani v cistem C.

    XCHAOS: Na pole fixni velikosti zapomen :-D
    Jenak je to uplne burta, kdyz uz to mas na heapu (a na stack se to nevejde ani omylem), a druhak by to predpokladalo ze aplikace bezi v prave jednom rozliseni, coz nebezi.
    XCHAOS
    XCHAOS --- ---
    WILD_A: no, obávám se, že v éře, kdy myší už ani nemusíš klikat, aby nastal nějaký ten onMouseOver() event, budeme mít problém vysvětlil většině, proč se nám nelíbí, že věci jako přiřazení nebo indexování pole neměly dělat nic, co by procesor nedokázal provést jedinou instrukcí zpracovávající hodnoty v registrech...
    Kliknutím sem můžete změnit nastavení reklam