MAIMONIDES: Ted nevim co myslis. Muzes mit vic gridu (de facto jinej program), vid bloku (stejnej program, jiny data).
A stridaj se thready v blocku a blocky v gridu a gridy taky nejak.
Nic z toho nepomuze s ifem, pomuze to pri prekrejvani vypadku pameti.
CPU ma pristup do L1 cache v jednotkach taktu, L2 radove desitky.
GPU pameti je takovej kotel, ze bych si takovou generalizaci asi nedovolil, ale pristup do offchip trva ty stovky taktu (casove cca stejne jako na CPU, i kdyz tam je to vic cyklu). Respektive, ten rozdil v pristupu do hlavni pameti je radove 2X. Jenze GPUcko nema (tady) skoro zadnou cache, ale zase to prekrejva jinejma warpama, takze to je fakt nesrovnatelny :-D