3MARIE: Errr.. coze? Ne?
Pocet paralelnich threadu je omezenej:
1) Kolik mas SM
2) Kolik zere 1 thread registru
3) Kolik zere 1 block shared memory
4-5) Maximalnima limitama ma thread/blok
6) Mozna taky maximalni pameti na grafice.
Ta uloha by musela potrebovat takovy absurdni mnozstvi per-thread lokalni/globalni pameti, ze ti dojde pamet na karte driv nez narazis na cokoliv z bodu 1-5.
Takova typicka aplikace ma 256 threadu/block, 16 registru/thread, => na 1.3 4 bloky/SM. Na GTX285 je 30SM, takze ti najednou bezi rekneme 30k threadu (me vetsinou spis 15k nebo 8k).
Pri 1GB pameti mas 32kB dat na thread, nez te zacne omezovat bod #6. (A spis 64 nebo 128).
Co na tom prosimte pocitas, ze ti je tohle malo?