
Пример.
Пример.
Параметры GPU GeForce 8800GTX
Programming model:
Максимум 512 процессов в блоке (512х512х64)
Максимальные размеры сетки (65535х65535)
М
й
2
й
Максимальный размер вычислительного ядра ~ 2 млн. инструкций
HW architecture:
16 мультипроцессоров (Streaming Multiprocessors SM) / 128 потоковых
16 мультипроцессоров (Streaming Multiprocessors - SM) / 128 потоковых
процессоров (Streaming Processors)
Вплоть до 8 блоков исполняются одновременно на каждом SM
Вплоть до 24 варпов (warps*) исполняются одновременно на каждом SM
Вплоть до 768 процессов исполняются одновременно на каждом SM
Количество регистров на SM - 8192
16k общей памяти на SM / 16 банков
64k
(
8k
SM)
64k памяти конcтант (кэшируется по 8k на SM)
32-разрядная IEEE float арифметика
*warp = часть блока, исполняемая на SM в SIMD виде