Page 12

Уровень производительности
Уровень производительности
(продолжение)
Возможный альтернативный график вычислений
Loop {
Load to Shared Memory
Loop {
Load to Shared Memory
Load to Shared Memory
Syncthread()
y
Syncthread()
Loop {
C
bbl k
Compute current subblock
Compute current subblock
Load to Shard Memory
Syncthreads()
}
Syncthreads()
}
}
}