
Вычислительная конфигурация
Вычислительная конфигурация
GPU
Процессы объединяются в
блоки (blocks), внутри
которых они имеют общую
Host
Device
Grid 1
р
щу
память (shared memory) и
синхронное исполнение
Kernel
1
Block
(0, 0)
Block
(1, 0)
Block
(2, 0)
Block
(0 1)
Block
(1 1)
Block
(2 1)
Блоки объединяются в сетки
(grids)
Нет возможности предсказать
очерёдность запуска блоков в
Kernel
(0, 1)
(1, 1)
(2, 1)
Grid 2
очерёдность запуска блоков в
сетки
Между блоками нет и не может
быть (см. выше) общей памяти
2
Block (1, 1)
Thread
(0, 1)
Thread
(1, 1)
Thread
(2, 1)
Thread
(3, 1)
Thread
(4, 1)
Thread
(0, 0)
Thread
(1, 0)
Thread
(2, 0)
Thread
(3, 0)
Thread
(4, 0)
(
)
(
)
(
)
(
)
(
)
Thread
(0, 2)
Thread
(1, 2)
Thread
(2, 2)
Thread
(3, 2)
Thread
(4, 2)