Home

Page 6
Page 6
background image

Пример программы для GPU

Пример программы для GPU

умножение матриц -3 

bx

tx

0

1

2

†

Определить конфигурацию грида/блока

позволяющее 

„

Оптимальное размещение промежуточных 

N

tx

0 1

bsize-1

2

W

IDTH

„

Оптимальное размещение промежуточных 

данных в регистрах и общей памяти

„

Оптимальную вычислительную загрузку

потоковых процессоров

BLOCK_

W

W

IDTH

Hb

†

Блок = 16x16= 256 

тредов больше чем 192, 

меньше чем 512

M

P

BLOCK_

W

†

Целое количество варпов 

в блоке

P

sub

2

1

0

0

S

IZ

E

†

Размеры грида 

определяются размерами 

исходных матриц

BLOCK WIDTH

BLOCK WIDTH

BLOCK WIDTH

by

ty

2

bsize-1

1

BLOCK_

S

Ha

BLOCK_WIDTH

Wb

Wa

BLOCK_WIDTH

BLOCK_WIDTH

2


Copyright © 2018 Файлообменник files.d-lan.dp.ua

Использование любых материалов сайта возможно только с разрешения автора.