Сложение векторов произвольной длины на GPU

Помимо ограничения на количество нитей, существует также аппаратное ограничение на количество блоков (хотя и гораздо более либеральное). Как мы уже упоминали, количество блоков вдоль любого измерения сетки не должно превышать 65 535.

Далее

Расщепление параллельных блоков

В предыдущей статье мы видели, как на GPU исполняется параллельный код. Для этого мы сообщали исполняющей среде CUDA о том, сколько нужно запустить параллельных экземпляров ядра. Эти параллельные экземпляры мы назвали блоками.

Далее

Вычисление фрактала Джули а на CPU

Теперь рассмотрим код, который будет вычислять и визуализировать фрактал Джулиа. Поскольку эта программа сложнее предыдущих, то мы разобьем ее на части. А в конце главы приведем весь код целиком.

Далее
Страница 1 из 6123456