Параллельное программирование на CUDA С

Опубликовано марта 6, 2018 в Технология CUDA

В предыдущих статьях мы видели, как просто написать код, исполняемый графическим процессором. Мы даже научились складывать два числа, правда, пока только 2 и 7.

Признаем, что этот пример мало кого может впечатлить. Но надеемся, вы убедились, что хотя бы поначалу в CUDA С нет ничего сложного, и горите желанием учиться дальше.

Перспективы использования GPU-вычислений в основном связаны с массивно-параллельной структурой многих задач. Поэтому мы посвятим дальнейшие статьи вопросу об исполнении на GPU параллельного кода, написанного на CUDA С.

Параллельное программирование на CUDA С

О чем этот раздел сайта

Прочитав статьи этой категории сайта, вы:

  • узнаете один из основных способов организации параллелизма в CUDA;
  • напишете свою первую параллельную программу на CUDA С.

Параллельное программирование в CUDA

Выше мы видели, как просто выполнить стандартную С-функцию на устройстве. Достаточно всего лишь добавить квалификатор _ _global_ _ и вызвать ее, применяя специальный синтаксис с угловыми скобками. Чрезвычайно просто, но и чрезвычайно неэффективно, поскольку инженеры NVIDIA оптимизировали графические процессоры для выполнения сотен вычислений параллельно.

Однако до сих пор мы запустили ядро, выполнимое последовательно. В этих статьях мы увидим, как запустить ядро, которое будет производить вычисления параллельно.