Архитектура топового чипсета RV770

Основную вычислительную нагрузку в этом чипсете  выполняют 10 SIMD- ядер (можно провести аналогию с ТРС в процессорах NVIDIA). Каждое из ядер, в свою очередь, состоит из 16 суперскалярных потоковых процессоров, в состав которых входят по пять 32-разрядных логических модулей. Таким образом, общее количество вычислительных блоков, которое любят приводить в маркетинговых материалах, составляет ровно 800, что в 2,5 раза больше, чем в процессоре RV670.

Что примечательно, эти же блоки используются для 64-разрядных вычислений. В этом проявилась изобретательность разработчиков AMD/ATI. Они, в отличие от NVIDIA, сделали блоки универсальными, тем самым сохранив относительно простую структуру своего продукта, но при этом существенно нарастив функцио­нальность.

Рассмотрим более подробно структуру SIMD-ядра.

На входе данные распределяются потоковым диспетчером и попадают в вычисли­тельные блоки, которых в одном модуле, как мы уже упоминали, 16. Каждый такой блок имеет 16 Кбайт собственной памяти.

Существенно переработаны блоки TMU. Во-первых, они привязаны к SIMD так же, как у NVIDIA. Во-вторых, немного упрощена их структура и по­вышена частота их работы. В-третьих, по сравнению с RV670 удвоена полоса про­пускания к текстурному кэшу с возможностью выборки до 160 текстур за такт.

 

Архитектура ядра RV770

Архитектура ядра RV770


Структура блока TMU

Структура блока TMU

Наряду с TMU подверглись существенной ревизии и блоки ROP. Их производи­тельность удвоена по сравнению с предыдущим поколением чипов, хотя количе­ство блоков осталось тем же. Изменения достигнуты за счет пересмотра архитек­туры, что дает превосходные результаты в режиме MSAA.

Невероятно, но факт: разработчики отказались от применяемой ранее кольцевой структуры шины памяти в пользу более традиционной с центральным хабом (рис. 4.11). Как видно на схеме, контроллеры памяти расположены по краям чипа. Задача хаба — распределять потоки данных между генерирующими трафик блока­ми. Кроме того, он служит связующим звеном с шиной PCI Express 2.0, CrossFireX, UVD2 и контроллерами вывода.

Новые чипы поддерживают память GDDR5, работающую на эффективной часто­те 3,6-4 ГГц. В свою очередь, это позволяет добиться высоких скоростей передачи данных даже на 256-битной шине (до 120 Гбайт/с).

Подтвердив еще раз постулат, что самые эффективные решения должны быть простыми, AMD/ATI выпустила на рынок очень сильный продукт как по себестои­мости, так и по производительности, который конкурирует с изделиями NVIDIA во всех сегментах.

Чипы RV730 и RV710 базируются на этих же принципах и отличаются лишь ко­личеством блоков и, соответственно, меньшей производительностью.

За работой всех систем следит PowerPlay — технология, которая пришла из сферы мобильных компьютеров. Она следит за загруженностью всех компонентов системы и управляет ключевыми параметрами, такими как частоты работы, напряжения, обо­роты вентилятора. Все это призвано улучшить показатели энергоэффективности.

Яндекс.Метрика