Семейство NVIDIA, видеокарта geforce 8

Революционные изменения в восьмом поколении видеокарт geforce по сравнению с пре­дыдущим, седьмым, обусловлены выходом операционной системы Windows Vista от Microsoft с принципиально новым интерфейсом WGF 2.0 (Windows Graphics Foundation), известным также как DirectX 10 API.

Семейство NVIDIA GeForce 8

видеокарта geforce 8

В связи с этим архитектура нового графического процессора претерпела сущест­венные изменения. Чтобы понять, насколько мощной спроектировали новую систему, достаточно взглянуть на одну цифру — количество транзисторов. В G80 их 681 млн. Это больше, чем в самых современных процессорах Intel. К примеру, Intel Core 2 Е6850 состоит всего из 291 млн полупроводниковых элементов, а самый производительный Intel Core 2 Extreme QX6850 — из 582 млн.

Такая сложная структура G80 в совокупности с 90-нанометровым техпроцессом ведет к увеличению энергопотребления. В зависимости от модификации, топовые видеокарты geforce восьмого поколения потребляют от 108 до 175 Вт энергии, что катаст­рофически много в свете борьбы AMD и Intel за повышение энергоэффективности центральных процессоров.

Производимые по 65-нанометровому техпроцессу процессоры архитектуры G92 (также относятся к восьмой серии) выигрывают у G80 по энергоэффективности, однако в абсолютных цифрах TDP по-прежнему остается довольно высоким — око­ло 130 Вт.

Новое поколение  имеет принципиально новую архитектуру, основанную на унифицированных потоковых процессорах. Если в графических процессорах предыдущего поколения отдельно выделяли пиксельные и вершинные, которые называли также конвей­ерами, то в новой архитектуре речь идет именно об унифицированных шейдерных. Такие  способны выполнять не только вершинные и пик­сельные шейдеры, но также геометрические и физические, что не было реализова­но в графических чипах предыдущих поколений. Архитектура унифицированных блоков позволяет достичь сбалансированной нагрузки при выполнении различных шейдеров, чего в принципе нельзя было достичь при использовании классической архитектуры графического процессора.

Унифицированные потоковые процессоры (Unified Streaming Processors, USP) представляют собой скалярные процессоры общего назначения для обработки данных с плавающей запятой. При этом необходимо акцентировать внимание на том, что ранее как NVIDIA, так и ATI применяли в своих изделиях векторную архитектуру исполнительных блоков. Переход к скалярным  вызван тем, что традиционная векторная архитектура менее эффективно использует вычислительные ресурсы, чем скалярный дизайн мо­дулей, особенно в случае обработки сложных смешанных шейдеров, сочетающих векторные и скалярные инструкции. Кроме того, довольно сложно добиться эф­фективной обработки скалярных вычислений с помощью векторных исполни­тельных модулей.

Потоковые процессоры обрабатывают сырые данные и передают их блокам тексту — рирования. На каждые четыре потоковых приходится один модуль адресации текстур и два модуля фильтрации текстур. То есть на каждый функцио­нальный блок в ядре, приходится 16 потоковых, четыре модуля адресации текстур и восемь модулей фильтрации текстур. Приме­чательно, что каждому такому блоку выделен кэш первого уровня.

При выполнении скалярным унифицированным потоковым процессором вектор­ного программного кода преобразование в скалярные операции производится графическим процессором GeForce 8800.

Новые режимы сглаживания и анизотропной фильтрации, видеокарты geforce 8

Новая технология сглаживания основана на так называемых coverage samples и по­лучила название Coverage Sampling Anti-Aliasing (CSAA). При этом поддержива­ются четыре режима CSAA: 8х, 8xQ, 16х и 16xQ.

Технология CSAA обеспечивает более высокое качество сглаживания, чем техно­логии, реализованные в предыдущих версиях  NVIDIA. Этот метод во многом похож на подход ATI и также имеет дело с псевдостохасти­ческими паттернами и распространением отсчетов на соседние геометрические зоны (происходит размазывание пиксела, пикселы не имеют резкой границы, а как бы переходят один в другой с точки зрения АА, покрывая некую зону). Цвета отсче­тов и глубина хранятся отдельно от информации об их местоположении, и, таким образом, на один пиксел может приходиться 16 отсчетов, но, например, всего восемь вычисленных значений глубины — что дополнительно экономит ПСП и такты.

Что касается анизотропной фильтрации, то в NVIDIA GeForce 8800 реализован алгоритм, в котором качество фильтрации не зависит от угла наклона плоскости текстуры. Это позволяет добиться большей четкости и рез­кости различных объектов, расположенных под острым углом или уходящих в пер­спективу.

Геометрические шейдеры 4.0, видеокарты geforce 8

Как уже упоминалось, одними из главных особенностей нового графического про­цессора являются унифицированные процессоры и поддержка API DirectX 10. Эти унифицированные  поддерживают не только вершинные и пиксельные шейдеры, но и геометрические шейдеры (Geometry Shaders), что является неотъ­емлемой частью DirectX 10.

Геометрические шейдеры — это программы, позволяющие обрабатывать данные на уровне не отдельных вершин, как в вершинных шейдерах, а примитивов, то есть набора вершин (линий, полосок, треугольников и т. д.). Они дают возможность существенно повысить эффективность преобразования сложных трехмерных объ­ектов. Работа с геометрическими шейдерами позволит сократить количество тактов графического процессора для просчета сложных геометрических преобразований, таких как реалистичные волосы и струящиеся сложные ткани. Также геометриче­ские шейдеры помогут увеличить реалистичность изображения воды за счет воз­можностей тесселяции (разбиения полигонов на более мелкие).

Видеокарта geforce 8, физические эффекты

Технология расчета физических эффектов (NVIDIA Quantum Effects) позволяет имитировать и рендерить множество новых физических эффектов, таких как огонь, дым, взрывы, движущиеся волосы, вода и т. д. Разумеется, самые интересные иг­ровые эффекты с эмуляцией физических явлений можно будет наблюдать после выхода игр для DirectX 10.

Видеокарта NVIDIA GeForce 8800 GTX

Логически графический процессор содержит несколько вычислительных блоков: восемь блоков GeForce 8800 GTX. В каждом таком блоке сгруппированы четыре блока TMU (блок наложения текстур) и 16 блоков ALU. Таким образом, мы получаем 128 блоков ALU и 32 блока TMU.

Сама NVIDIA предпочитает говорить, что GeForce 8800 GTX имеет 128 унифици­рованных потоковых процессоров. По сути, это утверждение не совсем верно и носит в большей степени маркетинговый характер. Более правильно говорить о восьми унифицированных шейдерных  (вычислительных блоках), поскольку именно вычислительный блок, а не отдельный блок ALU может обра­батывать часть пиксельного, вершинного или геометрического шейдера, а все ветвления, переходы, условия и т. д. обрабатываются именно на уровне всего вы­числительного блока. Впрочем, не будем вдаваться в полемику о терминах.

Унифицированная структура процессоров G80

Унифицированная структура процессоров G80

 Технические характеристики графических ускорителей семейства G80
 Технические характеристики графических ускорителей семейства G80 (продолжение)
Технические характеристики графических ускорителей семейства G80 (продолжение)

Референсная видеокарта geforce на базе  GeForce 8800 GTX имеет 768 Мбайт видеопамяти GDDR3. При этом ширина шины памяти составляет 384 бит, а час­тота работы памяти — 1800 МГц. Соответственно пиковая пропускная способность шины памяти равна 86,4 Гбайт/с.

Каждый вычислительный логический блок имеет собственный кэш первого уров­ня (L1) для хранения текстур и других данных. Отметим, что частота унифициро­ванных  (блоков ALU) отличается от частоты работы текстурных блоков, частоты работы кэша и всех остальных блоков. Например, для  NVIDIA GeForce 8800 GTX частота унифицированных  составляет 1,35 ГГц, в то время как частота всех остальных блоков  равна 575 МГц.

Каждый вычислительный логический блок связан также с кэшем второго уровня (L2). Всего в  NVIDIA GeForce 8800 GTX имеется шесть Г2-кэшей, при этом каждый вычислительный блок имеет доступ к любому из них и к любому из шести массивов регистров общего назначения. Таким образом, обработанные одним шейдерным  данные могут быть использованы другим шейдерным.

Графический процессор GeForce 8800 GTX обладает шестью разделами растровых операций (ROP). Каждый раздел ROP способен обрабатывать четыре пиксела за такт с общей производительностью 24 пиксела за такт с обработкой цвета и Z-об- работкой.

Блоки растровых операций поддерживает мультисемплированное, суперсемплированное и прозрачное адаптивное сглаживание. Отметим, что добавлены новые режимы сглаживания: 8х, 8xQ, 16х и 16xQ. Новый графический процессор поддер­живает сглаживание в формате FP16 и FP32, так что свойственная архитектурам NVIDIA GeForce 6х и GeForce 7х проблема, заключающаяся в невозможности од­новременного использования полноэкранного сглаживания и режима HDR, в GeForce 8800 полностью решена.

При проектировании ALU были соблюдены спецификации стандарта IEEE 754, важного для научных, статистических, экономических и других вычислений.

Еще одной важной особенностью архитектуры графического процессора GeForce 8800 является потоковая циклическая обработка данных, позволяющая устранить не­достаток классической конвейерной схемы графического процессора — неопти­мального использования ресурсов в случае повторной обработки данных.

В архитектуре NVIDIA GeForce 8800 входящие данные (input stream) поступают на вход одного унифицированного , обрабатываются им, по выходе (output stream) записываются в регистры, а затем вновь подаются на вход другого,  для исполнения следующей операции обработки.

Применение циклической потоковой обработки данных одновременно с унифи­цированными процессорами позволяет решить проблему их повторной обработки, довольно часто встречающуюся в современных играх.

Потоковая обработка данных, реализованная в GPU NVIDIA GeForce 8800, явля­ется составной частью API DirectX 10. Такая архитектура позволяет отправлять данные, обработанные вершинным или геометрическим шейдером, в буфер памя­ти, а затем вновь использовать их либо для последующей, либо для повторной обработки.

Как уже отмечалось, он поддерживает множество новых функций и технологий, в том числе следующие.

1. Новые режимы сглаживания и анизотропной фильтрации.

2. Геометрические шейдеры, реализованные в DirectX 10.

3. Режим HDR. Сериия GeForce 8800 поддерживает процесс HDR-рендеринга (High Dynamic Range) с 128-битной точностью не только в режиме FP16 (64-битный цвет), но и FP32 (128-битный цвет), которые могут обрабатываться одновременно с процессом сглаживания. Это позволяет добиться реалистичных эффектов освещения и наложения теней, а также обес­печивает высокую динамику и детализацию самых затемненных и самых свет­лых объектов. Правда, нужно отметить, что существующие сегодня мониторы не способны выводить изображение в широком динамическом диапазоне. Поэтому даже в случае применения режима HDR при рендеринге для вывода изображения на экран монитора все равно будет использоваться стандартная модель RGB. По данной причине сегодня режим HDR можно рассматривать только как эффективное средство для создания различных визуальных эф­фектов.

4. Технологию расчета физических эффектов NVIDIA Quantum Effects.

5. Режим Extreme High Definition Gaming. Новые  GeForce 8800 и соответственно все видеокарты geforce на их базе поддерживают игровые установки Extreme High Definition (XHD), при которых игры могут запускаться в широкоформатном режиме вплоть до 2560 х 1600, что в семь раз превышает качество картинки HD-телевизора формата 1080i и в два раза — фор­мата 1080р.

6. 2 х DVI Dual Link.

7. Технологии Pure Video и Pure Video HD.

Видеокарта,  NVIDIA GeForce 8800 GTS

Разница между видеокартами NVIDIA GeForce 8800 GTX и GeForce 8800 GTS заключается в количестве унифицированных  (SP), так­товой частоте работы SP и графического ядра, а также в разрядности шины памя­ти, частоте работы и объеме поддерживаемой памяти.  GeForce 8800 GTS имеет 96 унифицированных потоковых процессоров, работа­ющих на частоте 1200 МГц. Тактовая частота остальных блоков (кэш, модули текстурирования и т. д.) составляет 500 МГц (513 МГц для 320-мегабайтной версии).

Референсная видеокарта geforce на базе  GeForce 8800 GTS имеет, в зависимо­сти от версии, 320 либо 640 Мбайт видеопамяти GDDR3. При этом ширина шины памяти составляет 320 бит, а частота работы памяти — 1600 МГц. Соответственно пиковая пропускная способность шины памяти равна 64 Гбайт/с.

Все остальные технические характеристики и функциональные возможности у видеокарта geforce на  GeForce 8800 GTX и GeForce 8800 GTS одинаковые.

Видеокарта, NVIDIA GeForce 8800 Ultra

Разработчик позиционирует эту карту как решение для премиум-сегмента. Она является не чем иным, как разогнанной версией NVIDIA GeForce 8800 GTX. Расчетная скорость текстурирования составляет 39,2 Гтексел/с, а закраски — 14,7 Гпиксел/с. Это более чем в 1,6 раза превосходит по скорости текстурирования самую производительную двухпроцессорную модель предыдущего поколения NVIDIA GeForce 7950 GX2.

NVIDIA уже неоднократно практиковала такую политику, когда производитель­ность наращивалась не за счет переработки архитектуры ядра (G80 и так отлича­ется сложностью), а за счет увеличения частоты работы. С точки зрения маркетин­га это оправданно.

NVIDIA GeForce 8800 Ultra, как и предшественница (GeForce 8800 GTX), исполь­зует память GDDR3 общим объемом 768 Мбайт, тактовая частота  составляет всего 612 МГц для основной подсистемы и 1,5 ГГц для подсистемы шейдерных процессоров, что соответственно на 6 и 11 % больше по сравнению с неразогнанной картой. Частота памяти возросла с номинальных 1800 до 2160 МГц. По этому параметру прирост быстродействия составил целых 20 %.

В любом случае эта видеокарта geforce является одним из самых мощных 3D-ускорителей. Хотя некоторые партнеры NVIDIA в своих продуктах самостоятельно разгоняли GeForce 8800 GTX, приблизив их тем самым к возможностям GeForce 8800 Ultra, однако той же производительности им достигнуть не удалось.

Видеокарта, NVIDIA GeForce 8600 GTS

Ввиду того что архитектура G80 довольно гибкая, она позволяет малыми силами урезать производительность видеоадаптеров. Поэтому в данном случае без особых мудрствований NVIDIA и пошла по этому пути. Количество ALU в шейдерном блоке осталось прежним, однако они работают на более чем удвоенной частоте 1450 МГц, а их точность составляет FP32, с поддержкой целочисленных фор­матов.

Учитывая то, что универсальных шейдерных блоков всего два, легко подсчитать количество универсальных потоковых: 2 х 16 = 32. Странно, что в решениях среднего уровня всего два универсальных шейдера. Разрыв с топо­выми продуктами довольно существенный. По аналогии с G80 можно было бы предположить, что количество TMU при этом должно быть равно восьми, однако это не так. Несмотря на общую схожесть, в новые  все-таки были вне­сены некоторые изменения. В частности, количество модулей адресации текстур увеличилось в два раза по сравнению с G80. Поэтому получается, что в GeForce 8600 GTS на каждый блок адресации приходится один блок билинейной фильтрации, что теоретически должно обеспечить прирост скорости при данной операции. Однако в то же время это означает падение производительности при трилинейной и анизотропной фильтрации, которые в топовых продуктах будут выполняться быстрее за счет двукратного превосходства модулей фильтрации над модулями адресации.

Количество блоков растеризации (ROP) уменьшилось относительно G80 в три раза и равно восьми.

Тактовая частота процессоров, построенных на ядре G84, превосходит показатели старших моделей. Это стало возможным благодаря переходу на более тонкий техпроцесс (80 нм).

Технические характеристики графических ускорителей семейства G84
Технические характеристики графических ускорителей семейства G84

Карта поддерживает видеопамять стандарта GDDR3 объемом до 512 Мбайт, эф­фективная частота работы которой составляет 2 ГГц. По этому параметру NVIDIA GeForce 8600 GTS уступает только GeForce 8800 Ultra с ее 2,16 ГГц. Однако скорость обмена данными у последней выше за счет более широкой шины. В  G84 она урезана относительно топовых моделей в три раза — до 128 бит.

Видеокарта, NVIDIA GeForce 8600 GT

Построенная на том же ядре, что и NVIDIA GeForce 8600 GTS, данная видео­карта отличается уменьшенной до 540 МГц тактовой частотой , при том, что частота блока потоковых  превосходит ее более чем в два раза — 1190 МГц. Остальные режимы и технологии в обеих видеокартах иден­тичны.

Видеокарта, NVIDIA GeForce 8500 GT/GeForce 8400 GS

Обе видеокарты построены на  G86. По своей логической структуре они являются вдвое урезанной версией G84: пото­ковых процессоров 16 вместо 32, текстурных модулей 8 вместо 16 и 4 блока расте­ризации вместо 8. Их домен работает на частоте 900 МГц, в то время как тактовая частота основного вдвое меньше — 450 МГц.

Технические характеристики графических ускорителей семейства G86
Технические характеристики графических ускорителей семейства G86

Структура шейдерного блока идентична той, которая применяется в G84. Другим важным различием архитектур G86 и G84 является тип поддерживаемой памяти. Младший вариант умеет работать только с GDDR2. Причем если в GeForce 8500 GT поддерживается 128-битная шина, то в GeForce 8400 GS — только 64-битная. Кро­ме того, NVIDIA GeForce 8400 GS не поддерживает технологию SLI.

Видеокарта geforce, графические ускорители архитектуры G92

Архитектура G92 — не что иное, как развитие предыдущей G80. Новые  стали более сложными, количество транзисторов увеличилось почти на 150 тыс. Это обусловлено переработкой блоков TMU, а также переносом функциональности (NVIO), за которую раньше отвечал отдельный чип, на кристалл. В таблице ниже пред­ставлены основные характеристики референсных карт, базирующихся на данных чипах.

Технические характеристики графических ускорителей семейства G92
Технические характеристики графических ускорителей семейства G92
Технические характеристики графических ускорителей семейства G92 (продолжение)
Технические характеристики графических ускорителей семейства G92 (продолжение)

В первую очередь необходимо отметить поддержку шины PCI Express 2.0, а также повышенные частоты работы ядра и чуть улучшенные показатели энергоэффек­тивности.

На приведенной ниже схеме  видно, что процессор имеет семь конвейеров для параллельной обработки данных. Схема работы TMU изменилась относитель­но G80: она совпадает с той, которая была реализована в G84 и G86.

Архитектура G92
Архитектура G92

По сравнению с G80 уменьшилось количество блоков ROP с шести до четырех. Каждый из блоков обрабатывает по четыре пиксела (или 16 субпикселов), и всего получается 16 пикселов за такт для цвета и Z. В режиме только Z обрабатывается в два раза большее количество семплов за один такт. При MSAA (Multi Sample Anti-Aliasing) 16x чип может выдавать два пиксела за такт, при 4х — восемь и т. д. Как и в G80, полноценно поддерживаются форматы буфера кадров FP32 и FP16 совместно со сглаживанием.

Любители высококачественного видео оценят интегрированные в GPU функции декодирования медиаданных. У NVIDIA для этого есть специальный термин Pure Video HD. В этой реализации поддерживаются кодеки MPEG-2, WMV, Н.264 и VC-1. Все это позволяет выводить картинку с разрешением 1920 х 1080 (Full HD) и битрейтом до 30-40 Мбит/с.

Тем, кто собирает компьютер с нуля, необходимо обратить внимание на поддержи­ваемые видеовыходы. Новомодного DisplayPort в этом поколении видеокарт нет. Будьте внимательны, выбирая монитор.

Яндекс.Метрика