Семейство NVIDIA, видеокарта geforce 8
Революционные изменения в восьмом поколении видеокарт geforce по сравнению с предыдущим, седьмым, обусловлены выходом операционной системы Windows Vista от Microsoft с принципиально новым интерфейсом WGF 2.0 (Windows Graphics Foundation), известным также как DirectX 10 API.

видеокарта geforce 8
В связи с этим архитектура нового графического процессора претерпела существенные изменения. Чтобы понять, насколько мощной спроектировали новую систему, достаточно взглянуть на одну цифру — количество транзисторов. В G80 их 681 млн. Это больше, чем в самых современных процессорах Intel. К примеру, Intel Core 2 Е6850 состоит всего из 291 млн полупроводниковых элементов, а самый производительный Intel Core 2 Extreme QX6850 — из 582 млн.
Такая сложная структура G80 в совокупности с 90-нанометровым техпроцессом ведет к увеличению энергопотребления. В зависимости от модификации, топовые видеокарты geforce восьмого поколения потребляют от 108 до 175 Вт энергии, что катастрофически много в свете борьбы AMD и Intel за повышение энергоэффективности центральных процессоров.
Производимые по 65-нанометровому техпроцессу процессоры архитектуры G92 (также относятся к восьмой серии) выигрывают у G80 по энергоэффективности, однако в абсолютных цифрах TDP по-прежнему остается довольно высоким — около 130 Вт.
Новое поколение имеет принципиально новую архитектуру, основанную на унифицированных потоковых процессорах. Если в графических процессорах предыдущего поколения отдельно выделяли пиксельные и вершинные, которые называли также конвейерами, то в новой архитектуре речь идет именно об унифицированных шейдерных. Такие способны выполнять не только вершинные и пиксельные шейдеры, но также геометрические и физические, что не было реализовано в графических чипах предыдущих поколений. Архитектура унифицированных блоков позволяет достичь сбалансированной нагрузки при выполнении различных шейдеров, чего в принципе нельзя было достичь при использовании классической архитектуры графического процессора.
Унифицированные потоковые процессоры (Unified Streaming Processors, USP) представляют собой скалярные процессоры общего назначения для обработки данных с плавающей запятой. При этом необходимо акцентировать внимание на том, что ранее как NVIDIA, так и ATI применяли в своих изделиях векторную архитектуру исполнительных блоков. Переход к скалярным вызван тем, что традиционная векторная архитектура менее эффективно использует вычислительные ресурсы, чем скалярный дизайн модулей, особенно в случае обработки сложных смешанных шейдеров, сочетающих векторные и скалярные инструкции. Кроме того, довольно сложно добиться эффективной обработки скалярных вычислений с помощью векторных исполнительных модулей.
Потоковые процессоры обрабатывают сырые данные и передают их блокам тексту — рирования. На каждые четыре потоковых приходится один модуль адресации текстур и два модуля фильтрации текстур. То есть на каждый функциональный блок в ядре, приходится 16 потоковых, четыре модуля адресации текстур и восемь модулей фильтрации текстур. Примечательно, что каждому такому блоку выделен кэш первого уровня.
При выполнении скалярным унифицированным потоковым процессором векторного программного кода преобразование в скалярные операции производится графическим процессором GeForce 8800.
Новые режимы сглаживания и анизотропной фильтрации, видеокарты geforce 8
Новая технология сглаживания основана на так называемых coverage samples и получила название Coverage Sampling Anti-Aliasing (CSAA). При этом поддерживаются четыре режима CSAA: 8х, 8xQ, 16х и 16xQ.
Технология CSAA обеспечивает более высокое качество сглаживания, чем технологии, реализованные в предыдущих версиях NVIDIA. Этот метод во многом похож на подход ATI и также имеет дело с псевдостохастическими паттернами и распространением отсчетов на соседние геометрические зоны (происходит размазывание пиксела, пикселы не имеют резкой границы, а как бы переходят один в другой с точки зрения АА, покрывая некую зону). Цвета отсчетов и глубина хранятся отдельно от информации об их местоположении, и, таким образом, на один пиксел может приходиться 16 отсчетов, но, например, всего восемь вычисленных значений глубины — что дополнительно экономит ПСП и такты.
Что касается анизотропной фильтрации, то в NVIDIA GeForce 8800 реализован алгоритм, в котором качество фильтрации не зависит от угла наклона плоскости текстуры. Это позволяет добиться большей четкости и резкости различных объектов, расположенных под острым углом или уходящих в перспективу.
Геометрические шейдеры 4.0, видеокарты geforce 8
Как уже упоминалось, одними из главных особенностей нового графического процессора являются унифицированные процессоры и поддержка API DirectX 10. Эти унифицированные поддерживают не только вершинные и пиксельные шейдеры, но и геометрические шейдеры (Geometry Shaders), что является неотъемлемой частью DirectX 10.
Геометрические шейдеры — это программы, позволяющие обрабатывать данные на уровне не отдельных вершин, как в вершинных шейдерах, а примитивов, то есть набора вершин (линий, полосок, треугольников и т. д.). Они дают возможность существенно повысить эффективность преобразования сложных трехмерных объектов. Работа с геометрическими шейдерами позволит сократить количество тактов графического процессора для просчета сложных геометрических преобразований, таких как реалистичные волосы и струящиеся сложные ткани. Также геометрические шейдеры помогут увеличить реалистичность изображения воды за счет возможностей тесселяции (разбиения полигонов на более мелкие).
Видеокарта geforce 8, физические эффекты
Технология расчета физических эффектов (NVIDIA Quantum Effects) позволяет имитировать и рендерить множество новых физических эффектов, таких как огонь, дым, взрывы, движущиеся волосы, вода и т. д. Разумеется, самые интересные игровые эффекты с эмуляцией физических явлений можно будет наблюдать после выхода игр для DirectX 10.
Видеокарта NVIDIA GeForce 8800 GTX
Логически графический процессор содержит несколько вычислительных блоков: восемь блоков GeForce 8800 GTX. В каждом таком блоке сгруппированы четыре блока TMU (блок наложения текстур) и 16 блоков ALU. Таким образом, мы получаем 128 блоков ALU и 32 блока TMU.
Сама NVIDIA предпочитает говорить, что GeForce 8800 GTX имеет 128 унифицированных потоковых процессоров. По сути, это утверждение не совсем верно и носит в большей степени маркетинговый характер. Более правильно говорить о восьми унифицированных шейдерных (вычислительных блоках), поскольку именно вычислительный блок, а не отдельный блок ALU может обрабатывать часть пиксельного, вершинного или геометрического шейдера, а все ветвления, переходы, условия и т. д. обрабатываются именно на уровне всего вычислительного блока. Впрочем, не будем вдаваться в полемику о терминах.

Унифицированная структура процессоров G80

- Технические характеристики графических ускорителей семейства G80 (продолжение)
Референсная видеокарта geforce на базе GeForce 8800 GTX имеет 768 Мбайт видеопамяти GDDR3. При этом ширина шины памяти составляет 384 бит, а частота работы памяти — 1800 МГц. Соответственно пиковая пропускная способность шины памяти равна 86,4 Гбайт/с.
Каждый вычислительный логический блок имеет собственный кэш первого уровня (L1) для хранения текстур и других данных. Отметим, что частота унифицированных (блоков ALU) отличается от частоты работы текстурных блоков, частоты работы кэша и всех остальных блоков. Например, для NVIDIA GeForce 8800 GTX частота унифицированных составляет 1,35 ГГц, в то время как частота всех остальных блоков равна 575 МГц.
Каждый вычислительный логический блок связан также с кэшем второго уровня (L2). Всего в NVIDIA GeForce 8800 GTX имеется шесть Г2-кэшей, при этом каждый вычислительный блок имеет доступ к любому из них и к любому из шести массивов регистров общего назначения. Таким образом, обработанные одним шейдерным данные могут быть использованы другим шейдерным.
Графический процессор GeForce 8800 GTX обладает шестью разделами растровых операций (ROP). Каждый раздел ROP способен обрабатывать четыре пиксела за такт с общей производительностью 24 пиксела за такт с обработкой цвета и Z-об- работкой.
Блоки растровых операций поддерживает мультисемплированное, суперсемплированное и прозрачное адаптивное сглаживание. Отметим, что добавлены новые режимы сглаживания: 8х, 8xQ, 16х и 16xQ. Новый графический процессор поддерживает сглаживание в формате FP16 и FP32, так что свойственная архитектурам NVIDIA GeForce 6х и GeForce 7х проблема, заключающаяся в невозможности одновременного использования полноэкранного сглаживания и режима HDR, в GeForce 8800 полностью решена.
При проектировании ALU были соблюдены спецификации стандарта IEEE 754, важного для научных, статистических, экономических и других вычислений.
Еще одной важной особенностью архитектуры графического процессора GeForce 8800 является потоковая циклическая обработка данных, позволяющая устранить недостаток классической конвейерной схемы графического процессора — неоптимального использования ресурсов в случае повторной обработки данных.
В архитектуре NVIDIA GeForce 8800 входящие данные (input stream) поступают на вход одного унифицированного , обрабатываются им, по выходе (output stream) записываются в регистры, а затем вновь подаются на вход другого, для исполнения следующей операции обработки.
Применение циклической потоковой обработки данных одновременно с унифицированными процессорами позволяет решить проблему их повторной обработки, довольно часто встречающуюся в современных играх.
Потоковая обработка данных, реализованная в GPU NVIDIA GeForce 8800, является составной частью API DirectX 10. Такая архитектура позволяет отправлять данные, обработанные вершинным или геометрическим шейдером, в буфер памяти, а затем вновь использовать их либо для последующей, либо для повторной обработки.
Как уже отмечалось, он поддерживает множество новых функций и технологий, в том числе следующие.
1. Новые режимы сглаживания и анизотропной фильтрации.
2. Геометрические шейдеры, реализованные в DirectX 10.
3. Режим HDR. Сериия GeForce 8800 поддерживает процесс HDR-рендеринга (High Dynamic Range) с 128-битной точностью не только в режиме FP16 (64-битный цвет), но и FP32 (128-битный цвет), которые могут обрабатываться одновременно с процессом сглаживания. Это позволяет добиться реалистичных эффектов освещения и наложения теней, а также обеспечивает высокую динамику и детализацию самых затемненных и самых светлых объектов. Правда, нужно отметить, что существующие сегодня мониторы не способны выводить изображение в широком динамическом диапазоне. Поэтому даже в случае применения режима HDR при рендеринге для вывода изображения на экран монитора все равно будет использоваться стандартная модель RGB. По данной причине сегодня режим HDR можно рассматривать только как эффективное средство для создания различных визуальных эффектов.
4. Технологию расчета физических эффектов NVIDIA Quantum Effects.
5. Режим Extreme High Definition Gaming. Новые GeForce 8800 и соответственно все видеокарты geforce на их базе поддерживают игровые установки Extreme High Definition (XHD), при которых игры могут запускаться в широкоформатном режиме вплоть до 2560 х 1600, что в семь раз превышает качество картинки HD-телевизора формата 1080i и в два раза — формата 1080р.
6. 2 х DVI Dual Link.
7. Технологии Pure Video и Pure Video HD.
Видеокарта, NVIDIA GeForce 8800 GTS
Разница между видеокартами NVIDIA GeForce 8800 GTX и GeForce 8800 GTS заключается в количестве унифицированных (SP), тактовой частоте работы SP и графического ядра, а также в разрядности шины памяти, частоте работы и объеме поддерживаемой памяти. GeForce 8800 GTS имеет 96 унифицированных потоковых процессоров, работающих на частоте 1200 МГц. Тактовая частота остальных блоков (кэш, модули текстурирования и т. д.) составляет 500 МГц (513 МГц для 320-мегабайтной версии).
Референсная видеокарта geforce на базе GeForce 8800 GTS имеет, в зависимости от версии, 320 либо 640 Мбайт видеопамяти GDDR3. При этом ширина шины памяти составляет 320 бит, а частота работы памяти — 1600 МГц. Соответственно пиковая пропускная способность шины памяти равна 64 Гбайт/с.
Все остальные технические характеристики и функциональные возможности у видеокарта geforce на GeForce 8800 GTX и GeForce 8800 GTS одинаковые.
Видеокарта, NVIDIA GeForce 8800 Ultra
Разработчик позиционирует эту карту как решение для премиум-сегмента. Она является не чем иным, как разогнанной версией NVIDIA GeForce 8800 GTX. Расчетная скорость текстурирования составляет 39,2 Гтексел/с, а закраски — 14,7 Гпиксел/с. Это более чем в 1,6 раза превосходит по скорости текстурирования самую производительную двухпроцессорную модель предыдущего поколения NVIDIA GeForce 7950 GX2.
NVIDIA уже неоднократно практиковала такую политику, когда производительность наращивалась не за счет переработки архитектуры ядра (G80 и так отличается сложностью), а за счет увеличения частоты работы. С точки зрения маркетинга это оправданно.
NVIDIA GeForce 8800 Ultra, как и предшественница (GeForce 8800 GTX), использует память GDDR3 общим объемом 768 Мбайт, тактовая частота составляет всего 612 МГц для основной подсистемы и 1,5 ГГц для подсистемы шейдерных процессоров, что соответственно на 6 и 11 % больше по сравнению с неразогнанной картой. Частота памяти возросла с номинальных 1800 до 2160 МГц. По этому параметру прирост быстродействия составил целых 20 %.
В любом случае эта видеокарта geforce является одним из самых мощных 3D-ускорителей. Хотя некоторые партнеры NVIDIA в своих продуктах самостоятельно разгоняли GeForce 8800 GTX, приблизив их тем самым к возможностям GeForce 8800 Ultra, однако той же производительности им достигнуть не удалось.
Видеокарта, NVIDIA GeForce 8600 GTS
Ввиду того что архитектура G80 довольно гибкая, она позволяет малыми силами урезать производительность видеоадаптеров. Поэтому в данном случае без особых мудрствований NVIDIA и пошла по этому пути. Количество ALU в шейдерном блоке осталось прежним, однако они работают на более чем удвоенной частоте 1450 МГц, а их точность составляет FP32, с поддержкой целочисленных форматов.
Учитывая то, что универсальных шейдерных блоков всего два, легко подсчитать количество универсальных потоковых: 2 х 16 = 32. Странно, что в решениях среднего уровня всего два универсальных шейдера. Разрыв с топовыми продуктами довольно существенный. По аналогии с G80 можно было бы предположить, что количество TMU при этом должно быть равно восьми, однако это не так. Несмотря на общую схожесть, в новые все-таки были внесены некоторые изменения. В частности, количество модулей адресации текстур увеличилось в два раза по сравнению с G80. Поэтому получается, что в GeForce 8600 GTS на каждый блок адресации приходится один блок билинейной фильтрации, что теоретически должно обеспечить прирост скорости при данной операции. Однако в то же время это означает падение производительности при трилинейной и анизотропной фильтрации, которые в топовых продуктах будут выполняться быстрее за счет двукратного превосходства модулей фильтрации над модулями адресации.
Количество блоков растеризации (ROP) уменьшилось относительно G80 в три раза и равно восьми.
Тактовая частота процессоров, построенных на ядре G84, превосходит показатели старших моделей. Это стало возможным благодаря переходу на более тонкий техпроцесс (80 нм).

- Технические характеристики графических ускорителей семейства G84
Карта поддерживает видеопамять стандарта GDDR3 объемом до 512 Мбайт, эффективная частота работы которой составляет 2 ГГц. По этому параметру NVIDIA GeForce 8600 GTS уступает только GeForce 8800 Ultra с ее 2,16 ГГц. Однако скорость обмена данными у последней выше за счет более широкой шины. В G84 она урезана относительно топовых моделей в три раза — до 128 бит.
Видеокарта, NVIDIA GeForce 8600 GT
Построенная на том же ядре, что и NVIDIA GeForce 8600 GTS, данная видеокарта отличается уменьшенной до 540 МГц тактовой частотой , при том, что частота блока потоковых превосходит ее более чем в два раза — 1190 МГц. Остальные режимы и технологии в обеих видеокартах идентичны.
Видеокарта, NVIDIA GeForce 8500 GT/GeForce 8400 GS
Обе видеокарты построены на G86. По своей логической структуре они являются вдвое урезанной версией G84: потоковых процессоров 16 вместо 32, текстурных модулей 8 вместо 16 и 4 блока растеризации вместо 8. Их домен работает на частоте 900 МГц, в то время как тактовая частота основного вдвое меньше — 450 МГц.

- Технические характеристики графических ускорителей семейства G86
Структура шейдерного блока идентична той, которая применяется в G84. Другим важным различием архитектур G86 и G84 является тип поддерживаемой памяти. Младший вариант умеет работать только с GDDR2. Причем если в GeForce 8500 GT поддерживается 128-битная шина, то в GeForce 8400 GS — только 64-битная. Кроме того, NVIDIA GeForce 8400 GS не поддерживает технологию SLI.
Видеокарта geforce, графические ускорители архитектуры G92
Архитектура G92 — не что иное, как развитие предыдущей G80. Новые стали более сложными, количество транзисторов увеличилось почти на 150 тыс. Это обусловлено переработкой блоков TMU, а также переносом функциональности (NVIO), за которую раньше отвечал отдельный чип, на кристалл. В таблице ниже представлены основные характеристики референсных карт, базирующихся на данных чипах.

- Технические характеристики графических ускорителей семейства G92

- Технические характеристики графических ускорителей семейства G92 (продолжение)
В первую очередь необходимо отметить поддержку шины PCI Express 2.0, а также повышенные частоты работы ядра и чуть улучшенные показатели энергоэффективности.
На приведенной ниже схеме видно, что процессор имеет семь конвейеров для параллельной обработки данных. Схема работы TMU изменилась относительно G80: она совпадает с той, которая была реализована в G84 и G86.

- Архитектура G92
По сравнению с G80 уменьшилось количество блоков ROP с шести до четырех. Каждый из блоков обрабатывает по четыре пиксела (или 16 субпикселов), и всего получается 16 пикселов за такт для цвета и Z. В режиме только Z обрабатывается в два раза большее количество семплов за один такт. При MSAA (Multi Sample Anti-Aliasing) 16x чип может выдавать два пиксела за такт, при 4х — восемь и т. д. Как и в G80, полноценно поддерживаются форматы буфера кадров FP32 и FP16 совместно со сглаживанием.
Любители высококачественного видео оценят интегрированные в GPU функции декодирования медиаданных. У NVIDIA для этого есть специальный термин Pure Video HD. В этой реализации поддерживаются кодеки MPEG-2, WMV, Н.264 и VC-1. Все это позволяет выводить картинку с разрешением 1920 х 1080 (Full HD) и битрейтом до 30-40 Мбит/с.
Тем, кто собирает компьютер с нуля, необходимо обратить внимание на поддерживаемые видеовыходы. Новомодного DisplayPort в этом поколении видеокарт нет. Будьте внимательны, выбирая монитор.

