Общие особенности архитектуры современных процессоров

Два прошедших года можно назвать революционными на рынке микропроцессоров архитектуры х86. В результате того, что основные производители (Intel и AMD) столкнулись со значительными трудностями на пути увеличения тактовых частот как процессорных ядер, так и шин передачи данных, а пользователи и разработчи­ки программного обеспечения по-прежнему требовали увеличения мощности систем, пришлось искать другие выходы из сложившегося положения.

Общие особенности архитектуры современных процессоров

В этом свете наиболее перспективным решением стало увеличение количества ядер микропроцессора. Следует сказать, что подобная идея впервые пришла на ум «го­лубому гиганту» (IBM) еще в далеком 1999 году, когда он представил опытный образец двухъядерного Power4, а в 2001 году совместно с Apple уже вовсю торговал готовыми решениями.

Производители процессоров для платформы х86 спустя год после этого события (2002) заявили о своих намерениях развивать многоядерную архитектуру микро­процессоров. Стремясь подтвердить свой статус лидера отрасли, компания Intel первой выпустила подобный чип в марте 2005 года. Ее главный конкурент, AMD, отстав всего на три дня, представил полную линейку серверных двухъядерных процессоров Opteron, анонсировал двухъядерные процессоры Athlon 64 Х2 для настольных систем и начал поставки Opteron 8хх.

В 2007—2008 годах индустрия перешла на трех- и четырехъядерные процессоры, причем в момент этого перехода сложившийся баланс сил на рынке вновь коренным образом изменился. Апофеозом противостояния двух ведущих компаний стал момент выхода на рынок продуктов Intel Core 2. Это событие датируется 27 июля 2006 года, что не только изменило расстановку сил на рынке, но и коренным обра­зом повлияло на критерии оценки производительности.

Маркетологи из Intel предложили вместо тактовой частоты оперировать катего­риями энергоэффективности. В этом свете ключевым параметром стала оптималь­ная производительность, которая отражает количество энергии, затрачиваемой процессором на выполнение определенного набора инструкций.

Рассмотрим формулу, предложенную Intel, более детально. Производительность (Performance) определяется как произведение тактовой частоты процессора (Frequency) на величину IPC (Instructions Per Clock), определяющую количество инструкций, исполняемых CPU за один такт:

Performance = Frequency • IPC.

Получается, что увеличить быстродействие можно двумя способами: поднимая частоту и/или увеличивая количество инструкций, выполняемых за один такт.

Параметр Frequency зависит от технических характеристик процессора. Для кон­кретного экземпляра процессора ее можно увеличить сверх номинала, подняв на­пряжение и не забыв при этом поставить более мощную систему охлаждения.

В свою очередь, второй аргумент формулы зависит от логической структуры про­цессорного ядра: количества декодеров инструкций и количества вычислительных блоков. Функциональные особенности каждого из этих узлов играют не менее важную роль, чем их количество. В частности, повышение производительности процессора возможно за счет уменьшения числа операций для обработки одного и того же объема данных. Типичным примером является внедрение SIMD-команд, таких как 3DNow!, SSE, SSE2, SSE3 (о ней чуть ниже), SSE4.

Что же касается энергопотребления, то оно вычисляется как произведение тактовой частоты процессора на квадрат напряжения U, при котором функционирует про­цессорное ядро, и некую величину Cdynamic (динамическая емкость), определя­емую микроархитектурой ЦП и зависящую от количества транзисторов и их ак­тивности во время работы процессора:

Power = Frequency • U1 • Cdynamic.

Из этих двух формул вытекает следующее соотношение, определяющее энергоэф­фективность процессора:

Performance _ IPC Power U2-Cdynamic

Из нее следует, что для получения наилучшего показателя производителям необ­ходимо работать над оптимизацией микроархитектуры с целью улучшения функ­циональности исполнительных блоков, при этом не допуская чрезмерного увели­чения динамической емкости.

Как мы уже вскользь упоминали, напряжение питания ядра, также оказывающее влияние на соотношение производительности и энергопотребления, зависит не столько от микроархитектуры, сколько от технологических особенностей изготов­ления процессора. В этом легко убедиться, сравнив два процессора с одним и тем же индексом, но произведенных по различным техпроцессам.

Что касается тактовой частоты то, как показывают наши выкладки, на рассматри­ваемое соотношение она вообще не влияет. Поэтому, сделав такой элегантный «ход конем», Intel вышла из гонки, не только сохранив репутацию, но и озадачив при этом AMD, чьи изделия на тот момент также были довольно «горячи».

На первый взгляд все эти формулы и логические выкладки от Intel весьма перспек­тивны, однако подобный подход в оценке эффективности не является оптималь­ным, ведь замечательными показателями энергоэффективности при желании смогут похвастаться и маломощные процессоры.

В свете сомнительной формулы от Intel главный конкурент в долгу не остался. В сво­ей инновационной разработке под кодовым именем Fusion инженеры из AMD предложили пойти еще дальше и оценивать продукт по формуле «операция на ватт и на доллар».

В частности, концепция Fusion предполагает объединение ядер различного на­значения в одном чипе. Каждое из них (или каждая из групп ядер) будет обра­щаться к собственной кэш-памяти, а в качестве связующей шины выступит HyperTransport. Процессоры Fusion будут напрямую обращаться к системной памяти, разделяемой между нуждами центральной и графической частей процес­сора. По предварительным данным, даже техпроцесс изготовления CPU и GPU будет различаться.

В 2009 году компания Intel сделала основную ставку на процессоры, построенные на основе новой архитектуры Nehalem (семейства Core i7, i5 и i3).

В начале 2010 года Intel планирует перейти на новую 32-нанометровую технологию, на основе которой будут выпущены процессоры сразу двух семейств: двухъядерные настольные процессоры Clarkdale с интегрированным графическим ядром выйдут в I квартале 2010 года, а шестиядерные процессоры Gulftown в исполнении LGA 1366 появятся во II квартале 2010 года. Последние получат 6 х 256 Кбайт кэша второго уровня и общий кэш третьего уровня объемом 12 Мбайт, а встроенный контроллер памяти будет поддерживать трехканальной DDR3-1333. Уровень TDP останется прежним (130 Вт), на архитектурном уровне появится поддержка инструкций AES-NI.

В целом характеристики процессоров семейства Intel Core можно свести в единую таблицу

 

Характеристики процессоров семейства Intel Core

Характеристики процессоров семейства Intel Core

Яндекс.Метрика