Intel Core i7-920 vs Intel Core 2 Quad QX9650

Обзор процессора Intel Core i7-920

Intel Core i7
Intel Core i7

Ни для кого не будет новостью, что Intel выпускает по линейке новых процессоров для десктопов ровно раз в год. Такова политика компании. Причем выпускается новая серия одним из двух подходов: либо производство Intel переходит на новый технологический процесс, либо компания меняет архитектуру новых процессоров. Так, в 2007 году Intel перевела свое производство на 45-нм процесс (процессоры на ядрах Yorkfield и Wolfdale, они же торговая марка Core 2). В 2008 году Intel не стала проводить феерические по затратам операции по переходу на новый техпроцесс (хотя, если верить президенту нижегородского филиала Intel Владимиру Богданову, — такие технологии у intel есть), а пошла чуть менее затратным путем смены архитектуры Core 2. Результатом таких изменений стал новый процессор на базе измененного ядра Core с кодовым именем Nehalem. А у нас в редакции на протяжении пожалуй уже шести месяцев находится серийный образец, носящий имя Core i7 920, выполненный на ядре Bloomfield (отличается от классической архитектуры Nehalem встроенным контроллером памяти). Идея встраивать контроллер памяти в процессор на рынке не нова -впервые ее применила AMD, добившись от процессоров ощутимого прироста производительности. Но не только контроллером DDR III примечателен Core i7 920(да и вообще всё семейство Nehalem). Архитектура процессора приобрела также абсолютно инновационную модульную структуру, содержащую новое вычислительное ядро, новую процессорную шину, потенциальную возможность интеграции GPU. А также новую технологию мульти поточности — SMT, и контроллер, отвечающий за управление напряжением и частотой каждого из ядер Core i7 (Power Control Unit, PCU). Кроме того, при отсутствии нагрузки PCU способен вообще отключать неиспользуемые ядра Core i7.

процессор Intel Core i7-920
Процессор Intel Core i7. Нам достался инженерный образец с надписью "Intel CONFIDENTIAL". Ну как всегда, в общем-то.

 Для чего потребовались подобные ухищрения? Причин несколько.

Во-первых, процессоры на архитектуре Core 2 сложно масштабировались. Напомним, что изначально Intel планировала выпускать под маркой Core только двухядерные процессоры. И когда возникла необходимость в использовании четырёх ядер -единственно верным решением было объединить в один корпус два двухядерных кристалла. Которые нужно было как-то заставить взаимодействовать друг с другом. Что привело к появлению в процессорах Core 2 Quad процессорной шины Quad Pumped Bus (QPB). Которая не позволяла производить обмен между ядрами процессора напрямую, а также не показала должную пропускную способность, необходимую для следующих поколений многоядерных процессоров. За что и была отправлена инженерами Intel в анналы истории, уступив место более прогрессивной процессорной шине QPI (Quick Path Interconnects), реализованной на топологии point-to-point (не путать см peer-2-peer, это совсем из другой оперы, и относится к торрентам!). Данные в QPI передаются по двум соединениям шириной в 20 бит каждое, при этом 16 из них предназначены исключительно для передачи данных. А в итоге пропускная способность шины QPI приближается вплотную к способности небезызвестной шины HyperTransport v3.0, достигая пикового значения в 25Гбит/сек.

Архитектура Core i7
Кристалл Core i7

 Во-вторых, для обеспечения нормальной работы Core i7 потребовалось серьезно переработать кеш-память L2, т.к. одна большая разделяемая кеш-память L2 (к примеру, у процессорного ядра Penryn) не справлялась с возлагаемыми на нее объемами данных достаточно быстро. Вместо этого инженеры Intel оснастили каждое из ядер Core i7 собственным L2-кешем объемом в 256 кб. При этом размер кеша L1 в Core i7 не изменился, его объем по прежнему составляет 64кб (32кб -под данные и 32 кб -под процессорные инструкции).

Кстати, одного кеша L1 и кеша L2 инженерам показалось обоснованно маловато, поэтому Core i7 (как и всё семейство Nehalem) оснастили разделяемой кэш-памятью третьего уровня объемом 8 Мб. По крайней мере, в Core i7 920 этот кеш присутствует однозначно.

И, наконец, самое важное изменение архитектуры процессоров Nehalem — модульная структура, позволяющая изменять параметры процессоров более чем вольно. Так, буквально совсем недавно был анонсирован процессор со встроенным GPU (для Intel это инновация, встроенный графический процессор применялся ранее только в Sony Cell, рассчитанном исключительно на игровую консоль PlayStation 3), ну а Core i7 920 содержит встроенный контроллер трехканальной памяти DDR 3.

Core i7 трехканальная DDR 3
Стандартно память DDR 3 у нас теперь трехканальная

Кроме всего вышеперечисленного, незначительным изменениям подверглось само вычислительное ядро Core i7. Во взятом за основу ядре Core изменили декодеры простых и сложных команд. Плюс улучшили технологию Macrofusion (отвечающую за использование режимов x32 или x64 и выполняющую до пяти процессорных команд как единую инструкцию), оптимизировали блоки Loop Stream Detector и Stack Buffer (предсказание перехода). А для технологии Simultaneous MultiThreading (SMT) увеличили объем буферов Reorder Buffer и Reservation Station.

 Simultaneous MultiThreading — сама по себе интересная технология. Она представляет из себя логическое развитие отложенной до появления Core технологии HyperThreating (HT, распараллеливание процессов), используемой в первых процессорах Intel Pentium IV. Напомним, что визуально для пользователя включение технологии HyperThreating выражалось в отображении удвоенного количества процессоров и незначительном приросте производительности в оптимизированных под технологию приложениях. В случае же использования неоптимизированного ПО можно было заметить строго противоположный результат. Рынок разработчиков ПО для настольных компьютеров воспринял новую технологию очень вяло, в результате чего Intel отложила HT "на полку". Но не прошло и пяти лет, как технология была переработана и возрождена в Core i7 под названием SMT.

Восемь виртуальных ядер в Core i7
Восемь ядер Core i7, из которых только 4 -реальные

Но вернемся к лежащему на тестовом столе экземпляру Core i7. Первый минус всего этого многообразия в маленьком кристалле проявился сразу же -невозможность поместить это все в старом корпусе Core 2 и, следовательно, смена сокета под процессор на материнской плате. Выводов на материнской плате теперь будет 1366 (сокет LGA-1366). 

Socket LGA-1366
Вот ты какой, сокет LGA 1366!

Для материнских плат под Core i7 потребовался новый референс-дизайн и чипсет, получивший название Intel X58. И материнские платы на чипсете X58 оснащены минимум тремя слотами DIMM DDR 3. Стандартное же количество слотов памяти на платах с чипсетом X58 (например, на плате Foxconn Renaissance X58 Digital Life) -шесть.

 

Foxconn Renaissance X58 Digital Life<
Foxconn Renaissance X58 Digital Life оснащен шестью слотами DIMM для памяти DDR III

Вернемся к нашему Core i7. Упомянутый нами выше блок PCU тесно связан с технологией Turbo Boost, которая также управляет частотами ядра, но "в обратную сторону" — на повышение частоты. Естественно, что изменение частоты осуществляется программно через изменение множителя на единицу от штатного (это строгое аппаратное ограничение Core i7). Вот как это смотрится с точки зрения конечного пользователя Core i7:

Intel Core i7-920 со включенным TurboBurst
Intel Core i7-920 со включенным TurboBurst. Задирание множителя на единицу от стандартного дает прирост производительности

Сравнение ядер Core i7 и Core2Duo можно свести в следующую таблицу:

 

Параметры ядра

Core i7

Core2Duo / Core2Quad

Техпроцесс выпуска

45 нм

45 нм

Число ядер / кристаллов

4/1

4/2

Поддержка мульти поточности

SMT

Контроллер памяти

3-канальный DDR3

Кэш L1

64 кб (32кб+32кб)

64 кб (32кб+32кб)

Кэш L2

4 х 256 кб

2 х 6 Мб

Кэш L3

8 Мб

Тип шины/ частота

QPI / 133 МГц

QPB/ 266, 333 или 400 МГц

Пакет TDP

130 Вт

130 Вт

Сокет

LGA 1366

LGA 775

Поддержка SSE

SSE 4.1, SSE 4.2

SSE 4.1

Площадь ядра (кв. мм)

263

2 x 107

Кол-во миллионов транзисторов

731

2 x 410

Управление питанием/частотой

Speed Step, PCU, TurboBurst

Speed Step

Ассортимент же предлагаемых в продаже процессоров Core i7 на сегодняшний день таков:

 

Наименование

Core i7 920

Core i7 940

Core i7 965 Extreme Edition

Количество ядер

4

4

4

Поддержка SMT

+

+

+

Частота

2,66 ГГц

2,93 ГГц

3,20 ГГц

Множитель

20

22

24

Шина (QPI)

4,8 GT/s

4,8 GT/s

6,4 GT/s

Поддержка памяти

DDR3-800/1066

DDR3-800/1066

DDR3-800/1066/1333/1600

Тепловой пакет (TDP, Ватт)

130

130

130

Рекомендуемая цена

$ 284

$ 562

$ 999

В подобных коробках продаются в России боксовые версии Intel Core i7 920
В подобных коробках продаются в России "боксовые" версии Intel Core i7-920

Из таблицы хорошо видно что наш Core i7 920 — самый маломощный процессор в новой линейке Intel Core. Тем более интересно протестировать его параллельно с четырехядерным процессором из линейки Core2Quad. Например, с Core 2 Quad QX9650.

Тестируем производительность Core i7 920 по сравнению с Core 2 Quad QX9650

При тестировании мы ставили следующие цели:

  • Узнать, как смена архитектуры с Core2Quad на Core i7 повлияла на общую производительность системы.
  • Узнать, насколько быстрее станет работать Core i7 920 сов ключенным режимом TurboBurst.
  • Понять, как в реальности трехканальный доступ к памяти улучшит быстродействие системы.

Было собрано два тестовых стенда, аналогичных тем, которые год назад собирали коллеги из 3DNews при тестировании инженерного образца Intel Core i7-920:

 

Материнская плата

ASUS P5E64 WS Evolution (Intel X48)

ASUS P6T Deluxe (Intel X58)

Процессор

Core 2 Quad QX9650

Core i7 920

Кулер

Gigabyte G-Power

Gigabyte G-Power

Видеокарта

ASUS 8800 GT PCI-X

ASUS 8800 GT PCI-X

Звуковая карта

Нет

Нет

HDD

Samsung HD160JJ

Samsung HD160JJ

Память

3×1024 Мб Qimonda DDR3-1333

3×1024 Мб Qimonda DDR3-1333

Корпус

нет

нет

Блок питания

FSP 550 Вт

FSP 550 Вт

OS

Microsoft Windows Vista Home Premium

Microsoft Windows Vista Home Premium

Драйверы видео

nVIDIA ForceWare 186.17 WHQL

nVIDIA ForceWare 186.17 WHQL

Драйверы чипсета

Intel inf 10.0.0.10

Intel inf 10.0.0.10

Да, Вы правильно удивились -корпуса для тестирования мы не использовали. В качестве тестового стенда использовалось шасси от корпусов COLORSit, при этом с рамы были сняты все крышки. А блок питания вообще лежал отдельно от компьютера.

Итак, закончив пояснения, приступим к тестированию Core i7 920.

 

В синтетическом тесте Everest Memory система оборудованная Core i7 920 показала как минимум 40% прирост быстродействия по отношению к Intel Core2Quad Q9650 при копировании блока в пределах оперативной памяти, 20% превосходства по операции записи в память и увеличенное на 30-35% быстродействие при чтении из памяти. Что не удивительно, учитывая интегрированный в Core i7 920 контроллер памяти DDR 3.

Результаты тестирования Intel Core i7 в Everest PRO 
Результаты тестирования Intel Core i7 в Everest PRO

 

Тесты 3DMark 03 и 3DMark 06 оказались не настолько суровы, как тесты программой Everest, здесь отличие в бытсродействии Core i7 920 от Core2Quad QX9650 практически незаметно. Но оно есть.

В тестах игровыми программами ситуация оказалась примерно такой же. Совсем незначительной оказалась разница в игре Company of Heroes (при том, что все тесты запускались на средних установках с кастомизацией), но тут отстутствие разницы можно списать на неоптимизированный движок игры. Значительная разница видна в Quake 4 и Serious Sam 2.

 

 

 

Далее мы протестировали систему с Core i7 920 и Core2Quad QX9650 на предмет работоспособности с прикладным ПО. При этом, прикинув, с чем реально может работать среднестатистический покупатель Core2Quad и Core i7, мы не стали проводить синтетически тесты типа CineBench и POV, а перешли сразу к работе с мультимедиа и данными, т.е. к кодированию видео в DivX/Xvid и сжатию данных в WinRAR (использовалась версия 3.71).

Кодирование видео мы замеряли в секундах, а значит наименьший результат является лучшим, тогда как архивирование замеряли в Кб/сек, т.е. тут наилучшим считается уже больший результат. "Итого" можно наблюдать на графиках ниже.

 

 

Выводы: Core i7 — выдающаяся разработка Intel, но не более того?

В целом Core i7 920 выигрывает по результатам тестов у Core2Quad QX9650. Наилучшие результаты Core i7 показал в приложениях, изначально оптимизированных под распараллеливание потоков и не в последнюю очередь за счет технологии SMT. А учитывая интегрированный в процессор контроллер памяти DDR 3, весьма ожидаемыми были результаты тестирования с ПО, скорость работы которого зависит напрямую от пропускной способности памяти.

Режим TurboBurst дает прибавку в скорости выполнения на Core i7 920 большинству приложений.

Минусом миграции на Core i7 и материнскую плату с чипсетом Intel X58 является высокая цена. Набор процессор + память + материнская плата обойдется даже по самым скромным подсчетам не менее чем в 28 000 — 35 000 рублей. А учитывая, что на том же Nehalem в итоге будет построен процессор Core i5, который значительно дешевле Core i7, но при этом практически не уступает последнему по производительности — переходить на систему с soket LGA-1366 нам кажется неразумным. Core i7, несомненно, является выдающейся на сегодняшний день разработкой инженеров Intel, но массовой продукцией процессоры Core i7 так и не станут. Слишком дорого и специфично.

При создании статьи использовались материалы сайта 3DNews

Related posts

Leave a Comment