Домой / Социальные сети / Интел пентиум 4 2.4 ггц характеристики

Интел пентиум 4 2.4 ггц характеристики

Tray Processor

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Май текущего года станет еще одной важной вехой в жизни семейства процессоров Pentium 4, да и Netburst архитектуры вообще. В течение мая компания Intel должна будет выпустить четыре принципиально новых продукта. Это:

Процессоры Pentium 4 с частотой используемой Quad Pumped Bus 533 Мгц;
Набор логики i850E, поддерживающий PC1066 RDRAM;
Наборы логики i845E и i845G, имеющие поддержку DDR333 памяти;
Процессоры Celeron, основанные на Pentium 4 архитектуре.

Сегодня, 6 мая, официально объявлены первые две новинки – два процессора Pentium 4 с частотами 2.26 ГГц и 2.4 ГГц, работающие на частоте шине 533 МГц и один набор логики, их поддерживающий - i850E. Естественно, мы не можем обойти вниманием это событие, и посвящаем ему наш новый обзор. Тем более что анонс очередных интеловских процессоров означает начало очередного раунда споров на тему «Intel vs. AMD».
По случаю выхода новых процессоров мы также решили несколько дополнить (в очередной раз:) набор используемых нами тестов (теперь их стало 35) с целью его «профессионализации». Теперь мы будем смотреть на скорость работы высокопроизводительных CPU в популярном CAD-пакете AutoCAD 2002 и сразу в нескольких программах рендеринга – 3ds max 4.26, Maya 4.0.1 и Lightwave 7.0b. Нельзя обойти стороной и переход нашей тестовой лаборатории на новую версию теста SYSmark 2002, использующего для измерения производительности системы более новый набор приложений. Но, обо всем по порядку.

Новые Pentium 4

Заметим сразу, что свежеанонсированые CPU семейства Pentium 4 не представляют собой ничего особенного. Это уже хорошо знакомые нам процессоры, использующие 0.13-микронное ядро Northwood, подобные уже выпускающимся. Отличие новинок от предшественников – только лишь в официальной поддержке шины 533 МГц, что означает лишь следующее:

Новые CPU, рассчитанные на использование 533 МГц Quad Pumped Bus, устойчиво работают при частоте FSB 133 МГц.
Процессоры имеют иной коэффициент умножения, позволяющий им работать при частоте FSB 133 МГц.

Итак, конкретнее. Intel объявил два новых CPU с частотами 2.26 и 2.4 ГГц, работающие с частотой FSB 133 МГц. Эти два процессора дополняют линейку имеющихся Pentium 4, рассчитанных на частоту FSB 100 МГц, уже содержащую две верхние модели с частотами 2.2 и 2.4 ГГц. Для того чтобы различать CPU с частотой шины 400 и 533 МГц, новые процессоры с частотой 2.4 ГГц и 533-мегагерцовой шиной будут маркироваться как Intel Pentium 4 2.4B ГГц. Поскольку разночтений в частоте шины 2.2 ГГц и 2.26 ГГц процессоров быть не может, суффикс «B» в этом случае использоваться не будет.
Как и у предшественников, множители у Pentium 4 2.26 ГГц и 2.4B ГГц будут зафиксированы и составят 17x и 18x соответственно. То есть, процессоры, предназначенные для частоты FSB 133 МГц, в системах с частотой FSB 100 МГц использовать не получится.
Собственно, на этом рассказ о новых Pentium 4 можно было бы закончить, поскольку никаких архитектурных отличий эти CPU от предшественников не имеют. Соответственно, читатели, желающие ознакомиться со строением ядра Northwood, могут быть переадресованы к нашей более ранней статье , посвященной этому ядру.
Однако существует еще один немаловажный факт, который также нельзя упускать из вида. С конца апреля Intel начал серийное производство процессоров, используя более новые 300-миллиметровые пластины вместо старых 200-миллеметровых. Это означает, что новые процессорные ядра, производимые с использованием 300 мм пластин, обладают более низкой себестоимостью. Однако, это далеко не все. Для перевода производства на обновленную технологию инженерам Intel пришлось слегка изменить дизайн ядра Northwood, в результате чего его площадь уменьшилась примерно на 10%. Именно такие «более прогрессивные» ядра и будут преимущественно использоваться, по всей видимости, в процессорах Pentium 4 с 533-мегагерцовой шиной. Отличить их можно будет по новому степпингу ядра C0. Практический эффект от изменения дизайна ядра также немаловажен. Процессоры, использующие ядро с новым степпингом обладают более высоким верхним пределом частот. Intel ожидает, что новые ядра смогут устойчиво работать на частотах вплоть до 3 ГГц. Соответственно процессоры с меньшими частотами, но новой версией ядра будут иметь лучшую, чем у предшественников, разгоняемость. Впрочем, как дело будет выглядеть на практике, мы сможем проверить только тогда, когда Pentium 4 с ядром степпинга C0 появятся в продаже, а ждать этого, скорее всего, придется недолго.
Если же говорить о том, каковы дальнейшие планы Intel по выпуску последующих моделей своих процессоров Pentium 4, то в третьем квартале планируется анонс CPU с частотами 2.53 и 2.66 ГГц для 533-мегагерцовой шины и с частотами 2.5 и 2.6 ГГц для 400-мегагерцовой шины. В четвертом квартале будет выпущена модель Pentium 4 с частотой 2.8 ГГц для шины 533 МГц. Аналогичного же процессора для более медленной 400-мегагерцовой шины не планируется. В дальнейшем все новые модели Pentium 4 будут выпускаться исключительно для частоты шины 533 МГц. Ну а начало 2003 года будет ознаменовано покорением отметки 3 ГГц: на первый квартал будущего года Intel запланировал выпуск Pentium 4 3.06 ГГц.
Таким образом, Intel планирует перейти на новую 533 МГц Quad Pumped Bus достаточно быстрыми темпами. Приведенная ниже таблица со сроками выхода моделей Pentium 4 еще раз иллюстрирует этот факт:

400 МГц Quad Pumped Bus 533 МГц Quad Pumped Bus
Q2 2002 2.2, 2.4 ГГц 2.26, 2.4B ГГц
Q3 2002 2.5, 2.6 ГГц 2.53, 2.66 ГГц
Q4 2002 - 2.8 ГГц
Q1 2003 - 3.06 ГГц

Увеличивать частоты шины процессоров Pentium 4 Intel планирует и в дальнейшем. Выходящие ориентировочно во второй половине следующего года процессоры Pentium 4, имеющие ядро Prescott производимое с использованием 0.09-микронного технологического процесса, как ожидается будут ориентированы на работу с еще более скоростной 667-мегагерцовой Quad Pumped Bus. Так что сегодняшние 533 МГц – далеко не предел.

Чипсеты для новых Pentium 4. Пока только i850E

Естественно, выпуск процессоров, использующих 533 МГц Quad Pumped Bus потребовал и новых чипсетов, поддерживающих указанную шину. С одним таким набором логики мы уже знакомы – это SiS645DX, уже рассмотренный нами ранее . Однако представить наборы логики для новой шины должен был и Intel. К выходу новых CPU компания подготовила RDRAM-набор логики i850E, DDR-чипсет i845E и чипсет с интегрированной графикой i845G. i845E и i845G будут объявлены позднее в этом месяце, а одновременно с анонсом Pentium 4 2.26 и 2.4B ГГц официально выпускается i850E, о котором мы и поговорим подробнее.
Хотя, конечно, слово «подробнее» можно применить здесь только условно, поскольку говорить-то на самом деле особо не о чем. Новый i850E представляет собой тот же самый i850 полуторагодичной давности, но с одним дополнением - официальной поддержкой 533-мегагерцовой Quad Pumped Bus (133 МГц FSB). Причем, поскольку фактически частоту FSB 133 МГц позволяла использовать и старая версия i850 (частоты шин PCI и AGP при этом оставались штатными – 33 и 66 МГц соответственно), дело свелось лишь к обновлению референс-дизайна материнской платы, с целью улучшения его устойчивости при работе с частотой FSB 133 МГц, и к разработке новой ревизии северного моста.
Таким образом, основные характеристики i850E описываются следующим образом:

Поддержка процессоров Pentium 4 c частотой шины 400 или 533 МГц;
Поддержка двухканальной PC800 RDRAM памяти (до 2 Гбайт, возможна поддержка ECC-модулей);
Графический порт AGP 4x;
Южный мост ICH2, связанный с MCH посредством Hub-link 1.0 с пропускной способностью 266 Мбайт в секунду;
Поддержка ATA-100, USB 1.1 и AC’97 звука.


Здесь хочется прокомментировать два факта. Во-первых, официально i850E поддерживает только лишь PC800 RDRAM и не поддерживает PC1066 RDRAM. Однако, очевидно, что при использовании частоты шины 533 МГц применение двухканальной PC1066 RDRAM было бы более логичным, поскольку эта память работает синхронно с FSB и имеет ту же пропускную способность, что и 533 МГц Quad Pumped Bus – 4.2 Гбайта в секунду. Поэтому, совершенно неудивительно, что в действительности поддержка PC1066 RDRAM в i850E имеется, только Intel не говорит о ней открыто. Объяснение этого факта достаточно просто. В свете того, что Intel отказался от дальнейшего сотрудничества с Rambus, компания не посчитала необходимым проводить тесты для проверки стабильности работы систем с новым типом RDRAM, предпочтя просто не включать его в спецификации. Однако Intel при этом не отрицает того факта, что тесты стабильности могут быть проведены и производителями материнских плат, которые небезосновательно смогут анонсировать поддержку PC1066 RDRAM своими продуктами на базе i850E.
Во-вторых, несмотря на то, что у Intel уже готов новый южный мост ICH4, поддерживающий шесть портов USB 2.0, этот мост c i850E использован быть не может. ICH4 будет соединяться с северным мостом чипсетов посредством Hub-link версии 1.1 не поддерживаемой в i850E. То есть, Intel поленился вносить в новую версию i850E и эту переделку, ожидая что этот продукт не сможет долго просуществовать на рынке. Таким образом, ICH4 мы увидим несколько позже – только лишь в составе i845E и i845G, а в комплекте с i850E будет продолжать поставляться «древний» ICH2.
Следует отметить, что в силу всего вышесказанного использовать i850E в своих материнских платах будут лишь немногие производители плат. Массовое же распространение плат для 533 МГц Quad Pumped Bus начнется лишь после выхода i845E и i845G. Продуты же на базе i850E собираются поставлять, по предварительным данным, только лишь сам Intel, а также ASUS, Gigabyte, QDI и, возможно, MSI. К слову, ASUS на своей плате на базе i850E, P4T533, собирается реализовать и еще одну интересную возможность – поддержку 32-битных модулей RDRAM. По сути, 32-битные модули представляют собой пару обычных 16-битных модулей, соединенных в одной упаковке. Таким образом, пропадает необходимость использования модулей Rambus парами – поскольку в одном 32-битном модуле реализуется сразу два 16-битных канала. Такие модули PC1066 RDRAM уже начал поставлять, например Kingston.

А что же AMD?

Надо сказать, что многие ожидали ответ от AMD на выход процессоров Pentium 4 с 533-мегагерцовой шиной. Однако, как мы видим, этот ответ пока не последовал. Старшей моделью в семействе Athlon XP продолжает оставаться процессор с рейтингом 2100+ и 0.18-микронным ядром Palomino, который и должен будет попытаться составить конкуренцию теперь и Pentium 4 2.4B ГГц.
Данное положение дел продолжит оставаться без изменений до начала июня, когда, по всей видимости, AMD наконец-то выпустит свой первый десктопный процессор, основанный на 0.13 микронном ядре Thoroughbred. Впрочем, многого от него ждать не приходится – архитектурно этот CPU не будет отличаться от предшественников, а его рейтинг составит всего лишь 2200+.
Впрочем, и сама AMD признает тот факт, что на данный момент она технологически отстает от Intel. Однако AMD надеется, что предстоящий в конце года выход процессоров ClawHammer сможет в корне изменить соотношение сил на рынке процессоров для настольных PC. Ожидается, что выходящий в четвертом квартале ClawHammer будет иметь рейтинг 3400+, в то время как частоты Pentium 4 к этому моменту дорастут только лишь до 2.8 ГГц. Также, на более ранний период у AMD запланирован и выход Athlon XP с увеличенным до 512 Кбайт кешем второго уровня, что, возможно, также сможет помочь AMD бороться с Pentium 4 до выхода ClawHammer.
На данный же момент старшие модели Pentium 4 и Athlon XP имеют следующие характеристики:
Intel Pentium 4 2.4B ГГц AMD Athlon XP 2100+
Реальная частота, МГц 2400 1733
Кодовое название ядра Northwood Palomino
Технология производства, мкм 0.13 0.18
Площадь ядра, кв. мм 146 (~130 со степпинга C0) 128
Число транзисторов, млн. 55 37,5
Процессорный разъем Socket 478 Socket 462
Частота шины, МГц 533 (133 МГц Quad Pumped) 266 (133 МГц DDR)
Пиковая пропускная способность шины, Гбайт/с 4.2 2.1
L1 кеш команд, Кбайт 12 64
L1 кеш данных, Кбайт 8 64
L2 кеш, Кбайт 512 256
Ширина шины L2 кеша, бит 256 64
Наборы SIMD-инструкций MMX, SSE, SSE2 MMX, 3DNow!, SSE
Чипсеты i850E, i845E, i845G, SiS645DX VIA KT133A, VIA KT266A, VIA KT333, SiS735, SiS745, NVIDIA nForce
Поддерживаемые типы памяти Двухканальная PC1066/PC800 RDRAM
DDR333/DDR266 SDRAM
Двухканальная DDR266 SDRAM
DDR333/DDR266 SDRAM
PC133 SDRAM
Официальная цена, $ $562 $330

Как мы тестировали

Итак, целью данного тестирования явилось как выявление прироста производительности, который может обеспечить использование в Pentium 4 системах новой 533 МГц Quad Pumped Bus и PC1066 RDRAM. Также, параллельно мы провели сравнение старших моделей процессоров в линейках Pentium 4 и Athlon XP. Процессоры эксплуатировались в системах, основанных на самых быстрых на данный момент наборах логики. Pentium 4 работал на плате с чипсетом i850E, а Athlon XP – на плате с чипсетом VIA KT333. Также, с этого момента мы перешли на использование в наших тестовых платформах более производительной видеоподсистемы, основанной на новом графическом чипе NVIDIA GeForce4 Ti 4400 и увеличили до 512 Мбайт объем системной памяти. В итоге, состав тестовых систем можно описать следующей табличкой:

Intel Pentium 4 AMD Athlon XP
Процессор Intel Pentium 4 2.4B
Intel Pentium 4 2.4
Intel Pentium 4 2.2
Intel Pentium 4 2.0
AMD Athlon XP 2100+
AMD Athlon XP 2000+
Системная плата Intel D850EMV (i850E) MSI KT3 Ultra-ARU (VIA KT333)
Память PC1066 RDRAM, 512 Мбайт
PC800 RDRAM, 512 Мбайт
PC2700 CL2 DDR SDRAM, 512 Мбайт
Видеокарта VisionTek Xtasy GeForce4 Ti 4400
Жесткий диск IBM DTLA 307015

Все тесты выполнялись в операционной системе MS Windows XP Professional.
Поскольку количество тестов, проведенных нами в рамках исследования новых процессоров значительно превосходит обычное, мы разбили результаты на несколько групп по характеру тестовых задач.

Производительность: Синтетические тесты подсистемы памяти

Поскольку в тестировании приняли участие системы с различными пиковыми пропускными способностями памяти и процессорной шины, в первую очередь уделим внимание результатам синтетических тестов, измеряющих пропускную способность подсистемы памяти и ее латентность.


Как видим, ускорение процессорной шины в Pentium 4 системе само по себе не дает практически никакого результата. Зато, когда одновременно с увеличением пропускной способности процессорной шины возрастает и пропускная способность памяти, мы наблюдаем ускорение подсистемы памяти как при операциях чтения, так и при записи или копировании данных.


Результаты, полученные при измерении латентности также легко объяснимы. Ускорение FSB Pentium 4 до 133 МГц приводит к вполне естественному снижению латентности «с точки зрения процессора», объясняемому уменьшением коэффициента умножения. Также, использование PC1066 позволяет еще сильнее снизить латентность памяти, однако даже в этом случае результат Pentium 4 платформы не дотягивает до показателей Athlon XP, работающего с DDR333 памятью, что вполне логично – множитель у Athlon XP много ниже.
Если же абстрагироваться от латентности «со стороны процессора», поделив полученные цифры на коэффициенты умножения, то будет получено для Athlon XP 2100+ - 17, для Pentium 4 2.4B с PC1066 – 19, для Pentium 4 2.4B с PC800 – 20.5, а для Pentium 4 2.4 c PC800 – 17. То есть, подсистема памяти, построенная на двухканальной PC800 RDRAM имеет такую же латентность, как и DDR333, PC800 RDRAM в асинхронном режиме при использовании 533-мегагерцовой шины обладает несколько худшей латентностью, а латентность PC1066 RDRAМ больше латентности PC800 RDRAM, но в то же время лучше латентности PC800 работающей в асинхронном режиме.


SiSoft Sandra как бы суммирует все вышесказанное. Практическая пиковая пропускная способность Pentium 4 2.4B c PC800 RDRAM памятью на 11% больше пропускной способности памяти Pentium 4 2.4 c PC800 RDRAM, а использование PC1066 RDRAM с Pentium 4 позволяет улучшить этот результат еще на 19%.
Если же говорить об “утилизации” теоретической пропускной способности памяти, то, как оказывается, скорость PC800 RDRAM в обычных Pentium 4 системах задействуется на 78%, а увеличение частоты шины процессора да 533 МГц позволяет улучшить этот показатель до 87%. При этом пропускная способность PC1066 RDRAM в Pentium 4 системах с 533-мегагерцовой шиной используется на те же 78%, что говорит о целесообразности увеличения скорости процессорной шины процессоров Pentium 4. К слову, в Athlon XP системах с DDR333 пропускная способность памяти может быть задействована только на 76%, однако, не стоит забывать что в системах с DDR266 этот показатель переваливал за 90%.

Производительность: Офисные приложения и кодирование данных

В рамках данного тестирования мы впервые для тестирования процессоров использовали новый тестовый пакет SYSmark 2002 от BAPCo. Этот бенчмарк унаследовал многие свои свойства от предшественника, SYSmark 2001. В частности, он состоит из тех же двух частей Internet Content Creation, измеряющей скорость работы в приложениях типа Photoshop и Dreamweaver, и Office Productivity, включающей обычные приложения типа Word, Excel, WinZIP, антивируса и т.п. Тем не менее, в SYSmark 2002 внесены достаточно существенные изменения. Во-первых, в состав теста включены более новые версии приложений. Во-вторых, изменен алгоритм подсчета итогового результата, с целью его более равномерной зависимости от скорости работы всех приложений, входящих в пакет.
Также, стоит отметить и то, что SYSmark 2002 стал более чутко реагировать на производительность подсистемы памяти. Интенсивность операций с подсистемой памяти, проводимых в SYSmark 2002 возросла по сравнению с предшественником примерно вдвое.
Взглянем же на результаты:


Как видим, и в новой версии бенчмарка процессоры семейства Pentium 4 продолжают удерживать лидерство. На этот раз данный результат нельзя объяснить использованием устаревшей версии Windows Media Encoder, поскольку новая версия этой программы, входящая в SYSmark 2002, SSE-инструкции процессора Athlon XP понимает.


Тем не менее, основной отрыв Pentium 4 от Athlon XP снова образуется именно из-за Internet Content Creation части теста. Отчасти это можно объяснить тем, что новые версии популярных программ входящих в этот тест, таких как Adobe Photoshop 6.0.1 или Adobe Premiere 6.0 стали задействовать набор инструкций SSE2 процессора Pentium 4.


Подытоживая результаты SYSmark 2002, хотелось бы обратить внимание читателя на тот факт, что перевод Pentium 4 на 533-мегагерцовую шину дает в типовых приложениях гораздо больший эффект, нежели использование PC1066 памяти. Это – еще один аргумент в пользу того, что 533 МГц Quad Pumped Bus будет иметь смысл и в DDR266 и DDR333 системах, основанных на наборах логики i845E и i845G.


Скорость кодирования wav-файлов в формат mp3 от скорости памяти и скорости процессорной шины мало. Посмотрим, как обстоит дело с кодированием видео.


В данном случае если ускорение процессорной шины Pentium 4 само по себе не дает практически никакого эффекта, то повышение общей пропускной способности магистрали память-процессор до 4.2 Гбайт в секунду дает весьма ощутимый результат. Скорость кодирования MPEG-4 возрастает на 11%.


Скорость сжатия данных алгоритмом RAR проявляет еще большую зависимость и от пропускной способности процессорной шины и от пропускной способности шины памяти. В общей сложности ускорение ключевых шин системы без поднятия частоты процессора Pentium 4 позволяет нарастить производительность более чем на 13%.

Производительность: 3D-игры

Для начала посмотрим на результаты, полученные в «полусинтетическом» 3Dmark2001 SE.


Процессоры линейки Athlon XP традиционно имеют неплохие результаты в 3Dmark. Тем не менее, процессор Athlon XP 2100+ не может составить конкуренцию Pentium 4 2.4 ГГц, производительность которого после перевода на частоту шины 533 МГц ощутимо возрастает.


Тестирование процессоров в 3Dmark2001 SE с отключенным аппаратным ускорением T&L имеет для нас большое значение, поскольку в данном случае все операции по расчету геометрии и освещения ложатся на центральный процессор. При этом активно задействуются наборы SIMD-инструкций. И именно поэтому семейство Pentium 4, поддерживающее более прогрессивные SSE2 команды, опережает своих соперников производства AMD.


Как было показано нами в предыдущем тестировании , производительность в Quake3 зависит во многом от пропускной способности магистрали процессор-память. Вновь мы видим подтверждение этого факта. Pentium 4 2.4B опережает Pentium 4 2.4 на 5% даже при использовании одинаковой PC800 RDRAM. А увеличение пропускной способности памяти с 3.2 Гбайт в секунду до 4.2 Гбайт в секунду позволяет получить еще 7-процентный прирост быстродействия.


Игра Return to Castle Wolfenstein основывается на том же самом движке, что и Quake3. Оттого результаты, полученные нами в этом случае, качественно напоминают предыдущий случай.


Увеличение разрешения и качества изображения приводит к тому, что часть вычислительной нагрузки с процессора снимается и переносится на видеоподсистему. Именно это и вызывает некоторое уравнивание полученных результатов. Кроме того, Athlon XP при этом уже не выглядит столь же безнадежно отстающим, как при установке небольших экранных разрешений.


В Serious Sam на высоте оказывается Athlon XP. Только лишь использование PС1066 RDRAM позволяет Pentium 4 2.4B обогнать Athlon XP 2100+, работающий, к слову, на гораздо меньшей тактовой частоте – 1.73 ГГц.


Однако в разрешении 1280x1024 не помогает Pentium 4 и это.


В недавно вышедшей очередной версии популярного симулятора вертолета, которую мы решили использовать для целей тестирования, число fps оказывается сильно зависимым от пропускной способности как процессорной шины, так и шины памяти. Как можно предположить, интерполировав в уме результаты, Pentium 4 2.4В c PC800 RDRAM работает примерно со скоростью Pentium 4 2.6 с 400-мегагерцовой шиной, а установка в систему с Pentium 4 2.4В PC1066 RDRAM увеличивает его производительность приблизительно до скорости гипотетического Pentium 4 2.8 ГГц.


После установки большего разрешения оказывается, что наращивать скорость процессорной шины без симметричного увеличения пропускной способности памяти – достаточно бессмысленная затея.

Производительность: 3D рендеринг

Скорость 3D рендеринга мы исследовали в трех популярных пакетах – 3ds max 4.26, Maya 4.0.1 и Lightwave 7.0b. Во всех тестах мы хронометрировали скорость рендеринга сцен, поэтому на диаграммах меньшее значение соответствует лучшему результату. Для тестирования в 3ds max была использована сцена islands, измерение скорости в Maya 4.0.1 проводилось по методике Maya-Testcenter rendertest, а в Lightwave нами была использована сцена sunset.


Как мы помним, раньше при измерении скорости финального рендеринга на высоте оказывались процессоры семейства Athlon XP. Однако не так давно был выпущен update к этому пакету, позволяющий активно задействовать SSE2 инструкции. Результат мы видим на диаграмме – процессоры Pentium 4 начали демонстрировать гораздо более высокую скорость рендеринга. Что же касается эффекта, получаемого от ускорения шин в Pentium 4 системе, то он незначителен. Рендеринг – сугубо вычислительный процесс, не нуждающийся в интенсивном обмене данными между памятью и процессором.


Аналогичная картина наблюдается и в Maya. Однако Athlon XP 2100+ в данном случае показывает результат, сравнимый с показателями Pentium 4 2.4 ГГц.


В Lightwave же расклад сил и вовсе выводит Athlon XP 2100+ на первое место. При этом ускорение шин в Pentium 4 системе не дает совершенно никакого эффекта.
Подытоживая уведенное в этом разделе, в очередной раз хочется отметить, что Athlon XP обладает гораздо лучшими вычислительными возможностями. Именно поэтому, результаты этого процессора при рендеринге так хороши. Если специфика приложений такова, что они не нуждаются в высокой скорости магистрали процессор-память, то многие сильные стороны процессора Pentium 4 оказываются в тени.

Производительность: CAD

Для тестирования производительности процессоров в AutoCAD 2002 мы использовали популярный бенчмарк C2001 от Cadalyst Labs.


Увеличение скорости процессорной шины Pentium 4, также как и использование более скоростной памяти, увеличивает производительность в AutoCAD не сильно. Тем не менее, прирост все же есть, и его величина составляет примерно 3%.


При тестировании скорости работы в каркасном 3D режиме, Pentium 4 намного опережает Athlon XP. Судя по тому, что прирост производительности при увеличении пропускной способности шины памяти и процессора в этом тесте оказывается достаточно велик, объяснение этого состоит именно в том, что Pentium 4 обеспечивает более высокую скорость взаимодействия с подсистемой памяти.

При использовании 2D в AutoCAD ситуация примерно такая же как и в 3D-режимах. Pentium 4 показывает высокие результаты, а ускорение его шины и шины памяти позволяет получить дополнительный прирост быстродействия.

Производительность: Научные и профессиональные OpenGL приложения


Вполне естественно, что семейство Athlon XP при решении задач математического моделирования показывает себя с лучшей стороны. В приложениях такого типа основное значение имеет скорость работы блока операций с плавающей точкой, а это – сильная сторона архитектуры Athlon. Трехконвейерный блок FPU этого процессора позволяет ему легко обгонять Pentium 4, работающий на гораздо более высокой тактовой частоте. В то же время увеличение пропускной способности шин памяти и процессора мало помогает Pentium 4.


При тестировании скорости работы во viewports в 3ds max в каркасном режиме системы на базе Pentium 4 демонстрируют лучшую производительность. Увеличение частоты Quad Pumped Bus также позволяет несколько ускорить работу 3ds max. В общем, ситуация сродни тому, что мы видели в AutoCAD.


Переключение на режим с затенением и освещением увеличивает нагрузку на вычислительные ресурсы процессора. Что получается в результате – хорошо видно на диаграмме.

Выводы

Выпустив за достаточно небольшой промежуток времени несколько новых моделей Pentium 4, а также осуществив перевод этой линейки на использование более скоростной шины, Intel удалось добиться некоторого преимущества в быстродействии верхних моделей процессоров над CPU от AMD. Впрочем, это утверждение справедливо до тех пор, пока дело не касается вычислительных задач, в которых Athlon XP продолжает удерживать лидерство. Тем не менее, если в ближайшее время AMD не предпримет никаких решительных действий по ускорению Athlon XP, рынок высокопроизводительных CPU для этой компании может быть потерян.
Что же касается собственно перевода Pentium 4 на частоту шины 533 МГц, то, как оказалось, NetBurst архитектура способна переварить и такое. Получаемый от этого рост производительности достаточно существенен и достигает порой 15%, лишь бы только нашлась подсистема памяти с соответствующей пропускной способностью. В случае же, если подсистема памяти ниже пропускной способности процессорной шины, прирост в скорости будет не столь велик. Однако об этом мы поговорим в наших следующих материалах, когда будем говорить о DDR SDRAM наборах логики для 533-мегагерцовой шины.
В результате того, что Intel отказался от дальнейшей поддержки Rambus, i850E, хотя наверняка и будет являться чемпионом в скорости среди Pentium 4 чипсетов, вряд ли найдет широкое распространение. А жаль. Поэтому, похоже, что в реальных массовых системах, в которых совместно с новыми Pentium 4 будет использоваться DDR SDRAM, прирост от использования ускоренной шины будет не так ощутим. Впрочем, Intel планирует поправить это положение к концу года, когда компания планирует представить двухканальный DDR SDRAM набор логики для Pentium 4.

Алексей Шобанов

Продолжая череду весенних премьер, компания Intel представила очередную модель в линейке процессоров для высокопроизводительных систем для дома и офиса - процессор Intel Pentium 4 с тактовой частотой 2,4 ГГц. Переход на 0,13-микронный технологический процесс значительно расширил «частотные горизонты», открывающиеся перед флагманом процессорного рынка от компании Intel, и теперь нам кажутся вполне обыденными ежеквартальные презентации новых, все более быстрых процессоров. Как и его предшественники - Pentium 4 2 ГГц и 2,2 ГГц, также построенные на основе ядра Northwood по 0,13-микронной технологии, новый процессор имеет кэш второго уровня размером 512 Кбайт, что вдвое превышает размер L2-кэша у младших моделей этой линейки, созданных на основе ядра Willamette (0,18-микронный техпроцесс). Pentium 4 2,4 ГГц выполнен в формфакторе mPGA-478 с использованием корпуса FC-PGA2 (Flip-Chip Pin Grid Array), который на сегодняшний день имеет наиболее совершенную схему теплового рассеивания. Говоря о тепловом режиме процессора Pentium 4 на новом ядре Northwood, нельзя не отметить тот факт, что переход на новую 0,13-микронную технологию позволил не только увеличить количество транзисторов до 55 млн. на кристалле, при этом уменьшив его размеры, но и снизить напряжение питания ядра до 1,5 В, тем самым сократив тепловыделение. Так, у первых процессоров на этом ядре, которые работают на тактовой частоте 2 ГГц и 2,2 ГГц, оно составляет соответственно 52 Вт и 55 Вт, а у нового Intel Pentium 4 2,4 ГГц не превышает 58 Вт. Для температурного контроля в процессоре используется так называемая технология «Thermal Monitor», суть которой сводится к использованию термодатчика и блока TCC (thermal control circuit), управляющего подачей тактовых импульсов на процессор. При этом предусмотрены два режима функционирования: автоматический (Automatic mode) и по требованию (On-Demand mode). Автоматический режим может быть активизирован через BIOS системной платы. В этом режиме при повышении температуры процессора до определенного значения блок TCC активизируется и генерирует импульсы, блокирующие подачу тактовых импульсов, что фактически вызывает понижение тактовой частоты процессора на 30-50% (в соответствии с заводскими установками), увеличивая время его простоя, что, в свою очередь, позволяет снизить температуру. Работа блока TCC в режиме «по требованию» определяется содержимым регистра температурного контроля (ACPI Thermal Monitor Control Register). В соответствии с его состоянием блок TCC может быть активизирован независимо от температуры процессора, при этом длительность холостого хода процессора можно варьировать более гибко в диапазоне между 12,5% и 87,5%. И, конечно же, реализована возможность отключения компьютера при катастрофическом нагреве кристалла процессора до 135 °С; в этом случае на системную шину выдается сигнал THERMTRIP#, инициирующий отключение питания. Как и все его предшественники, новый процессор построен в соответствии с микроархитектурой Intel NetBurst, которая подразумевает следующие нововведения:

  • 400-мегагерцевая системная шина;
  • Hyper-Pipelined Technology;
  • Advanced Dynamic Execution;
  • Execution Trace Cache;
  • Rapid Execution Engine;
  • Advanced Transfer Cache;
  • Streaming SIMD Extensions 2 (SSE2).

В нескольких словах опишем эти особенности архитектуры процессоров Intel Pentium 4. 400-мегагерцевая шина (как ее еще называют - Quad Pumped Bus) позволяет за счет особой организации на физическом уровне передавать 4 пакета данных за один такт по системной шине с частотой FSB 100 МГц. Таким образом, эта 64-битная шина имеет пиковую пропускную способность 3,2 Гбайт/с, обеспечивая высокоскоростной обмен данными процессора с другими устройствами. В скором времени ожидается реализация 533-мегагерцевой Quad Pumped-шины, что соответствует работе системной шине на физической частоте FSB 133 МГц, при этом, как несложно предположить, скорость обмена данными по ней превысит казавшуюся прежде недостижимой величину 4 Гбайт/с. Hyper-Pipelined Technology подразумевает использование беспрецедентно длинного 20-ступенчатого гиперконвейера (напомним, что процессоры семейства Р6 имели вдвое меньший конвейер). Такой подход позволяет значительно увеличить тактовую частоту процессора, хотя и приводит к столь негативному последствию, как увеличение времени перезагрузки конвейера в случае ошибки предсказания перехода. Для того чтобы уменьшить вероятность возникновения подобной ситуации, в процессорах Pentium 4 применена технология Advanced Dynamic Execution, которая подразумевает увеличение пула команд до 126 (в Pentium III пул команд содержал 42 команды) и увеличение до 4 Кбайт буфера ветвлений, хранящего адреса уже выполненных переходов. Это, вкупе с усовершенствованным алгоритмом предсказания, позволяет повысить вероятность предсказания переходов на 33% по сравнению с процессорами семейства Р6 и довести его до 90-95%. В процессорах Pentium 4 реализован несколько нетрадиционный подход к организации кэша первого уровня L1. Хотя L1, как и у большинства современных процессоров, состоит из двух частей: кэша данных (8 Кбайт) и кэша инструкций, особенность последнего состоит в том, что теперь он хранит до 12 тыс. уже декодированных микроопераций, причем расположенных в порядке их выполнения, определенном на основе предсказаний переходов ветвлений. Кэш инструкций процессора Intel Pentium 4 с такой организацией получил название Execution Trace Cache. Rapid Execution Engine - это два блока арифметической логики (ALU), которые работают на удвоенной частоте процессора. В случае описываемого нами процессора, тактовая частота которого равна 2,4 ГГц, это означает, что блоки ALU работают на частоте 4,8 ГГц, а учитывая, что функционируют они в параллельном режиме, нетрудно подсчитать, что процессор может выполнять четыре целочисленные операции за такт (чуть более 0,4 мкс). Кэш второго уровня L2 процессоров семейства Pentium 4 получил название Advanced Transfer Cache. Имеющий 256-битную шину, работающую на частоте ядра, и усовершенствованную схему передачи данных, этот кэш обеспечивает высочайшую пропускную способность, столь важную для потоковых процессов обработки. Как уже отмечалось выше, первоначально процессоры на ядре Willamette имели кэш L2 размером 256 Мбайт, переход на 0,13-микронную технологию позволил увеличить кэш второго уровня до 512 Мбайт. Такое увеличение кэша L2 благотворно сказалось на производительности процессора, позволяя снизить вероятность промаха при обращении. В процессорах Pentium 4 реализована поддержка увеличенного набора инструкций потоковых SIMD-расширений (Streaming SIMD Extensions), получившего название SSE 2. В этом наборе к уже существующим 70 SIMD-инструкциям было добавлено еще 144 новые инструкции. Эти инструкции позволяют выполнять 128-разрядные операции как с целыми числами, так и с числами с плавающей точкой, давая значительный прирост производительности на целом ряде задач, использующих потоковую обработку данных. Здесь существует только одно «но» - код выполняемой задачи должен быть соответствующим образом оптимизирован и откомпилирован.

При всех вышеперечисленных усовершенствованиях в основу процессоров модельной линейки Pentium 4 положена все та же 32-битная архитектура Intel (IA-32), и новый процессор не является исключением. Как следствие, Pentium 4 2,4 ГГц оптимизирован на работу с 32-битным программным обеспечением и показывает традиционно стабильную и высокопроизводительную работу с такими операционными системами, как Windows 98, Windows Me, Windows 2000, Windows XP и ОС семейства UNIX. У нас была возможность протестировать работу нового процессора от компании Intel, при этом использовалась следующая конфигурация тестового стенда:

  • процессор Intel Pentium 4 2,4 ГГц;
  • системная плата MSI MS-6547 (на чипсете SiS 645);
  • жесткий диск Fujitsu MPG3409AH-E 30 Гбайт с файловой системой NTFS;
  • 256 Мбайт оперативной памяти DDR SDRAM PC2700 (CL 2,5);
  • видеокарта Gigabyte GF3200TF (GeForce 3 Ti 200, 64 Мбайт) с видеодрайвером nVIDIA detonator v. 27.42 (разрешение 1024×768, глубина цвета 32 бит, Vsync - откл.).

Для тестирования нами использовалась операционная система Microsoft Windows XP. Результаты тестирования приведены в таблице .

Возможно, кто-то задаст вопрос: сколько же можно увеличивать производительность процессора и вообще насколько необходимы для современного персонального компьютера столь мощные центральные процессоры? На это нам хочется ответить, что работа центральному процессору всегда найдется. Его вычислительные мощности можно задействовать, переложив на него работу логики других подсистем компьютера, тем самым снизив стоимость последних. Некоторые эксперты поднимают вопрос о том, что при дальнейшем росте быстродействия центрального процессора можно было бы переложить на него и вычислительную нагрузку процессора графической карты (что уже делалось в прошлом, но с совершенно иными мотивациями).

В заключение хотелось бы отметить, что новый процессор от Intel - Pentium 4 2,4 ГГц демонстрирует стабильную работу и отличную производительность на приложениях, работающих со звуком, видео, 3D-графикой, на офисных приложениях и играх, а также при выполнении сложных вычислительных задач. Одним словом, на базе этого процессора могут быть созданы высокопроизводительные станции для дома и офиса, способные удовлетворять самые взыскательные запросы пользователей и решать задачи, предъявляющие максимально высокие требования к вычислительным мощностям вашего персонального компьютера.

КомпьютерПресс 5"2002

Сравнение показателей IPC

Для тех, кто не знает: IPC (Instructions Per Cycle, количество исполняемых инструкций за такт) – это хороший показатель того, насколько быстро работает процессор, и одновременное сочетание высоких значений IPC и тактовой частоты обеспечивает максимальную производительность. Именно это мы наблюдаем у процессоров Intel Coffee Lake 8 поколения, и хотя AMD явно отстает, когда речь идет о частотах, эта компания реально приближается к показателям Intel в части IPC. Возможно, по этой причине многие из вас интересуются данным аспектом тестирования CPU.

Чтобы понять, насколько далеко AMD продвинулась в этом направлении, мы решили минимизировать количество параметров тестирования и в то же время максимально приблизить ситуацию к реальным условиям работы. Первый и наиболее очевидный шаг здесь – привести частоты ядер к единому постоянному значению, что мы и сделали, зафиксировав все ядра CPU на частоте 4 ГГц. Все опции технологии Boost были отключены, и, таким образом, частоты ядер не могли уйти за пределы 4 ГГц.

Процессоры 2 поколения Ryzen тестировались на материнской плате Asrock X470 Taichi Ultimate, а процессоры Coffee Lake – на плате Asrock Z370 Taichi . В обеих конфигурациях во всех тестах использовалась одна и та же память G.Skill FlareX DDR4-3200 с профилем памяти "Xtreme" и одна и та же видеокарта MSI GTX 1080 Ti Gaming X Trio .

Мы сразу можем сказать, что эта статья не содержит рекомендаций для потенциальных покупателей – мы проводили тестирование в чисто исследовательских целях.

Процессоры Coffee Lake изначально имеют явное преимущество в тактовой частоте.

В данный обзор мы включили результаты тестирования процессоров Intel Core i7-8700K , Core i5-8600K и AMD Ryzen 7 2700X, Ryzen 5 2600X и Ryzen 7 1800X , Ryzen 5 1600X .

Итак, теперь процессоры 1600X, 2600X и 8700K имеют одинаковый ресурс: 6 ядер и 12 потоков.

Процессоры 1800X и 2700X имеют преимущество – 8 ядер и 16 потоков, в то время как 8600K с 6 ядрами и 6 потоками, напротив, находится в невыгодном положении.

Все это следует иметь в виду, когда мы пойдем дальше. Приступим к результатам.

Бенчмарки

Начнем с теста на непрерывную пропускную способность памяти. Здесь мы видим, что процессоры 1 и 2 поколений Ryzen имеют практически одинаковую пропускную способность – около 39 ГБ/с. Между тем процессоры Coffee Lake, работая с той же самой памятью, ограничиваются значением пропускной способности около 33 ГБ/с, что на 15% меньше по сравнению с процессорами Ryzen.

Переходим к тесту Cinebench R15. Тут мы видим, что процессор 2600X показывает более высокие результаты по сравнению с 1600X – на 4% больше в многопоточном режиме и на 3% больше в однопоточном. А если мы посмотрим на 8700K, то увидим, что он на 4% быстрее 2600X в однопоточном режиме и на 4% медленнее в многопоточном.

Как вы могли ожидать, при одинаковой тактовой частоте процессоры Ryzen с 8 ядрами и 16 потоками в многопоточном режиме легко обходят 8700K. Я привел здесь эти результаты просто потому, что они у меня были. При соответствующем запросе я мог бы провести этот тест, например, с Core i7-7820X.

Следующий пункт – редактирование видео в PCMark 10, и этот тест дает более четкие результаты, хотя и до этого мы наблюдали заметную разницу между процессорами 1600X и 1800X. А здесь мы видим уверенный 10%-й прогресс при переходе от 1600X к 2600X, и это ставит AMD на один уровень с Intel в части производительности IPC (по крайней мере, в этом тесте).

Как показывают результаты Cinebench R15, используемая по максимуму технология AMD SMT (Simultaneous Multi-Threading) выглядит более эффективной, чем технология Intel HT (Hyper-Threading). Здесь процессор 1600X был быстрее 8700K на 3,5%, а 2600X – на целых 8%, и для данного примера это существенная разница.

Продуктивность / Производительность в приложениях

Для следующего теста мы взяли Excel, и здесь процессор 8700K был примерно на 3% быстрее, чем 1600X, – на той же тактовой частоте. Однако 2600X способен соревноваться с 8700K: он показал такое же время завершения при выполнении тестовой задачи – 2,85 с – впечатляющий результат.

В тесте HandBrake результаты процессоров AMD Ryzen были не столь блестящими: здесь мы видим, что 2600X может состязаться только с 8600K, а в сравнении с 8700K оказывается на 15% медленнее.

Переходим к бенчмарку Corona. Тут мы видим, что процессор 2600X может уменьшить время рендеринга на 8% по сравнению с 1600X, и при этом оказывается всего на 3% медленнее, чем 8700K. Таким образом, в этом тесте Intel пока удерживает преимущество в IPC, но оно минимально.

Следующий тест – Blender, и здесь 2600X был всего на 2,5% быстрее, чем 1600X, и на 4% медленнее, чем 8700K. Не слишком большая разница, и снова Intel удерживает преимущество в IPC – в этом тесте оно менее 5%.

В бенчмарке V-Ray мы видим, что процессор 2600X превзошел результат 1600X на 4% и был всего на один процент медленнее, чем 8700K, т.е. по существу оказался с ним на одном уровне.

Игровые бенчмарки

Настало время рассмотреть ряд игровых результатов, и здесь процессоры AMD отваливаются. Как я уже неоднократно говорил ранее, кольцевая шина Intel Ring Bus с низкой задержкой просто лучше подходит для игр, и мы это видим даже при сравнении этого решения Intel с их собственной архитектурой на базе Mesh Interconnect, разработанной для процессоров с большим числом ядер. Внутренняя шина AMD Infinity Fabric испытывает ряд проблем, и эти проблемы останутся до тех пор, пока игровые процессоры не потребуют большего количества ядер.

Таким образом, хотя процессор 2600X и превосходит 1600X на 8% в игре Ashes of the Singularity , он в то же время заметно проигрывает 8700K – на целых 11% медленнее. То обстоятельство, что процессоры Intel работают со значительно более высокой тактовой частотой, разом увеличит это разницу до 20% или даже больше.

В игре Assassin"s Creed: Origins мы видим небольшое 2%-е превосходство процессора 2600X над 1600X, в то время как процессор 8700K на целых 14% быстрее.

Эта разница слегка уменьшилась при установке высоких графических настроек, но все равно, когда мы сравниваем средние значения частоты кадров, 8700K оказывается на 12% быстрее процессора 2600X.

В Battlefield 1 с настройками ультра мы видим, что процессор 2600X на 9% быстрее процессора 1600X, но все-таки на 7% медленнее, чем процессор 8700K.

Эта разница становится еще больше при средних настройках, поскольку уменьшается влияние видеокарты GTX 1080 Ti. Здесь процессор 2600X снова демонстрирует 9% роста производительности относительно 1600X, но теперь он на 10% медленнее 8700K, что даже при этих настройках выглядит как ограничение производительности GPU.

Похожую картину мы наблюдаем в игре Far Cry , где процессор 2600X на 10% быстрее 1600X – это очень большой прогресс, но даже тут он оказывается на 8% медленнее, чем 8700K.

Сравнение энергопотребления

Этот тест на энергопотребление проводился не в самых реалистичных условиях, поскольку при установке единой тактовой частоты 4 ГГц многие энергосберегающие опции были отключены. С научной точки зрения это также не вполне чистый эксперимент, потому что мне пришлось повысить напряжение на процессорах Ryzen сверх номинального значения – для стабилизации всех ядер на повышенной частоте 4 ГГц.

Приняв во внимание всё вышесказанное, мы видим, что системы с процессорами 1600X и 2600X потребляют в точности одинаковое количество энергии, в то время как система с 8700K потребляет на 3% меньше, т.е. при указанных условиях этот процессор чуть более эффективен.

В тестировании с Far Cry потребляемая мощность везде была почти одинаковой – все процессоры доводят общее энергопотребление системы примерно до 380 Вт.

В тесте Blender мы видим снижение энергопотребления на 10% при переходе от процессора 1600X к 2600X. Для процессора 2600X это впечатляющее достижение, но при этом все равно он потребляет на 21% больше мощности, чем процессор 8700K.

На этот раз в тесте HandBrake система с процессором 2600X продемонстрировала на 7% большее энергопотребление, чем система с 1600X, и на ужасающие 32% большее, чем система с 8700K.

Заключение

Несмотря на достаточно большой дефицит тактовой частоты (по сравнению с аналогами от Intel), процессоры 2 поколения Ryzen в тестовых приложениях не так уж часто остаются далеко позади своих конкурентов, и теперь мы можем понять, почему – сравнив их на одной и той же тактовой частоте 4 ГГц. Например, в приложении Cinebench R15 мы видим, что в одноядерном режиме их производительность ниже всего на 3%, зато в многоядерном режиме технология SMT помогает процессорам AMD работать до 4% быстрее по сравнению с Intel.

В нашем исследовании процессоры AMD были на 3% медленнее Intel в тесте Corona, но в таких бенчмарках, как V-Ray, Excel и редактирование видео показали почти одинаковый с ними результат. В HandBrake они были на 15% медленнее, зато в PCMark 10 (тест на изображение в играх физических явлений) – на 8% быстрее. Конечно, это вопрос гейминга, и я готов поспорить – некоторые поклонники AMD надеялись на то, что мы спишем дефицит игровой производительности главным образом на тактовую частоту. К сожалению, это не так.

Основная проблема здесь – в способе соединения между собой ядер процессоров AMD, или, вернее, модулей CCX. Шина Intel Ring Bus отличается очень низкой задержкой и при распределении ресурсов всегда выбирает кратчайшие пути. Однако, как только мы добавляем дополнительные ядра, кольцевая шина увеличивается в размерах – для соединения всех ядер требуется больше колец – и ее эффективность снижается. Таким образом, процессоры Intel с большим числом ядер (например, 28) нуждаются в более оптимальном способе соединения ядер между собой. И в этих случаях отлично работает архитектура с Mesh Interconnect.

Однако мы уже знаем, что для 6-, 8- и 10-ядерных процессоров это не самое лучшее решение, и именно поэтому процессоры Core i7-7800X, 7820X и 7900X в играх заметно уступают 8700K. Процессор 8700K имеет среднее время задержки между ядрами около 40 нс, а у 7800X это время составляет от 70 до 80 нс.

Процессоры Ryzen устроены немного сложнее: внутри модуля CCX задержка между ядрами близка к тому, что мы видим у процессора 8700K, и не зависит от скорости работы памяти DDR4. Однако, как только мы выходим за пределы CCX, задержка между ядрами возрастает до 110 нс, и это уже связано с памятью DDR4-3200. С более быстрой памятью задержка между ядрами модулей CCX снижается, так как шина AMD Infinity Fabric привязана к тактовой частоте памяти, и DRAM с низкой задержкой здесь также очень помогает.

Еще одна проблема заключается в самих играх, поскольку почти все популярные игры разработаны в расчете на CPU всего лишь с несколькими ядрами, и мы только начинаем наблюдать некоторые шаги, предпринимаемые в направлении разбиения задач на части для параллельной обработки их ядрами CPU. До появления процессоров Ryzen игры разрабатывались и оптимизировались почти исключительно под процессоры Intel. Сейчас ситуация постепенно изменяется, так как улучшаются игровые характеристики процессоров Ryzen, но вряд ли мы в ближайшее время увидим их на одном уровне с процессорами Intel с шиной Ring Bus.

Однако в части производительности IPC AMD определенно сократила разрыв. Кэш с уменьшенной задержкой также реально помогает, и, таким образом, покупка процессора 2 поколения Ryzen несет в себе некоторые преимущества перед покупкой процессора Coffee Lake. Будет интересно понаблюдать за битвой между этими процессорами, которая развернется в 2018 г. и далее.

«топовых» на тот момент настольных процессоров, перешагнувших 2-гигагерцовый рубеж. К сегодняшнему дню в линейках у обеих компаний появилось по новой модели, а значит, есть повод провести очередное сравнение или исправить недочеты старого. Исследование новых моделей всегда интересно, если те различаются архитектурно, но сегодня не тот случай. Старые ядра, следующая ступень коэффициентов умножения — вот и «новые процессоры». Заслуживает внимания «обратный» факт: Athlon XP 2100+ — это последняя модель на ядре Palomino, даже не значившаяся ранее в плане выпуска и прикрывающая место до выхода нового ядра Thoroughbred.

У процессоров Intel тоже грядут изменения. Совсем скоро состоится переход на шину 533 МГц, так что имеющийся у нас экземпляр тоже в некотором роде «прощальный».

Что ж, постараемся извлечь максимальную пользу из этого тестирования. Во-первых, можно сравнить новую модель с предшествующей, и по разнице показателей в тестах оценивать масштабируемость. Во-вторых, можно ввести в строй свежие версии используемых тестов и добавить новые — благо, такие статьи обычно для промежуточного сравнения не используют. Наконец, в-третьих, всегда остаются актуальными совершенно бесполезные и совершенно беспроигрышные попытки выявить абсолютного лидера по скорости.

Для решения первой задачи добавим в пару к Intel Pentium 4 2,4 ГГц 2,2-гигагерцовую модель, а к AMD Athlon XP 2100+ — Athlon XP 2000+, и протестируем каждую пару на одном и том же своем чипсете. Опираясь на опыт уже упомянутого большого сравнения, для решения третьей задачи выберем для процессора Intel три наиболее интересные платформы, а для процессора AMD ограничимся одной — самой быстрой практически везде VIA KT333 + DDR333. Что же до обновления тестового набора — пожалуйте в главу с результатами.

Условия тестирования

Тестовый стенд:

  • Процессоры:
    • Intel Pentium 4 2,2 ГГц, Socket 478
    • Intel Pentium 4 2,4 ГГц , Socket 478
    • AMD Athlon XP 2000+ (1667 МГц), Socket 462
    • AMD Athlon XP 2100+ (1733 МГц), Socket 462
  • Материнские платы:
    • EPoX 4BDA2+ (BIOS от 05/02/2002) на базе i845D
    • ASUS P4T-E (версия BIOS 1005E) на базе i850
    • Abit SD7-533 (версия BIOS 7R) на базе SiS 645
    • Soltek 75DRV5 (версия BIOS T1.1) на базе VIA KT333
  • 256 МБ PC2700 DDR SDRAM DIMM Samsung, CL 2 (использовалась как DDR266 на i845D)
  • 2x256 МБ PC800 RDRAM RIMM Samsung
  • ASUS 8200 T5 Deluxe GeForce3 Ti500
  • IBM IC35L040AVER07-0, 7200 об/мин, 40 ГБ
  • CD-ROM ASUS 50x

Программное обеспечение:

  • Windows 2000 Professional SP2
  • DirectX 8.1
  • Intel chipset software installation utility 3.20.1008
  • Intel Application Accelerator 2.0
  • SiS AGP Driver 1.09
  • VIA 4-in-1 driver 4.38
  • NVIDIA Detonator v22.50 (VSync=Off)
  • CPU RightMark RC0.99
  • RazorLame 1.1.4 + Lame codec 3.89
  • RazorLame 1.1.4 + Lame codec 3.91
  • VirtualDub 1.4.7 + DivX codec 4.12
  • VirtualDub 1.4.7 + DivX codec 5.0 Pro
  • WinAce 2.11
  • WinZip 8.1
  • eTestingLabs Business Winstone 2001
  • eTestingLabs Content Creation Winstone 2002
  • BAPCo & MadOnion SYSmark 2001 Office Productivity
  • BAPCo & MadOnion SYSmark 2001 Internet Content Creation
  • BAPCo & MadOnion SYSmark 2002 Office Productivity
  • BAPCo & MadOnion SYSmark 2002 Internet Content Creation
  • 3DStudio MAX 4.26
  • SPECviewperf 6.1.2
  • MadOnion 3DMark 2001 SE
  • idSoftware Quake III Arena v1.30
  • Gray Matter Studios & Nerve Software Return to Castle Wolfenstein v1.1
  • Expendable Demo
  • DroneZmarK
Плата EPoX 4BDA2+ ASUS P4T-E Abit SD7-533 Soltek 75DRV5
Чипсет i845D (RG82845 + FW82801BA) i850 (KC82850 + FW82801BA) SiS 645 (SiS 645 + SiS 961) VIA KT333 (KT333 + VT8233A)
Поддержка процессоров Socket 478, Intel Pentium 4 Socket 462, AMD Duron, AMD Athlon, AMD Athlon XP
Память 2 DDR 4 RDRAM 3 DDR 3 DDR
Слоты расширения AGP/ 6 PCI/ CNR AGP/ 5 PCI/ CNR AGP/ 5 PCI AGP/ 5 PCI/ CNR
Порты ввода/ вывода 1 FDD, 2 COM, 1 LPT, 2 PS/2
USB 2 USB 1.1 + 1 разъем на 2 USB 1.1 2 USB 1.1 + 2 разъема по 2 USB 1.1 2 USB 1.1 + 1 разъем на 2 USB 1.1
Интегрированный IDE-контроллер ATA100 ATA100 ATA100 ATA133
Внешний IDE-контроллер HighPoint HPT372 - - -
Звук AC"97 codec, Avance Logic ALC201A PCI Audio, C-Media CMI8738/PCI-6ch-MX AC"97 codec, VIA VT1611A
Встроенный сетевой контроллер - - - -
I/O-контроллер Winbond W83627HF-AW Winbond W83627GF-AW Winbond W83697HF ITE IT8705F
BIOS 2 Мбит Award Medallion BIOS v.6.00 2 Мбит Award Modular BIOS v.6.00PG 2 Мбит Award Modular BIOS v. 6.00PG
Форм-фактор, размеры ATX, 30,5x24,5 см ATX, 30,5x24,5 см ATX, 30,5x23 см ATX, 30,5x22,5 см

Результаты тестов

Мы уже не раз пытались сформулировать критерии оптимального процессорного теста. Конечно, идеал недостижим, но сегодня мы делаем свой первый шаг в его направлении — запускаем проект CPU RightMark (). За подробностями и новостями проекта отсылаем вас на его сайт, здесь же приведем краткие разъяснения, которые должны помочь вам понять суть тестового эксперимента и его инструментарий.

Итак, CPU RightMark — это тест процессора и подсистемы памяти, осуществляющий численное моделирование физических процессов и решение задач из области трехмерной графики. Говоря очень кратко, один блок программы численно решает систему дифференциальных уравнений, соответствующую моделированию в реальном времени поведения системы многих тел, другой же блок визуализирует найденные решения также в режиме реального времени. Каждый блок реализован в нескольких вариантах, оптимизированных под различные системы процессорных команд. Важно отметить, что тест не является чисто синтетическим, а написан с использованием приемов и средств программирования, типичных для задач своей области (трехмерных графических приложений).

Блок решения системы дифференциальных уравнений написан с использованием набора команд сопроцессора x87, а также имеет вариант, оптимизированный для набора SSE2 (c векторизацией цикла: две итерации цикла заменяются одной, но все операции производятся с двухэлементными векторами). Скорость работы этого блока свидетельствует о производительности связки процессор+память при выполнении математических расчетов с использованием действительных чисел двойной точности (характерно для современных научных задач: геометрических, статистических, задач моделирования).

Результаты данного подтеста показывают, что скорость работы с инструкциями x87 FPU у Athlon XP выше, однако за счет поддержки набора SSE2 (естественно, отсутствующей у Athlon XP) Pentium 4 оказывается гораздо быстрее. Подчеркнем, что в данном блоке не используются SSE-команды, поэтому результаты прогона теста в режимах с задействованием SSE опущены (они просто совпадают с соответствующими MMX/FPU и MMX/SSE2). Отметим почти идеальную масштабируемость теста по частоте CPU — здесь влияние памяти почти сведено к нулю за счет эффективного кэширования и характера работы блока с интенсивными вычислениями при сравнительно малом объеме обмена данными.

Блок визуализации в свою очередь состоит из двух частей: блока предварительной обработки сцены и блока трассировки лучей и отрисовки. Первый написан на С++ и откомпилирован с использованием набора команд сопроцессора x87. Второй написан на ассемблере и имеет несколько вариантов, оптимизированных под различные наборы инструкций: FPU+GeneralMMX, FPU+EnhancedMMX и SSE+EnhancedMMX (подобное разделение на блоки является типичным для имеющихся реализаций задач визуализации в реальном времени). Суммарная скорость работы блока визуализации свидетельствует о производительности связки процессор+память при выполнении геометрических расчетов с использованием действительных чисел одинарной точности (типично для трехмерных графических программ, оптимизированных под SSE и Enhanced MMX).

Опять же, скорость работы с инструкциями x87 FPU у Athlon XP оказывается значительно выше, однако использование при вычислениях SSE вновь выводит вперед Pentium 4, несмотря на поддержку этого набора процессорами Athlon XP. При этом по производительности на мегагерц оба процессора идут практически вровень, по суммарной же — Pentium 4 получает отрыв, соответствующий его более высокой частоте. Подчеркнем, что в данном блоке не используются SSE2-команды, поэтому результаты прогона теста в режимах с задействованием SSE2 опущены (они просто совпадают с соответствующими MMX/FPU и SSE/FPU). Отметим отличную производительность связки Pentium 4 + SiS 645, вызванную, очевидно, наибольшей скоростью доступа к памяти при малой латентности. Вообще, процесс рендеринга сопровождается довольно активной пересылкой данных, что делает вклад чипсета и типа используемой памяти в суммарную производительность системы значительным.

Суммарная производительность системы рассчитывается по формуле: Overall = 1/(1/MathSolving + 1/Rendering), так что очень значительный выигрыш Pentium 4 при использовании SSE2 в блоке расчета физической модели почти не дает прироста производительности без задействования SSE в блоке визуализатора. Зато при выполнении вычислений с помощью SSE добавка от включения SSE2 составляет вполне внушительную величину. (Отметим, что данная характеристика справедлива для конкретных выбранных условий тестирования, возможности же настройки теста позволяют задать практически любое соотношение времени просчета физической модели и визуализации (путем смены экранного разрешения или точности расчетов).) Так как Athlon XP не поддерживает набор SSE2, его производительность достаточно очевидно зависит от скорости отрисовки сцен, где он уступает Pentium 4 при использовании набора SSE, хотя и остается абсолютным чемпионом по «чистой» скорости выполнения операций при помощи только MMX и FPU. Отметим, что из протестированных чипсетов под Pentium 4 i845D смотрится чуть получше i850 (вероятно, из-за большей латентности у последнего), а чемпионом является SiS 645 по причине, указанной выше.

Довольно давно уже доступна новая версия популярного кодировщика Lame, но у нас все не было случая ее применить. В рамках подготовки данной статьи было проведено тестирование и старой, использовавшейся нами до сих пор версии 3.89, и последней официально доступной версии 3.91. Результаты совпали полностью (в пределах погрешности), что вполне согласуется с отсутствием упоминания о скоростной оптимизации кода в списке нововведений программы. (Кстати, кодировщик уже больше полугода корректно поддерживает работу со всеми доступными расширенными мультимедийными наборами команд и регистров.) Тест, как видите, превосходно масштабируется по частоте процессора, так как и здесь осуществляется эффективное предварительное кэширование данных, но остается ряд вопросов по довольно низкой производительности Pentium 4 на i850 и SiS 645. Самым разумным нам кажется предположение, что такое влияние на производительность оказывает BIOS плат: продукт от Abit мы еще не видели в деле, а вот плата от ASUS на i850 нам хорошо знакома, причем при использовании предыдущей версии прошивки (еще раз отсылаем вас к прошлому ) подобного спада не наблюдалось. Athlon XP в этом тесте по-прежнему лидер, причем для победы вполне хватает и версии 2000+.

Новая версия 5.0 кодека DivX вышла совсем недавно, но учитывая огромную популярность этого продукта, нетрудно предсказать его активное использование уже в ближайшее время, без ожидания выпуска новых релизов с исправлениями ошибок. Что ж, мы следуем в русле народных пожеланий и переходим к применению версии DivX 5.0 Pro. Мы также провели аналогичное тестирование c версией DivX 4.12, и результаты сравнения кодеков таковы: операция кодирования ускоряется весьма ощутимо — более чем на минуту, причем вне зависимости от процессора, чипсета и типа памяти. Также отметим, что DivX 5.0 Pro формирует чуть больший выходной видеофайл. К сравнению же собственно процессоров в этом тесте нам добавить нечего — все уже было сказано в прошлой статье, а вот на неплохую масштабируемость кодирования стоит обратить внимание.

В архивировании WinAce, как и при кодировании MPEG4, влияние подсистемы памяти (вследствие большого объема пересылаемых данных) примерно в два раза скрадывает эффект от увеличения частоты процессора. Athlon XP в этом тесте все еще лучше своего визави.

В архивировании WinZip отметим разве что некоторое отставание Pentium 4 на SiS 645 и полное равенство в остальных случаях.

Результаты Winstones выглядят на редкость логично и понятно, но памятуя о частых необъяснимых провалах и всплесках в этих тестах в прошлом, мы, пожалуй, воздержимся от комментариев.

Напомню, что до сих пор нам приходилось говорить решительное «не верим!» результатам Athlon XP в тесте SYSmark, так как в силу криворукости отдельных программистов версия WME 7.0, входящая в состав приложений группы Internet Content Creation этого теста, не умела определять поддержку набора инструкций SSE у Athlon XP. К счастью, мы наконец начинаем тестирование в обновленной версии бенчмарка — SYSmark 2002, в которой эта проблема решена.

Вкратце об отличиях в составе приложений тестов:

SYSmark 2001 SYSmark 2002
Office Productivity
Dragon NaturallySpeaking Preferred 5
McAfee VirusScan 5.13
Microsoft Access 2000 Microsoft Access 2002
Microsoft Excel 2000 Microsoft Excel 2002
Microsoft Outlook 2000 Microsoft Outlook 2002
Microsoft PowerPoint 2000 Microsoft PowerPoint 2002
Microsoft Word 2000 Microsoft Word 2002
Netscape Communicator 6.0
WinZip 8.0
Internet Content Creation
Adobe Photoshop 6.0 Adobe Photoshop 6.0.1
Adobe Premiere 6.0
Macromedia Dreamweaver 4
Macromedia Flash 5
Microsoft Windows Media Encoder 7.0 Microsoft Windows Media Encoder 7.1

Как видите, никаких замен нет, только обновления версий. Алгоритм подсчета итоговых баллов официально известных изменений не претерпел, хотя мы бы предположили пересчет некоторых коэффициентов пропорциональности.

Интересно сравнение результатов старого и нового пакетов в офисном подтесте: во-первых, был, вероятно, введен некий корректирующий коэффициент, что привело к уменьшению показателей обеих сторон. Во-вторых, очевидно, в силу переделанного пакета Microsoft Office, Pentium 4 начал выигрывать в этом подтесте, хотя в SYSmark 2001 обе процессорные платформы шли вровень.

В создающем контент подтесте ситуация еще интереснее: за счет нормального распознавания SSE у Athlon XP в MS WME 7.1 процессор AMD прибавил, но зато в состав подтеста нового пакета входит переписанная для поддержки SSE2 версия Adobe Photoshop 6.0.1, так что Pentium 4 получает даже больший прирост.

В итоге, от сомнительного лидерства в SYSmark Pentium 4 переходит к лидерству очевидному. Обратите также внимание на то, как здорово растет производительность Pentium-систем в этом тесте с ростом частоты процессора, и на почти отсутствующий аналогичный эффект для Athlon-системы.

Рендеринг в 3DStudio MAX отлично масштабируется и обычно не демонстрирует признаков зависимости от скорости работы с памятью, так что нам остается только гадать, что же такое наворотили в последней прошивке BIOS для ASUS P4T-E инженеры компании. На диаграмме хорошо видно, что рендеринг на Athlon XP ускоряется пропорционально увеличению частоты процессора, но как раз за счет гораздо более высокой частоты Pentium 4 2,4 ГГц уходит в этом тесте в отрыв, хотя скорость еще 2,2-гигагерцовой модели была примерно равна Athlon XP 2000+.

В SPECviewperf, в общем, ничего интересного: результаты почти везде равные, с легким перевесом Pentium 4, и лишь в DX-06 заметно впереди Athlon XP. Обратите внимание на то, что скорость тестов практически не зависит от скорости процессоров.

При переходе на новый процессор Intel игровой бенчмарк делает небольшой рывок, но это не помогает ему дотянуть даже до результатов Athlon XP 2000+.

Добавление к тестовым играм Return to Castle Wolfenstein, основанной на движке Quake III, ситуацию, естественно, никак не изменило. Более того, относительные показатели в этих двух играх похожи практически один в один. Приплюсуем сюда же DroneZ, отличающуюся движком, но не характером результатов, и остается только древняя Expendable — негусто для Athlon XP… Отметим, что все игры примерно одинаково неплохо масштабируются по частоте процессора, что тоже играет на руку Intel.

Выводы

Прощание ядру Palomino не слишком удалось: нельзя сказать, что Athlon XP так уж сильно отстает от своего соперника, да и далеко не везде это отставание вообще имеет место, но тенденции налицо. С реальной ли частотой, с PR-рейтингом ли — AMD отстает от Intel по волшебным цифрам в названии процессоров, а прирост производительности на увеличение частоты (какой бы «дутой» ее ни считали у Pentium 4) в большинстве наших тестов дает преимущество в абсолютных показателях именно линейке Pentium 4. Многие приложения «узнали», наконец, про поддержку SSE в Athlon XP, что дало некоторый всплеск, но это тупик, а вот оптимизация под SSE2 еще далеко не завершена, и чем дальше — тем больше приложений будет переходить из «лагеря AMD» в «лагерь Intel».

Впрочем, пост свой Palomino оставляет все же в приличном состоянии. Отставание последней модели от имеющихся конкурентов отнюдь не катастрофическое, цена привлекательная, а мы с больши м интересом будет наблюдать за попытками AMD вернуть лидерство с новым ядром.