Домой /  Интернет / Процессор имеет 2 ядра с. Процессоры. Рендеринг трёхмерных сцен

Процессор имеет 2 ядра с. Процессоры. Рендеринг трёхмерных сцен

Наверное, каждый пользователь мало знакомый с компьютером сталкивался с кучей непонятных ему характеристик при выборе центрального процессора: техпроцесс, кэш, сокет; обращался за советом к друзьям и знакомым, компетентным в вопросе компьютерного железа. Давайте разберемся в многообразии всевозможных параметров, потому как процессор – это важнейшая часть вашего ПК, а понимание его характеристик подарит вам уверенность при покупке и дальнейшем использовании.

Центральный процессор

Процессор персонального компьютера представляет собой микросхему, которая отвечает за выполнение любых операций с данными и управляет периферийными устройствами. Он содержится в специальном кремниевом корпусе, называемом кристаллом. Для краткого обозначения используют аббревиатуру — ЦП (центральный процессор) или CPU (от англ. Central Processing Unit – центральное обрабатывающее устройство). На современном рынке компьютерных комплектующих присутствуют две конкурирующие корпорации, Intel и AMD , которые беспрестанно участвуют в гонке за производительность новых процессоров, постоянно совершенствуя технологический процесс.

Техпроцесс

Техпроцесс — это размер, используемый при производстве процессоров. Он определяет величину транзистора, единицей измерения которого является нм (нанометр). Транзисторы, в свою очередь, составляют внутреннюю основу ЦП. Суть заключается в том, что постоянное совершенствование методики изготовления позволяет уменьшать размер этих компонентов. В результате на кристалле процессора их размещается гораздо больше. Это способствует улучшению характеристик CPU, поэтому в его параметрах всегда указывают используемый техпроцесс. Например, Intel Core i5-760 выполнен по техпроцессу 45 нм, а Intel Core i5-2500K по 32 нм, исходя из этой информации, можно судить о том, насколько процессор современен и превосходит по производительности своего предшественника, но при выборе необходимо учитывать и ряд других параметров.

Архитектура

Также процессорам свойственно такая характеристика, как архитектура - набор свойств, присущий целому семейству процессоров, как правило, выпускаемому в течение многих лет. Говоря другими словами, архитектура – это их организация или внутренняя конструкция ЦП.

Количество ядер

Ядро – самый главный элемент центрального процессора. Оно представляет собой часть процессора, способное выполнять один поток команд. Ядра отличаются по размеру кэш памяти, частоте шины, технологии изготовления и т. д. Производители с каждым последующим техпроцессом присваивают им новые имена (к примеру, ядро процессора AMD – Zambezi, а Intel – Lynnfield). С развитием технологий производства процессоров появилась возможность размещать в одном корпусе более одного ядра, что значительно увеличивает производительность CPU и помогает выполнять несколько задач одновременно, а также использовать несколько ядер в работе программ. Многоядерные процессоры смогут быстрее справиться с архивацией, декодированием видео, работой современных видеоигр и т.д. Например, линейки процессоров Core 2 Duo и Core 2 Quad от Intel, в которых используются двухъядерные и четырехъядерные ЦП, соответственно. На данный момент массово доступны процессоры с 2, 3, 4 и 6 ядрами. Их большее количество используется в серверных решениях и не требуется рядовому пользователю ПК.

Частота

Помимо количества ядер на производительность влияет тактовая частота . Значение этой характеристики отражает производительность CPU в количестве тактов (операций) в секунду. Еще одной немаловажной характеристикой является частота шины (FSB – Front Side Bus) демонстрирующая скорость, с которой происходит обмен данных между процессором и периферией компьютера. Тактовая частота пропорциональна частоте шины.

Сокет

Чтобы будущий процессор при апгрейде был совместим с имеющейся материнской платой, необходимо знать его сокет. Сокетом называют разъем , в который устанавливается ЦП на материнскую плату компьютера. Тип сокета характеризуется количеством ножек и производителем процессора. Различные сокеты соответствуют определенным типам CPU, таким образом, каждый разъём допускает установку процессора определённого типа. Компания Intel использует сокет LGA1156, LGA1366 и LGA1155, а AMD — AM2+ и AM3.

Кэш

Кэш - объем памяти с очень большой скоростью доступа, необходимый для ускорения обращения к данным, постоянно находящимся в памяти с меньшей скоростью доступа (оперативной памяти). При выборе процессора, помните, что увеличение размера кэш-памяти положительно влияет на производительность большинства приложений. Кэш центрального процессора различается тремя уровнями (L1, L2 и L3 ), располагаясь непосредственно на ядре процессора. В него попадают данные из оперативной памяти для более высокой скорости обработки. Стоит также учесть, что для многоядерных CPU указывается объем кэш-памяти первого уровня для одного ядра. Кэш второго уровня выполняет аналогичные функции, отличаясь более низкой скоростью и большим объемом. Если вы предполагаете использовать процессор для ресурсоемких задач, то модель с большим объемом кэша второго уровня будет предпочтительнее, учитывая что для многоядерных процессоров указывается суммарный объем кэша L2. Кэшем L3 комплектуются самые производительные процессоры, такие как AMD Phenom, AMD Phenom II, Intel Core i3, Intel Core i5, Intel Core i7, Intel Xeon. Кэш третьего уровня наименее быстродействующий, но он может достигать 30 Мб.

Энергопотребление

Энергопотребление процессора тесно связано с технологией его производства. С уменьшением нанометров техпроцесса, увеличением количества транзисторов и повышением тактовой частоты процессоров происходит рост потребления электроэнергии CPU. Например, процессоры линейки Core i7 от Intel требуют до 130 и более ватт. Напряжение подающееся на ядро ярко характеризует энергопотребление процессора. Этот параметр особенно важен при выборе ЦП для использования в качестве мультимедиа центра. В современных моделях процессоров используются различные технологии, которые помогают бороться с излишним энергопотреблением: встраиваемые температурные датчики, системы автоматического контроля напряжения и частоты ядер процессора, энергосберегающие режимы при слабой нагрузке на ЦП.

Дополнительные возможности

Современные процессоры приобрели возможности работы в 2-х и 3-х канальных режимах с оперативной памятью, что значительно сказывается на ее производительности, а также поддерживают больший набор инструкций, поднимающий их функциональность на новый уровень. Графические процессоры обрабатывают видео своими силами, тем самым разгружая ЦП, благодаря технологии DXVA (от англ. DirectX Video Acceleration – ускорение видео компонентом DirectX). Компания Intel использует вышеупомянутую технологию Turbo Boost для динамического изменения тактовой частоты центрального процессора. Технология Speed Step управляет энергопотреблением CPU в зависимости от активности процессора, а Intel Virtualization Technology аппаратно создает виртуальную среду для использования нескольких операционных систем. Также современные процессоры могут делиться на виртуальные ядра с помощью технологии Hyper Threading . Например, двухъядерный процессор способен делить тактовую частоту одного ядра на два, что способствует высокой производительности обработки данных с помощью четырех виртуальных ядер.

Размышляя о конфигурации вашего будущего ПК, не забывайте про видеокарту и ее GPU (от англ. Graphics Processing Unit – графическое обрабатывающее устройство) – процессор вашей видеокарты, который отвечает за рендеринг (арифметические операции с геометрическими, физическими объектами и т.п.). Чем больше частота его ядра и частота памяти, тем меньше будет нагрузки на центральный процессор. Особенное внимание к графическому процессору должны проявить геймеры.

Гонку за дополнительную производительность на рынке процессоров могут выиграть только те производители, которые на основе текущих технологий производства смогут обеспечить разумный баланс между тактовой частотой и количеством вычислительных ядер. Благодаря переходу на 90- и 65-нм техпроцессы появилась возможность создавать процессоры с большим числом ядер. В немалой степени это было обусловлено и новыми возможностями регулировки тепловыделения, и размерами ядер, именно поэтому сегодня мы наблюдаем появление всё большего числа четырёхядерных процессоров. Но как насчёт программного обеспечения? Насколько хорошо оно масштабируется от одного до двух или четырёх ядер?

В идеальном мире программы, оптимизированные под многопоточность, позволяют операционной системе распределять несколько потоков по доступным вычислительным ядрам, будь то один процессор или несколько, с одним ядром или с несколькими. Добавление новых ядер позволяет получить больший прирост производительности, чем любой прирост тактовой частоты. Это действительно имеет смысл: большее количество рабочих почти всегда справятся с заданием быстрее, чем меньшее количество более быстрых рабочих.

Но имеет ли смысл оснащать процессоры четырьмя или даже большим числом ядер? Хватит ли работы, чтобы нагрузить четыре ядра или большее их количество? Не стоит забывать, что весьма сложно распределить работу между ядрами, чтобы такие физические интерфейсы, как HyperTransport (AMD) или Front Side Bus (Intel), не стали "узким местом". Есть и третий вариант: механизм, который распределяет нагрузку между ядрами, а именно, диспетчер ОС, может тоже стать "узким местом".

Переход AMD с одного на два ядра прошёл практически безупречно, поскольку компания не увеличивала тепловой пакет до экстремального уровня, как это было у процессоров Intel Pentium 4. Поэтому процессоры Athlon 64 X2 были дорогими, но вполне разумными, а линейка Pentium D 800 прославилась своей горячей работой. Но 65-нм процессоры Intel и, в особенности, линейка Core 2 изменили картину. Intel смогла сочетать два процессора Core 2 Duo в одной упаковке, в отличие от AMD, в результате чего мы и получили современные Core 2 Quad. AMD обещает выпустить до конца этого года свои собственные четырёхядерные процессоры Phenom X4.

В нашей статье мы рассмотрим конфигурацию Core 2 Duo на четырёх ядрах, двух ядрах и на одном ядре. И посмотрим, насколько хорошо масштабируется производительность. Стоит ли сегодня переходить на четыре ядра?

Одно ядро

Под термином "одноядерный" скрывается процессор, который обладает одним вычислительным ядром. Сюда подпадают практически все процессоры с зарождения архитектуры 8086 вплоть до Athlon 64 и Intel Pentium 4. Пока техпроцесс производства не стал достаточно тонким, чтобы создавать два вычислительных ядра на одном кристалле, переход на меньший техпроцесс использовался для снижения рабочего напряжения, увеличения тактовых частот или добавления функциональных блоков и кэш-памяти.

Работа одноядерного процессора на высоких тактовых частотах может дать более высокую производительность для одного приложения, но подобный процессор в один момент времени может выполнять только одну программу (поток). Intel реализовала принцип Hyper-Threading, который эмулирует наличие нескольких ядер для операционной системы. Технология HT позволила лучше загрузить длинные конвейеры процессоров Pentium 4 и Pentium D. Конечно, прирост производительности был невелик, но отзывчивость системы оказалась определённо лучше. А в многозадачном окружении это может быть и важнее, поскольку вы сможете выполнять какую-либо работу, пока ваш компьютер работает над определённой задачей.

Поскольку двуядерные процессоры сегодня стоят очень дёшево, мы не рекомендуем брать одноядерные процессоры, если только вы не хотите экономить каждую копейку.


Процессор Core 2 Extreme X6800 на момент выхода был самым быстрым в линейке Intel Core 2, работая на частоте 2,93 ГГц. Сегодня двуядерные процессоры достигли 3,0 ГГц, правда, при более высокой частоте шины FSB1333.

Переход на два процессорных ядра означает в два раза большую вычислительную мощность, но только на приложениях, оптимизированных под многопоточность. Обычно такие приложения включают профессиональные программы, которым нужна высокая вычислительная мощность. Но двуядерный процессор всё равно имеет смысл, даже если вы используете свой компьютер лишь для электронной почты, просмотра интернет-страниц и работы с офисными документами. С одной стороны, современные модели двуядерных процессоров потребляют не особо больше энергии, чем одноядерные модели. С другой стороны, второе вычислительное ядро не только добавляет производительность, но и улучшает отзывчивость системы.

Вы когда-нибудь ждали, пока WinRAR или WinZIP закончат сжатие файлов? На одноядерной машине вы вряд ли сможете быстро переключаться между окнами. Даже воспроизведение DVD может нагружать одно ядро не меньше, чем сложная задача. Двуядерный процессор позволяет легче справляться с одновременным запуском нескольких приложений.

Двуядерные процессоры AMD содержат два полноценных ядра с кэш-памятью, интегрированным контроллером памяти и кросс-коммутатором, который обеспечивает совместный доступ к памяти и к интерфейсу HyperTransport. Intel пошла путём, схожим с первым Pentium D, установив в физический процессор два ядра Pentium 4. Поскольку контроллер памяти является частью чипсета, системную шину приходится использовать и для связи между ядрами, и для доступа к памяти, что накладывает определённые ограничения на производительность. Процессор Core 2 Duo оснащён более совершенными ядрами, которые дают лучшую производительность на такт и лучшее соотношение производительности на ватт. У двух ядер используется общий кэш L2, который позволяет обмениваться данными без использования системной шины.

Процессор Core 2 Quad Q6700 работает на частоте 2,66 ГГц, используя внутри два ядра Core 2 Duo.

Если сегодня существует много причин, чтобы перейти на двуядерные процессоры, то четыре ядра выглядят пока не так убедительно. Одна из причин заключается в ограниченной оптимизации программ под несколько потоков, но существуют и определённые проблемы в архитектуре. Хотя AMD сегодня критикует Intel за упаковку двух двуядерных кристаллов в одном процессоре, считая это не "настоящим" четырёхядерным CPU, подобный подход Intel работает хорошо, поскольку процессоры действительно обеспечивают четырёхядерную производительность. С точки зрения производства легче получить высокий уровень выхода годных кристаллов и выпускать больше продуктов с небольшими ядрами, которые затем можно соединить вместе для нового, более мощного продукта на новом техпроцессе. Что же касается производительности, то есть "узкие места" - два кристалла взаимодействуют друг с другом через системную шину, поэтому весьма сложно управлять несколькими ядрами, распределёнными на несколько кристаллов. Хотя наличие нескольких кристаллов позволяет обеспечить лучшую экономию энергии и регулировать частоты отдельных ядер для нужд приложения.

Настоящие четырёхядерные процессоры используют четыре ядра, которые, вместе с кэш-памятью, располагаются на одном кристалле. Здесь важно наличие общего унифицированного кэша. AMD будет реализовывать такой подход, оснащая 512 кбайт кэша L2 каждое ядро и добавляя кэш L3 для всех ядер. Преимущество AMD заключается в том, что можно будет выключать отдельные ядра и ускорять другие, чтобы получить более высокую производительность однопоточных приложений. Intel пойдёт тем же путём, но не раньше представления в 2008 году архитектуры Nehalem.

Утилиты вывода системной информации, такие, как CPU-Z, позволяют узнать число ядер и объёмы кэша, но не раскладку процессора. Вы не узнаете, что Core 2 Quad (или четырёхядерный Extreme Edition, показанный на скриншоте) состоит из двух ядер.


Добрый день, уважаемые читатели нашего техноблога. Сегодня у нас не обзор, а некое подобие сравнения какой процессор лучше 2 ядерный или 4 ядерный? Интересно, кто круче себя показывает в 2018 году? Тогда приступим. Сразу скажем, что пальма первенства в большинстве случаев будет за устройством с большим числом физических модулей, но и чипы с 2 ядрами не так просты, как кажутся на первый взгляд.

Многие, наверное уже догадались, что рассматривать мы будем всех текущих представителей от Intel семейства Pentium Coffee Lake и народный «гиперпень» G4560 (Kaby Lake). Насколько модели актуальны в текущем году и стоит ли задуматься о покупке более производительных AMD Ryzen или тех же Core i3 с 4‑мя ядрами.

Семейство AMD Godavari и Bristol Ridge намеренно не рассматривается по одной простой причине – оно не имеет никакого дальнейшего потенциала, да и сама платформа оказалась не самой удачной, как могло предполагаться.

Зачастую эти решения покупаются либо по незнанию, либо «на сдачу» в качестве какой-нибудь максимально дешевой сборки для интернета и онлайн-фильмов. Но нас такое положение вещей особо не устраивает.

Отличия 2‑ядерных чипов от 4‑ядерных

Рассмотрим основные моменты, которые отличают первую категорию чипов от второй. На аппаратном уровне можно заметить, что отличается только количество вычислительных блоков. В остальных случаях, ядра объединены высокоскоростной шиной обмена данными, общим контроллером памяти для плодотворной и оперативной работы с ОЗУ.

Зачастую кэш L1 каждого ядра – величина индивидуальная, а вот L2 может быть либо един для всех, либо также индивидуален для каждого блока. Однако в таком случае дополнительно используется уже кэш-память L3.

В теории 4‑ядерные решения должны быть быстрее и мощнее в 2 раза, поскольку выполняют на 100% больше операций за такт (возьмем за основу идентичную частоту, кэш, техпроцесс и все прочие параметры). Но на практике ситуация меняется совершенно нелинейно.

Но здесь стоит отдать должное: в многопотоке вся сущность 4 ядер раскрывается в полной мере.

Почему 2‑ядерные процессоры все еще популярны?

Если взглянуть на мобильный сегмент электроники, то можно заметить засилье 6–8 ядерных чипов, которые выглядят максимально органично и нагружаются параллельно при выполнении всех задач. Почему так? ОС Android и iOS – довольно молодые системы с высоким уровнем конкуренции, а потому оптимизация каждого приложения – залог успеха продаж девайсов.

С индустрией ПК ситуация иная и вот почему:

Совместимость. При разработке любого ПО разработчики стремятся угодить как новой, так и старой аудитории со слабым железом. На 2‑ядерных процессорах делается больший акцент в ущерб поддержки 8‑ядерных.

Распараллеливание задач. Несмотря на засилье технологий в 2018 году, заставить программу работать с несколькими ядрами и потоками ЦП параллельно все еще не просто. Если речь заходит за просчет нескольких совершенно разных приложений, то вопросов нет, но когда дело касается вычислений внутри одной программы – тут уже хуже: приходится регулярно просчитывать абсолютно разную информацию, при этом не забывая об успехе задач и отсутствии ошибок при вычислениях.

В играх ситуация еще более интересная, поскольку объемы информации разделить на равные «доли» практически нереально. В итоге получаем следующую картину: один вычислительный блок маслает на 100%, остальные 3 – ждут своей очереди.

Преемственность. Каждое новое решение основывается на предыдущих наработках. Писать код с нуля не только дорого, но и зачастую невыгодно центру разработки, поскольку «людям и этого хватит, а пользователей 2‑ядерных чипов все еще львиная доля».

Взять к примеру многие культовые проекты вроде Lineage 2, AION, World of Tanks. Все они создавались на базе древних движков, которые способны адекватно нагрузить лишь одно физическое ядро, а потому здесь основную роль при вычислениях играет только частота чипа.
Финансирование. Далеко не все могут позволить себе создать совершенно новый продукт, рассчитанный не 4,8, 16 потоков. Это слишком дорого, да и в большинстве случаев неоправданно. Взять к примеру ту же культовую GTA V, которая без проблем «съест» и 12 и 16 потоков, не говоря уже о ядрах.

Стоимость ее разработки перевалила за добрые 200 млн долларов, что само по себе уже очень дорого. Да, игра оказалась успешной, поскольку кредит доверия Rockstar в среде игроков был огромен. А если бы это был молодой стартап? Тут уже сами все понимаете.

Нужны ли многоядерные процессоры?

Давайте рассмотрим ситуацию с точки зрения простого обывателя. Большинству пользователей хватает 2 ядер по следующим причинам:

  • невысокие потребности;
  • большинство приложений работает стабильно;
  • игры – не главный приоритет;
  • низкая стоимость сборок;
  • процессоры сами по себе дешевые;
  • большинство покупает готовые решения;
  • некоторые пользователи понятия не имеют, что им продают в магазинах и чувствуют себя прекрасно.

Можно ли играть на 2 ядрах? Да без проблем, что с успехом несколько лет доказывала линейка Intel Core i3 вплоть до 7‑го поколения. Также огромной популярностью пользовались Pentium Kaby Lake, в которые впервые в истории внедрили поддержку Hyper Threading.
Стоит ли сейчас покупать 2 ядра, пусть и с 4‑мя потоками? Исключительно для офисных задач. Эпоха данных чипов постепенно уходит, да и производители начали массово переключаться на 4 полноценных физических ядра, а потому не стоит рассматривать те же Pentium и Core i3 Kaby Lake в долгосрочной перспективе. AMD так и вовсе отказалась от 2‑ядерников.

В ноябрьском номере мы довольно подробно рассмотрели особенности нового четырехъядерного процессора Intel Core 2 Extreme QX6700, сосредоточившись главным образом на его архитектурных особенностях. Кроме того, были представлены первые результаты сравнительного тестирования этого процессора. Но напомним, что это было всего лишь несколько тестов, выполненных техническими специалистами компании Intel в рамках Форума IDF 2006. Естественно, по данным тестирования четырехъядерный процессор Intel Core 2 Extreme QX6700 выглядел весьма впечатляюще по сравнению с двухъядерным процессором Intel Core 2 Extreme X8600. Однако набор использовавшихся тестов вызывал некоторое сомнение в их объективности, поэтому мы решили самостоятельно провести подробное, всестороннее тестирование процессора Intel Core 2 Extreme QX6700 в сравнении с процессором Intel Core 2 Extreme X8600.

Предисловие

Напомним, что на форуме IDF 2006 компания Intel представила новый четырехъядерный процессор Intel Core 2 Extreme QX6700 и обнародовала первые результаты его тестирования в сравнении с двухъядерным процессором Intel Core 2 Extreme Х8600. Для тестирования специалистами компании Intel были отобраны следующие бенчмарки и приложения:

  • 3DMark06 v. 1.0.2;
  • PCMark05 v. 1.1.0;
  • 3DS Max 8 SP2;
  • XMPEG 5.03 (кодек DivX 6.2.5);
  • POV-Ray 3.7 Beta 15;
  • Sony Vegas 7.0a Build 115.

Конечно же, такой набор тестов нельзя признать объективным для оценки производительности и сравнения процессоров. Действительно, 3DMark06 v. 1.0.2 - это синтетический игровой тест, который используется для тестирования процессоров и видеокарт. К сожалению, на основе его результатов нельзя делать вывод о производительности процессора в играх. И тот факт, что ПК демонстрирует высокий результат в тесте 3DMark06 v. 1.0.2, вовсе не означает, что в реальных играх ПК результаты будут такими же.

Тест PCMark05 v. 1.1 позволяет провести комплексный анализ производительности ПК и его отдельных подсистем, в том числе процессора. Несомненным достоинством этого теста является то, что для тестирования не требуется слишком много времени, однако для объективной комплексной оценки производительности ПК результатов лишь этого теста мало.

Приложение 3DS Max 8 SP2 вполне может применяться для тестирования процессора, однако специалисты компании Intel использовали в тестировании только финальный рендеринг трехмерных сцен. А ведь работа с 3DS Max 8 SP - это не только рендеринг, но и сам процесс создания сцены. Скрипты, имитирующие работу пользователя в окнах проекций, в ходе тестирования также не применялись. И хотя в данном случае основная нагрузка ложится на процессор графической карты, говорить, что результаты вообще не зависят от процессора, было бы неверно.

Приложение POV-Ray 3.7 Beta 15, в котором имеется встроенный бенчмарк, опять-таки позволяет протестировать процессор на предмет производительности при рендеринге трехмерных сцен. То же самое касается и приложения XMPEG 5.03, которое в паре с кодеком DivX 6.2.5 использовалось для конвертирования High Definition-видеоконтента.

Ну и последнее приложение - Sony Vegas 7.0a Build 115 - применялось для нелинейного видеомонтажа. В данном случае все корректно и никаких замечаний у нас нет.

Несмотря на то что каждый из рассмотренных тестов (или приложений) является широко распространенным и традиционно используется для тестирования процессоров, делать какие-либо объективные выводы о производительности процессора Intel Core 2 Extreme QX6700, основываясь лишь на результатах данного набора тестов, было бы не совсем корректно. Вполне может оказаться, что именно в этих специально отобранных тестах четырехъядерный процессор Intel Core 2 Extreme QX6700 демонстрирует свое превосходство над двухъядерным процессором Intel Core 2 Extreme Х8600, однако это вовсе не означает, что можно будет говорить о росте производительности при работе с остальными приложениями. То есть можно ли на основании, к примеру, результатов теста по конвертированию видео с использованием приложения XMPEG 5.03 в паре с кодеком DivX 6.2.5 говорить о том, что процессор Intel Core 2 Extreme QX6700 при работе с любыми приложениями по конвертированию видео позволяет получить прирост производительности в сравнении с процессором Intel Core 2 Extreme Х8600?

Для получения более объективного представления о производительности процессора Intel Core 2 Extreme QX6700 и выявления класса задач, при решении которых можно говорить о неоспоримом преимуществе четырех ядер над двумя, мы решили провести полноценное сравнительное тестирование четырехъядерного и двухъядерного процессоров с применением достаточно большого набора тестов.

Но, прежде чем переходить к рассмотрению методики тестирования и анализу результатов, приведем краткую справку об участниках тестирования.

Кратко о процессорах Intel Core 2 Extreme QX6700 и Intel Core 2 Extreme Х8600

Процессор Intel Core 2 Extreme QX6700 известен под кодовым названием Kentsfield. С точки зрения конструкции он представляет собой два двухъядерных процессора Conroe, совмещенных в одном процессорном корпусе.

Максимальное энергопотребление (TDP) четырехъядерного процессора Intel Core 2 Extreme QX6700 составляет 130 Вт, следовательно, для него требуется эффективная система охлаждения, а потому создать тихий компьютер на базе такого процессора невозможно. Максимальное энергопотребление (TDP) двухъядерного процессора Intel Core 2 Extreme X8600 несколько ниже и составляет 95 Вт.

Процессор Intel Core 2 Extreme QX6700 имеет тактовую частоту 2,66 ГГц и напряжение питания 1,238 В, частота FSB составляет 1066 МГц, а суммарный объем кэш-памяти L2 - 8 Мбайт (2x4 Мбайт). Процессор Intel Core 2 Extreme X8600 имеет тактовую частоту 2,93 ГГц и напряжение питания 1,213 В, частота FSB составляет 1066 МГц, а объем кэш-памяти L2 - 4 Мбайт.

Краткие технические характеристики обоих процессоров приведены в табл. 1.

Таблица 1. Краткие технические характеристики процессоров
Intel Core 2 Extreme QX6700 и Intel Core 2 Extreme X8600

Параметры

Intel Core 2 Extreme QX6700

Intel Core 2 Extreme X6800

Количество ядер

Тактовая частота, ГГц

Частота FSB, МГц

Объем кэш­памяти L2, Мбайт

Напряжение питания, В

Энергопотребление (максимальное), Вт

Методика тестирования

Для тестирования процессора Intel Core 2 Extreme QX6700 использовался стенд следующей конфигурации:

CAS Latency - 4,

RAS to CAS Delay - 4,

Row Precharge - 3,

Active to Precharge - 12;

Дополнительно устанавливались драйверы всех интегрированных устройств.

Как уже отмечалось, для сравнения был протестирован двухъядерный процессор Intel Core 2 Extreme X8600.

Для тестирования обоих процессоров мы применяли бенчмарки и реальные приложения, которые интенсивно нагружают процессор и память и традиционно используются для комплексного анализа производительности системы в целом:

  • игровые тесты:

Quake 4 Demo ver 1.3,

F.E.A.R. ver 1.07,

Far Cry v.1.33,

Prey ver 1.01,

Company of Heroes ver 1.0,

Serious Sam 2 Demo,

The Chronics of Riddik;

  • производительность ПК в целом:

Crystal Mark 9.0;

  • научные расчеты:

Science Mark 2.0,

Super_PI/mod 1.5 XS,

SunGard Adaptiv Credit Risk;

  • работа с 3D-графикой:

3ds Max 8.0 SP3 (скрипт SPECapc 3ds max 8 v.1.3),

Alias WaveFront Maya 6.5 (скрипт SPECapc Maya 6.5 v1.0),

SPECViewperf 9.0,

CINEBENCH 9.5,

POV-Ray v.3.7 Beta 17 (встроенный тест);

  • распознавание текста: ABBYY FineReader 8.0 Pro;
  • обработка цифровых фотографий: Adobe Photoshop CS2;
  • аудиокодирование: Lame 4.0;
  • архивирование: 7-ZIP 4.42;
  • видеокодирование:

XMPEG 5.2 Beta 2,

DivX Converter 6.1.1,

TMPGEnc 2.524,

MainConcept MPEG Encoder 1.51,

MainConcept H.264 Encoder v.2.0.15.

Все тесты запускались по три раза, а по результатам измерений вычислялись среднее значение и доверительный диапазон измерения с вероятностью 95%.

Описание и настройка тестов

Игровые тесты

Группу игровых тестов составили наиболее популярные сегодня динамичные игры и синтетический бенчмарк 3DMark06 v.1.0.2, который предназначен для определения производительности ПК в игровых приложениях и традиционно используется для тестирования видеокарт. Однако результаты этого теста зависят не только от видеокарты, но и от возможностей центрального процессора.

Чтобы максимально загрузить именно процессор, а не видеокарту, при тестировании все игры и бенчмарк 3DMark06 v.1.0.2 запускались при разрешении 800x600 точек, а видеодрайвер настраивался на максимальную производительность. Кроме того, с целью увеличения нагрузки на центральный процессор в играх не использовались технологии антиалиасинга и анизотропной фильтрации. Все игры настраивались на максимальную производительность за счет отказа от всех эффектов, повышающих реалистичность изображения, но сказывающихся на падении производительности. Описание настроек каждой игры - довольно утомительное и скучное занятие, поэтому просто напомним их главный принцип: отключаются все эффекты, которые можно отключить.

Отметим, что в играх Quake 4 ver. 1.3 и Prey ver 1.014 мы применяли демо-версии, написанные специально для этого тестирования, а во всех остальных - те, что входят в состав игр.

В игровых тестах измерялась скорость обработки кадров, то есть количество кадров в секунду (frame per second, fps).

В тесте 3DMark06 v.1.0.2 результат, который рассчитывается по довольно сложной формуле, измеряется в безразмерных единицах, причем чем их больше, тем лучше.

Производительность ПК в целом

В группу тестов, ориентированных на измерение общей производительности ПК, вошли PCMark05 и CrystalMark 9.0.

Первый тест предназначен для комплексного анализа производительности ПК. В нем проводится ряд подтестов (всего 48), которые акцентированно нагружают различные подсистемы ПК: процессор, память, графическую подсистему, подсистему хранения данных. По результатам теста рассчитывается интегральный показатель производительности системы в целом, а также индексы производительности отдельных подсистем ПК (CPU Score, Memory, Graphics, HDD).

Результаты теста PCMark05 измеряются в безразмерных единицах, причем чем выше результат, тем лучше.

Второй тест также является комплексным и предназначен для анализа производительности ПК в целом и отдельных его подсистем. В данном бенчмарке проводятся отдельные подтесты с преимущественной нагрузкой на центральный процессор (ALU, FPU), память (MEM), подсистему хранения данных (HDD), графическую подсистему (GDI, D2D, OGL).

По результатам теста вычисляется безразмерный интегральный показатель производительности (Mark), а также показатели производительности отдельных подсистем ПК.

Опять-таки - чем выше результат, тем лучше.

Научные расчеты

В составе группы тестов, имитирующих научные расчеты, оказались Science Mark 2.0, Super_PI/mod 1.5 XS и SunGard Adaptiv Credit Risk.

Тест Science Mark 2.0 предназначен для определения производительности ПК при проведении научных расчетов. Основная нагрузка в нем приходится на процессор и память.

Результаты теста представляются в безразмерных единицах. Более высокому результату соответствует более высокая производительность.

В тесте Super_PI/mod 1.5 XS с заданной точностью (число знаков после запятой) вычисляется число PI. В нашем тестировании мы задали самую высокую точность - 32 М, то есть 32 млн знаков после запятой.

Результатом теста является время выполнения расчета, выраженное в секундах. Понятно, что чем меньше время, тем выше производительность процессора.

SunGard Adaptiv Credit Risk - это программа, которая применяется для расчета кредитных рисков по многим факторам на основе анализа огромной совокупности данных. Она является индустриальным стандартом и используется в крупных корпорациях. Ориентированная на применение в кластерных системах и мощных серверах, эта программа поддерживает многопроцессорность и хорошо масштабируется с ростом числа процессоров.

Результатом теста на основе программы SunGard Adaptiv Credit Risk является время выполнения расчетов, выраженное в секундах. Чем меньше время, тем выше производительность процессора.

Архивирование

Для архивирования использовался многопоточный архиватор 7-Zip 4.42. Архивированию подвергался тестовый каталог размером 135 Мбайт, который сжимался до 66,9 Мбайт, причем задавалась максимальная степень сжатия (Ultra).

Результатом теста является время выполнения архивирования при этом чем меньше время, тем, естественно, лучше.

Аудиокодирование

Для кодирования аудиофайлов из формата WAV в формат MP3 применялся популярный кодек Lame 4.0. Кодированию подвергался WAV-файл с исходным размером 195 Мбайт, который конвертировался в MP3-файл размером 17,7 Мбайт. Кодек запускался из командной строки с настройками по умолчанию (44,1 кГц, 128 Кбит/с).

Результатом теста является время конвертирования, выраженное в секундах, и чем оно меньше, тем лучше.

Распознавание текста

Для распознавания текста использовалась программа ABBYY FineReader 8.0 Pro. В качестве документа для распознавания был выбран 49-страничный PDF-файл.

Результатом теста является время распознавания документа, выраженное в секундах, и чем оно меньше, тем лучше.

3D-графика

В группу тестов, выявляющих производительность процессора при работе с 3D-приложениями, вошли SPECapc 3ds max8 v.1.3, SPECapc for Maya 6.5, POV-Ray 3.7 Beta 17, CINEBENCH 9.5 и SPECViewperf 9.0.3.

Тест SPECapc 3ds max8 v.1.3 представляет собой скрипт для приложения Autodesk 3DS max 8.0 SP3 и предназначен для тестирования платформы с приоритетной нагрузкой на процессор и видеокарту. В нем используется как рендеринг конечных 3D-сцен с преимущественной нагрузкой на центральный процессор, так и типичные задачи по созданию и редактированию сцены с преимущественной нагрузкой на процессор видеокарты. Для того чтобы переложить основную нагрузку на процессор и минимизировать влияние видеокарты на конечный результат теста, для приложения SPECapc 3ds max8 v.1.3. применялся программный видеодрайвер (Software).

Измеряемой характеристикой в тесте SPECapc 3ds max8 v.1.3 является время выполнения задач. На основе времени выполнения отдельных задач по созданию и редактированию сцены рассчитывается интегральный показатель производительности видеокарты, нормированный относительно результатов некоторого референсного ПК. Аналогично на основе времени выполнения рендеринга финальных сцен рассчитывается интегральный показатель производительность центрального процессора, который также нормирован относительно результатов некоторого референсного ПК.

Бенчмарк SPECapc for Maya 6.5 предназначен для тестирования платформы в приложении Alias WaveFront Maya 6.5 с нагрузкой на процессор, видеокарту и дисковую подсистему. Тест состоит из 30 подтестов.

Результат теста представляется в виде двух нормированных составляющих: нормированная производительность процессора и интегральная нормированная производительность. При расчете интегральной производительности вводятся весовые коэффициенты: для подтестов с нагрузкой на видеокарту - 0,7; для подтестов с нагрузкой на процессор - 0,2 и для подтестов с нагрузкой на дисковую подсистему - 0,1.

Для расчета нормированных результатов теста используется референсный ПК с процессором Intel Xeon 2,4 ГГц, 2 Гбайт памяти PC800 ECC RDRAM и видеокартой NVIDIA Quadro FX 1000.

Бенчмарк POV-Ray 3.7 Beta 17 предназначен для оценки скорости рендеринга, и основная нагрузка в тесте ложится на процессор. В тесте применяется встроенный бенчмарк, а результатом его является скорость редеринга в PPS (Pixel Per Second).

Тест CINEBENCH 9.5 предназначен для тестирования графических карт и процессоров и позволяет определить скорость редеринга. В нем используется подтест CPU Benchmark, а конечным результатом является скорость рендеринга при применении всех процессоров системы (для многопроцессорных систем), выраженная в безразмерных единицах CINEBENCH.

SPECViewperf 9.0.3 - это тест, предназначенный для определения производительности графической подсистемы в профессиональных OpenGL-приложениях. Он традиционно используется для тестирования графических станций и профессиональных видеокарт, его результаты в немалой степени зависят от производительности процессора.

Результатами теста являются относительные условные единицы (безразмерные), которые определяют, во сколько раз в данном тесте производительность тестируемого ПК выше производительности некоторого эталонного ПК.

Обработка цифровых фотографий

Для оценки производительности процессора при работе с приложениями по редактированию цифровых фотографий применялся скрипт для приложения Adobe Photoshop CS2. В нем на исходное изображение (цифровая фотография) в формате TIFF последовательно накладываются фильтры и рассчитывается суммарное время выполнения всех операций. Результатом теста является время выполнения задачи, выраженное в секундах.

Видеокодирование

Группу тестов для оценки производительности видеокодирования составили популярные программные конверторы и кодеки. Всего использовалось пять приложений: XMPEG 5.0.3, DivX 6.4 Converter, TMPGEnc 2.524, MainConcept MPEG Encoder 1.51 и MainConcept H.264 Encoder v. 2.0.

Утилита XMPEG 5.0.3 применялась в паре с кодеком DivX 6.4.1 Codec. С ее помощью видеоклип длительностью 24 с и размером 51,8 Мбайт в формате MPEG-2 с разрешением 1920x1980 точек и битрейтом 18 000 Кбит/с конвертировался в HD-видеофайл размером 36,5 Мбайт с битрейтом 7800 Кбит/с и разрешением 1920x1088.

Утилита DivX 6.4 Converter использовалась для конвертирования видеоклипа размером 51,8 Мбайт в формате MPEG-2 с разрешением 1920x1980 точек и битрейтом 18 000 Кбит/с в видеофайл DivХ размером 11 Мбайт и разрешением 1280x720. В утилите DivX 6.1.1 Converter применялся профиль High Definition.

Утилита TMPGEnc 2.524 предназначена для конвертирования AVI-файлов в формат MPEG для записи на DVD-диски. В нашем случае исходный AVI-файл размером 416 Мбайт и длительностью 2 мин 1 с преобразовывался в видеофайл в MPEG-2 (m2v+wav) размером 115 Мбайт в формате DVD 4:3 NTSC. Разрешение кадров устанавливалось равным 720x480 точек, битрейт - 8000 Кбит/с, скорость воспроизведения - 29,97 fps.

Утилита MainConcept MPEG Encoder 1.51 тоже предназначена для конвертации AVI-файлов в формат MPEG для записи на DVD-диски. В нашем случае исходный AVI-файл размером 416 Мбайт и длительностью 2 мин 1 с преобразовывался в видеофайл MPEG-2 (mpg) размером 111 Мбайт в формате DVD 4:3 NTSC. Разрешение кадров - 720x480 точек, скорость воспроизведения - 29,97 fps, скорость видеокодирования - 8000 Кбит/с.

С помощью утилиты MainConcept H.264 Encoder v. 2.0 исходный AVI-файл размером 416 Мбайт и длительностью 2 мин 1 при помощи кодека H.264 High преобразовывался в видеофайл MPEG-2 (mpg) размером 295 Мбайт в формате DVD 4:3 NTSC. Разрешение кадров устанавливалось равным 720x480 точек, скорость воспроизведения - 29,97 fps.

Результаты тестирования

Результаты сравнительного тестирования процессоров представлены в табл. 2.

Таблица 2. Результаты сравнительного тестирования процессоров

Intel Core 2 Extreme X8600

Intel Core 2 Extreme QX6700

F.E.A.R. ver 1.07, fps

Quake 4 Demo ver 1.3, fps

Far Cry v.1.33, fps

Prey ver 1.01, fps

Company of Heroes ver 1.0, fps

Half-Life 2, fps

Serious Sam 2 Demo, fps

The Chronics of Riddik, fps

HDR/SM 3.0 Score

SPECViewperf 9.0.3

SPECapc 3ds max8 v.1.3, с

SPECapc Maya 6.5 v1.0

Pov-Ray 3.7 Beta 17 (встроенный тест), PPS

CINEBENCH 9.5 (4 CPU Render)

ABBYY Finereader 8.0 Pro, c

Adobe Photoshop CS2, с

Science Mark 2.0

Molecular Dynamics

Memory Benchmarks

Super_PI/mod 1.5 XS (32 M), c

SunGard Adaptiv Credit Risk, c

Архивирование (7-Zip 4.42), с

Аудиокодирование (Lame 4.0), с

Видеокодирование

DivX Converter 6.4 (High Definition), с

TMPEGEnc 2.524, с

MainConcept H.264 Encoder v.2.0, с

MainConcept MPEG Encoder v.1.51, с

Понятно, что анализ столь большого числа данных провести довольно сложно, поэтому мы решили разбить результаты тестов по логическим группам и вычислить интегральный нормированный показатель производительности по каждой группе тестов. При этом для нормирования результатов использовались результаты процессора Intel Core 2 Extreme X8600, то есть результаты, продемонстрированные данным процессором, принимались за единицу.

Первая логическая группа тестов - это игровые приложения. В данном случае интегральный показатель производительности рассчитывался как среднее геометрическое от нормированных результатов во всех играх (бенчмарк 3DMark06 не учитывался). Тест 3DMark06 мы решили вынести отдельно, поскольку его результат слабо коррелируется с тем, что наблюдается в реальных играх.

Следующую логическую группу составили тесты видеокодирования. В нее вошли XMPEG 5.0.3, DivX Converter 6.4, TMPEGEnc 2.524, MainConcept H.264 Encoder v.2.0 и MainConcept MPEG Encoder v.1.51. Интегральный показатель производительности рассчитывался как среднее геометрическое от нормированных результатов во всех тестах. Остальные тесты мы решили не объединять по логическим группам, что связано с их разнонаправленностью и довольно разными, слабо коррелирующимися друг с другом результатами.

Нормированные результаты в таком упрощенном виде представлены на диаграмме.

Теперь давайте проанализируем полученные данные.

Прежде всего рассмотрим результаты тестирования в играх. Как видите, четырехъядерный процессор не только не имеет преимуществ по сравнению с двухъядерным, но и проигрывает ему по производительности примерно 10%. Поэтому утверждение, что четырехъядерный процессор ориентирован на мощные игровые ПК, - не более чем миф. Сегодня не существует игр, которые могли бы получать преимущество от применения четырехъядерной архитектуры.

Это, конечно, не означает, что они не появятся завтра. Тем не менее для современных игр использование четырехъядерного процессора нецелесообразно.

Результаты же игрового синтетического теста 3DMark06 приводят к совершенно противоположным выводам. Прирост производительности в 3DMark06 CPU Score составил 58%, что очень впечатляет. Правда, его интегральный результат (3DMark Score) более скромный - прирост производительности всего 5%, однако речь все-таки идет о приросте, а не о снижении производительности. Еще раз напомним, что тест 3DMark06 несколько оторван от жизни и делать на основании его результатов выводы о том, что процессор Intel Core 2 Extreme QX6700 имеет преимущество в игровых приложениях, все же было бы неправильно.

Следующий тест - PCMark05. Его результаты опять-таки неоднозначны. В PCMark05 CPU Score процессор Intel Core 2 Extreme QX6700 показал прирост производительности в 56%, однако интегральный результат данного теста (PCMark05 Score) одинаков для обоих процессоров. Дело в том, что увеличение результата PCMark05 CPU Score компенсируется снижением результатов PCMark05 Memory и PCMark05 Graphics. Поэтому если относиться к данному тесту как к комплексному тесту, анализирующему производительность ПК в целом, то нужно отметить, что для набора задач, используемых в тесте PCMark05, система на базе четырехъядерного процессора Intel Core 2 Extreme QX6700 не имеет преимуществ в сравнении с системой на базе процессора Intel Core 2 Extreme X8600.

В тесте CrystalMark 9.0 Intel Core 2 Extreme QX6700 продемонстрировал довольно неплохой прирост производительности. Так, общий результат (Mark) вырос на 26%, а результаты подтестов, ориентированных на загрузку процессора (ALU, FPU), - даже на 77%.

Теперь рассмотрим результаты тестирования с использованием 3D-приложений (SPECapc 3ds max8 v.1.3, SPECapc for Maya 6.5, POV-Ray 3.7 Beta 17, CINEBENCH 9.5 и SPECViewperf 9.0.3).

В тесте SPECapc 3ds max8 v.1.3 в задачах, связанных с рендерингом финальных сцен, процессор Intel Core 2 Extreme QX6700 позволил получить прирост производительности в 46%, что является очень хорошим показателем. В то же время в задачах, касающихся работы в окнах проекций (повороты, трансформация, масштабирование и т.д.), был получен не прирост, а 10-процентный проигрыш в производительности.

В тесте SPECapc for Maya 6.5, где нет рендеринга финальных сцен, мы получили аналогичную картину - падение производительности на 7%.

В тесте POV-Ray 3.7 Beta 17, который определяет исключительно скорость рендеринга, как и ожидалось, процессор Intel Core 2 Extreme QX6700 обеспечил прирост производительности на целых 81%.

Аналогичная картина наблюдалась и в тесте CINEBENCH 9.5, где опять-таки измеряется скорость рендеринга. Четырехъядерный процессор позволил сократить время рендеринга на 48% в сравнении с двухъядерным.

В тесте SPECViewperf 9.0.3 интегральный результат для процессора Intel Core 2 Extreme QX6700, который мы определили как среднее геометрическое от нормированных результатов всех подтестов, на 5% меньше, чем для процессора Intel Core 2 Extreme X8600. Данный тест, конечно, предназначен для тестирования профессиональных видеокарт, но, как мы уже отмечали, его результат зависит в том числе и от процессора, и в данном случае наличие четырехъядерного процессора не способствует увеличению производительности.

В тестах, имитирующих научные расчеты, результаты неоднозначны. В тестах Science Mark 2.0 и Super_PI/mod 1.5 XS Intel Core 2 Extreme QX6700 продемонстрировал снижение производительности на 7 и 3% соответственно. Однако это проблема, скорее, самих тестов, нежели процессора. Дело в том, что данные тесты являются однопоточными и плохо распараллеливаются на несколько ядер. Поэтому ожидать, что многоядерная архитектура позволит получить в них прирост производительности, не приходится.

Тест SunGard Adaptiv Credit Risk - это уже не бесплатная утилита, а серьезное приложение, предназначенное для использования в крупных корпорациях и изначально ориентированное на многопроцессорные серверы. В данном случае процессор Intel Core 2 Extreme QX6700 в полной мере раскрывает свое преимущество - прирост производительности составил 79%!

При работе с приложением Adobe Photoshop CS2 процессор Intel Core 2 Extreme QX6700 позволил получить хоть и не очень большой (всего 16%), но все же прирост производительности. А вот с приложением ABBYY FineReader 8.0 Pro для распознавания текста ситуация обратная. В данном случае использование процессора Intel Core 2 Extreme QX6700 привело к снижению производительности на 5%.

Архивирование данных с помощью архиватора 7-Zip 4.42 также дало незначительное (на 4%) падение производительности при применении четырехъядерного процессора, а в задачах по аудиоконвертированию с использованием кодека Lame 4.0 оно составило уже 9%.

Относительно тестов по архивированию данных и аудиоконвертированию нужно сделать одно замечание. В принципе, даже в этих тестах можно попытаться выявить преимущества многоядерной архитектуры. Для этого нужно запускать одновременно несколько программных сессий. Если, к примеру, нужно конвертировать несколько WAV-файлов, то можно запустить одновременно несколько сессий (это делается путем написания соответствующего BAT-файла) и конвертировать каждый файл с использованием отдельной сессии. Лучше, конечно, найти соответствующую программную оболочку для кодека, которая «умела» бы делать это автоматически. В этом случае четырехъядерный процессор действительно позволит существенно сократить время конвертирования аудиофайлов.

Последняя группа тестов, которую нам осталось рассмотреть, - это приложения для видеокодирования. В данном случае во всех приложениях четырехъядерный процессор продемонстрировал свое преимущество. В зависимости от конкретного приложения и от формата видеоданных прирост производительности составил от 10 до 66%.

Выводы

Итак, какие же выводы можно сделать по результатам проведенного тестирования? Четырехъядерный процессор Intel Core 2 Extreme QX6700 не оправдал наших ожиданий. Но, возможно, все дело в том, что под впечатлением от нового семейства двухъядерных процессоров Intel Core 2 Duo они были очень завышены.

В настоящее время потенциальные возможности, реализованные в процессоре Intel Core 2 Extreme QX6700, просто невозможно раскрыть, поскольку пользовательских приложений, способных получить выигрыш от четырехъядерной архитектуры процессора, сегодня не так много. Исключение составляют задачи по видеокодированию и финальному рендерингу трехмерных сцен, при решении которых в ходе тестирования преимущество четырехъядерного процессора было неоспоримым. Соответственно Intel Core 2 Duo было бы правильно позиционировать как процессор для графических станций и ПК, использующихся преимущественно для обработки видео. В остальных случаях целесообразность применения четырехъядерного процессора весьма сомнительна.

Для домашних же пользователей ПК на базе четырехъядерного процессора - это, скорее, экзотика или, если угодно, один из способов пустить пыль в глаза, но никак не востребованная необходимость.

В большинстве случаев компьютер на базе процессора Intel Core 2 Extreme QX6700 уступает по производительности ПК на базе процессора Intel Core 2 Extreme X8600. Поэтому позиционировать его как процессор для высокопроизводительных домашних ПК пока преждевременно. Конечно, незначительное падение производительности, наблюдаемое в играх и других приложениях, невозможно заметить на глаз. Все равно компьютер на базе процессора Intel Core 2 Extreme QX6700 является высокопроизводительным решением. Вопрос только в том, зачем и кому он нужен, если двухъядерный процессор позволяет получить большую производительность при решении всех задач, за исключением рендеринга и видеокодирования, причем за меньшие деньги и при меньшем энергопотреблении.

Однако компьютер приобретается не на один год, а четырехъядерная архитектура является хорошим заделом на будущее. Процессор Intel Core 2 Extreme QX6700 опередил свое время, но уже завтра ситуация может измениться. Сейчас инфраструктура ПО не готова применять преимущества четырехъядерных процессоров. Но тот факт, что в скором времени все новые приложения будут поддерживать многоядерность, не вызывает сомнений.

Зачастую приходится слышать заявления, что преимуществами многоядерной архитектуры можно воспользоваться уже сегодня - не нужно ждать светлого будущего. Все что для этого надо - привыкнуть к работе в многозадачном режиме, когда на компьютере одновременно выполняется несколько различных приложений, например антивирусное сканирование и аудиокодирование или игра. Отчасти это действительно так, но… лишь отчасти. Если серьезно, то это не более чем маркетинговый миф. Чтобы убедиться в этом, попробуйте запустить задачу конвертирования видеофильма (например, пересжать фильм для PocketPC) и поработать в Microsoft Word или просто разложить пасьянс на компьютере. Интересно, через сколько минут вам это надоест? Между тем заметим, что большинство видеоконверторов под PocketPC (например, Omniquiti Lathe 1.5) являются однопоточными и не способны утилизировать одновременно несколько ядер процессора, то есть одно ядро целиком загружено, а все остальные при этом простаивают. Казалось бы, ничто не мешает при этом возложить на остальные ядра решение других задач. Если бы не одно «но». Дело в том, что в подобного рода сценариях быстродействие системы в целом определяется отнюдь не возможностями процессора - ведь есть еще жесткий диск, память и различные шины с ограниченной пропускной способностью. Велика вероятность того, что два или более одновременно выполняемых приложений начнут конкурировать за одни и те же (отнюдь не процессорные) ресурсы ПК, что не позволит повысить производительность.

Ранее мы пришли к выводу, что эффективность использования четырехъядерного процессора в домашних ПК довольно спорна. Однако мы еще не рассмотрели другой немаловажный аспект - маркетинг, который, как известно, является двигателем прогресса. В конечном счете не важно, плох новый процессор или хорош, - если по маркетинговым соображениям он нужен компании, то непременно будет выпущен.

Однако зачем компания Intel так торопилась выпустить новый, четырехъядерный процессор, если процессоры семейства Intel Core 2 Duo уже стали безусловными лидерами рынка? Вопрос этот отнюдь не банален и довольно сложен. Во-первых, для компании Intel процессор Intel Core 2 Extreme QX6700 - это своего рода побочный продукт производства, не требующий серьезных финансовых затрат: с технологической точки зрения производство двухъядерных процессоров Conroe и четырехъядерных Kentsfield мало чем различается. Различия есть лишь на этапе упаковки, которая производится на специализированных заводах в Малайзии. Но этот процесс компания Intel уже отладила: по технологии упаковки двух двухъядерных кристаллов в один корпус серверные четырехъядерные процессоры Xeon не отличаются от процессоров Intel Core 2 Extreme QX6700.

В самом деле, если производство четырехъядерных процессоров не требует никаких дополнительных финансовых затрат, то почему бы его не начать?

Во-вторых, появление четырехъядерного процессора - это следствие амбициозных планов компании Intel. В очередной раз завоевать звание лидера индустрии, вывести на рынок продукт, которого нет у конкурентов, - это дорогого стоит. А в том, что с технологической точки зрения Intel Core 2 Extreme QX6700 - это действительно огромный шаг вперед, сомневаться не приходится.

Есть, на наш взгляд, и еще одна, третья причина столь поспешного выпуска четырехъядерного процессора. В конкурентной борьбе между Intel и AMD на каждый шаг одной компании другая делает ответный ход. И конечно же, AMD не могла не отреагировать на выпуск четырехъядерного процессора Intel Core 2 Extreme QX6700. Об этом прекрасно знали в компании Intel, как, впрочем, и о том, что отвечать AMD нечем. Что же из этого получилось? Выпуск четырехъядерного процессора Intel Core 2 Extreme QX6700 заставил компанию AMD создать довольно странное и априори провальное решение под кодовым названием AMD 4x4, предполагающее использование двух двухъядерных процессоров вместо одного четырехъядерного. Почему оно странное? На протяжении всего последнего года компания AMD упорно пыталась доказать свое лидерство в области процессоров с низким энергопотреблением. Кроме того, она всегда провозглашала, что повышение тактовой частоты - это не метод для увеличения производительности процессоров. Выпуск решения AMD 4x4 противоречит проводимой компанией политике. Дело в том, что к энергосберегающим платформам оно не имеет никакого отношения, так как потребляет много электроэнергии и требует очень эффективной (а значит, очень шумной) системы охлаждения. Кроме того, новые двухъядерные процессоры AMD (FX-70, FX-72 и FX-74) - это не что иное, как разогнанные варианты старых процессоров в новом корпусе, рассчитанном на разъем Socket F (1207 FX).

Нормированные результаты сравнительного тестирования процессоров

Первые результаты тестирования решения AMD 4x4, которые были получены в американских и европейских тестовых лабораториях, позволяют сделать следующие выводы. По производительности решение AMD 4x4 с двумя двухъядерными процессорами AMD Athlon 64 FX-74 проигрывает решению на базе одного четырехъядерного процессора Intel Core 2 Extreme QX6700 практически во всех тестах. При этом энергопотребление системы AMD 4x4 примерно в два раза выше, к тому же требуется применение мощных (не ниже 600 Вт) блоков питания. Стоимость AMD 4x4 существенно выше, чем у решения на основе процессора Intel Core 2 Extreme QX6700. Таким образом, ответ на вопрос: «А кому это решение нужно?», ясен. Появление четырехъядерного процессора Intel Core 2 Extreme QX6700 вынудило компанию AMD потратить деньги и выпустить на рынок новое семейство парных двухъядерных процессоров, которое обречено на неудачу.

Задача в общем виде

Наши постоянные читатели, быть может, помнят серию статей, которая выходила в 2009 году под общим заголовком «Влияние различных характеристик на быстродействие процессоров современных архитектур ». В ней мы рассматривали некоторое количество сферических процессоров в вакууме, чтобы на основе анализа их быстродействия составить общее впечатление о скорости процессоров реальных и факторах, на неё влияющих. В новом году, после выхода следующей версии методики, мы решили творчески переработать опробованный ранее метод с уклоном в большую реалистичность исследуемых вопросов, то есть моделируя ситуации по возможности реальные. Как и в прошлый раз, начать мы решили с продукции компании AMD, а именно - с самой новой её платформы: Socket AM3. Благо, производитель обещает этой платформе достаточно долгую жизнь, популярность её в пользовательской среде велика, да и название себе компания подобрала более удачное, чем конкурент - с точки зрения сортировки по алфавиту. :)

Нынешняя линейка AMD на первый взгляд кажется несколько хаотичной (мы бы сказали, что и на все последующие тоже…), однако логику производителя понять можно: разумеется, гораздо приятнее бракованный процессор продать, чем выбросить. А т. к. модификаций с различными объёмами и типами кэшей и количеством ядер эта компания выпускает достаточно много, соответственно, есть большой соблазн придумать для экземпляра с «бракованным» ядром или кэшем какое-то название, ядро или часть кэша отключить, а процессор всё-таки продать. :) Благодаря этой замечательной, новаторской политике AMD, в линейке производимых ею AM3-процессоров наблюдается аж три разновидности двухъядерных - с разными объёмами L2-кэша, и даже с наличием L3; две модификации трёхъядерных - с L3 и без него; и снова три модификации четырёхъядерных - с L3 и без него, а также с различными объёмами L3. Кроме того, выпускается для платформы AM3 ещё и одноядерный Sempron. Сведя в одну небольшую таблицу основные технические характеристики CPU для платформы AM3, мы наконец-таки имеем шанс понять, что определённого рода логика в модельном ряде AMD есть:

Sempron Athlon II X2 Phenom II X2 Athlon II X3 Phenom II X3 Athlon II X4 Phenom II X4 Phenom II X6
ядер 1 2 2 3 3 4 4 6
кэш L2, КБ 1024 2×512/1024 2×512 3×512 3×512 4×512 4×512 6×512
кэш L3, КБ 6144 6144 4096/6144 6144

Итак, мы наблюдаем достаточно логичное «путешествие» от 1 ядра к 6, сопровождающееся вариациями на тему объёма L2-кэша, а также наличия или отсутствия L3 и его объёма. При этом объёмом L2 AMD «играется» на относительно слабых процессорах (двухъядерных), а далее в качестве универсального «убыстрятеля всего» используется введение L3. Также можно отметить два одинаково странно смотрящихся процессора: Phenom II X2, который при всего 2 ядрах имеет гигантский L3-кэш, и, наоборот, Athlon II X4 - который при 4 ядрах лишён оного совсем. По идее, первый должен являться идеальным вариантом для старого ПО без многопоточной оптимизации (хотя тогда ему и второе-то ядро не очень нужно…), а второй - процессором для оптимистов, надеющихся на то, что 4-ядерный CPU победит все процессоры с меньшим количеством ядер, невзирая на парусник объём кэша. Так оно будет или не так - посмотрим на результаты…

Соответственно, вырисовываются наиболее интересные сопоставления с точки зрения анализа производительности:

  1. Увеличение количества ядер при одинаковом объёме кэша:
    1. от 1 ядра к 2;
    2. от 2 ядер к 3;
    3. от 3 ядер к 4;
    4. от 4 ядер к 6.
  2. Увеличение количества кэша при одинаковом количестве ядер:
    1. на 2-ядерных процессорах (разные размеры L2, добавление L3);
    2. на 3-ядерных процессорах (добавление L3);
    3. на 4-ядерных процессорах (добавление L3, разные размеры L3).
  3. Вариации на тему «меньше ядер, но больше кэш*»:
    1. 1-ядерный процессор в сравнении с 2-ядерным;
    2. 2-ядерный процессор в сравнении с 3-ядерным.

* - подразумевается: на одиночное ядро.

Как видите, почвы для исследований - поле непаханое. Правда, для того чтобы мы могли зафиксировать своё внимание именно на влиянии вышеперечисленных факторов, убрав все мешающие, нам понадобилось всё-таки сделать один реверанс в сторону «синтетичности» - независимо от того, существует ли такая модель CPU в реальности, все участники тестов работали на одной частоте ядра: 2,6 ГГц. Впрочем, не так уж всё и плохо: Athlon II X3/X4, Phenom II X3/X4 с такой частотой действительно существуют, не бывает только 2600-мегагерцевых Sempron, Athlon/Phenom II X2 и Phenom II X6.Тестирование

Как и было сказано выше, тестирование проводилось в соответствии с новейшей методикой 2010 года , с некоторыми незначительными модификациями:

  1. Поскольку задача перед нами стояла достаточно масштабная и интересная, а все участники тестов вели себя весьма пристойно, и необъяснимых с точки зрения логики странностей практически не демонстрировали, нами было принято волюнтаристское решение все опциональные тесты объявить постоянными - таким образом, они присутствуют в основном разделе, и участвуют на общих основаниях в среднем балле.
  2. Поскольку некоторое количество рассмотренных процессоров являются, так сказать «виртуальными», и в реальности не производятся, для данного цикла, для удобства сравнения, был выбран свой собственный эталонный (100-балльный) процессор из числа принимавших участие именно в этой серии тестов: AMD Phenom II X4 810.

Также некоторым, быть может, покажется неожиданной первая тема, которую мы решили исследовать: очевидно, что в списке вопросов она находится отнюдь не на первом месте, с какого конца ни посмотри. Здесь вам придётся просто простить нам некую хаотичность в последовательности выхода серий: она обуславливается простым «рабочим моментом» - серии будут выходить в той последовательности, в которой будут становиться доступны рассматриваемые в них результаты. К сожалению, обширность нашей методики тестирования обуславливает один её неизбежный недостаток: тесты идут очень долго. Соответственно, если бы мы решили пожертвовать оперативностью ради красоты, первую серию (по логике, начинать следовало бы со сравнений с участием Sempron), вам пришлось бы ждать ещё примерно месяц, в то время как эта готова уже сейчас. Мы решили, наоборот, пожертвовать красотой ради оперативности, и, надеемся, вы нас поймёте. К тому же формат нынешнего тестирования: «одна статья - один ответ на конкретный вопрос», - вполне располагает к такому подходу: ведь нет «важных» и «неважных» вопросов, каждый из них по-своему интересен, и каждый наверняка найдёт своего читателя.

Итак, приступим. В этой серии мы рассмотрим, как и было обещано, один простой и конкретный вопрос : имеет ли 3-ядерный процессор, в котором на каждое ядро приходится по 512 килобайт L2-кэша, преимущество над двухъядерным CPU, в котором на каждое ядро приходится в 2 раза больше L2-кэша - 1024 килобайта? В плюсах у первого - дополнительное ядро. С другой стороны, каждое ядро второго может работать с удвоенным объёмом кэшированных данных. Ситуация, между прочим, вовсе не такая очевидная, как может показаться на первый взгляд…

3D-визуализация

2 ядра + 2×1024 L2 3 ядра + 3×512 L2 %%
79 92
94 91
94 90
98 95
95 90
98 94
Group Score 92 91

Да-да, к вопросу о неочевидности ситуации. Поразительно, но при визуализации трёхмерной картинки, только один пакет из шести смог получить какую-то пользу от дополнительного ядра, а вот 5 остальных на уменьшение объёма L2 отреагировали весьма критически. Разумеется, понятно, с чем это связано: скорее всего, они просто не смогли задействовать третье ядро, и оно простаивало. Что ж - похвалим разработчиков 3ds max за хорошую оптимизацию, но заодно констатируем: они пока в явном меньшинстве.

Рендеринг трёхмерных сцен

2 ядра + 2×1024 L2 3 ядра + 3×512 L2 %%
63 83
51 74
48 71
Group Score 54 76

В этой группе прирост производительности от добавления ещё одного ядра близок к идеальному, но относительно рендеринга данный факт не вызывает никакого удивления: 512 килобайт L2-кэша ядрам вполне хватает, т.к. сцена разбивается на достаточно мелкие параллельно обсчитываемые кусочки.

Научные и инженерные расчёты

2 ядра + 2×1024 L2 3 ядра + 3×512 L2 %%
89 95
96 93
94 91
92 87
98 94
65 73
74 84
Group Score 87 88

Ситуация более сложная: инженерные CAD, судя по всему, оперируют достаточно большими объёмами информации при подсчёте, а вот задействовать третье ядро не умеют (справедливости ради: они и второе зачастую игнорируют…). «Выстрелили» неплохо многопоточно оптимизированные Maya, Mathematica (напомним, что начиная с 2010 года мы используем для этого пакета многопоточно-оптимизированный вариант теста MMA) и MATLAB, за счёт чего общий балл по группе вывел в лидеры 3-ядерный CPU.

Растровая графика

2 ядра + 2×1024 L2 3 ядра + 3×512 L2 %%
101 97
96 97

Corel PhotoImpact

99 98
73 86
Group Score 92 95

Разница в ±1 процент вполне укладывается в погрешность измерений, поэтому нам только остаётся выделить кэшелюбивый ACDSee и хорошо многопоточно оптимизированный Photoshop. И снова за счёт более ощутимого преимущества в хорошо оптимизированном приложении 3-ядерник лидирует в общем балле по группе.

Сжатие данных

Наш тест компиляции (по крайней мере, так должно быть в теории…) сейчас поддерживает до 16 потоков, поэтому выигрыш процессора с бо́льшим количеством ядер не удивляет.

Java

Совсем новая, неизведанная группа тестов, статистики по которой ещё нет, но достаточно банальный результат: два бенчмарка отдали небольшое преимущество третьему ядру, а третий вообще не заметил никакой разницы.

Кодирование аудио

2 ядра + 2×1024 L2 3 ядра + 3×512 L2 %%
50 67
50 66

Monkey’s Audio

50 67
50 67
51 67
50 67
Group Score 50 67

Тесты на скорость кодирования аудио начиная с 2009 года получили прекрасную многопоточную оптимизацию за счёт использование пакета dbPoweramp, который умеет запускать на исполнение столько процессов кодирования, сколько он обнаружит в системе процессоров. В этой ситуации выигрыш 3-ядерника был предрешён.

Кодирование видео

2 ядра + 2×1024 L2 3 ядра + 3×512 L2 %%
77 93

Mainconcept (VC-1)

64 81
49 72
55 76
50 65
72 85
Group Score 61 79

Пакеты для кодирования видео также демонстрируют очень достойную многопроцессорную оптимизацию, в том числе ранее не использовавшиеся нами Adobe Premiere и Sony Vegas. Причём, заметьте: у двух вышеназванных пакетов она одна из лучших в группе.

Воспроизведение видео

2 ядра + 2×1024 L2 3 ядра + 3×512 L2 %%
50 70
104 49
53 75
48 72
Group Score 64 67

Новая группа тестов преподнесла один из немногочисленных сюрпризов, резко негативно отреагировав на 3-ядерник. Забегая вперёд, отметим: похоже, речь идёт именно о реакции на 3 ядра, а не на уменьшение объёма L2, т. к. 4-ядерник настолько большого падения производительности не демонстрирует. Возможно, имеет место феномен категорического «непереваривания» конкретным ПО количества ядер, отличного от степени двойки, мы ранее с таким уже сталкивались.

Виртуальная машина

2 ядра + 2×1024 L2 3 ядра + 3×512 L2 %%
92 97
60 84
84 90

World in Conflict

65 70
Group Score 69 84

Подавляющее большинство игр вполне удачно задействавали третье ядро, только Borderlands, S.T.A.L.K.E.R., Crysis и World in Conflict не испытывают особого оптимизма (менее 10% прибавки). Не то чтобы тенденция была такая уж чёткая (UT3 ей, например, противоречит), но можно заметить, что 3 игры из перечисленных четырех - не очень-то новые.

Общий балл

2 ядра + 2×1024 L2 3 ядра + 3×512 L2 %%
71 80

Общий балл вполне в духе времени: даже с обрезанным кэшем, многоядерность всё равно в фаворе. Впрочем, не без пикантных подробностей: 16 тестов из 57 предпочли процессор с меньшим количеством ядер, но большим объёмом L2 на ядре. Есть искушение объявить данный факт происками ретроградов и леностью программистов, недостаточно хорошо умеющих задействовать ресурсы современных процессоров… и, наверное, так оно и есть. Всё-таки для нормальной поддержки многоядерности нужно проделать определённую работу (иногда немаленькую), а большой L2 иногда вызывает повышение производительности «сам по себе», без дополнительных усилий программиста. В таком случае, закончить следует на оптимистической ноте: судя по общему баллу, ленивцев среди разработчиков ПО становится всё меньше. Что же касается практических рекомендаций, то они очевидны: в целом, в случае с Athlon II, 3 ядра всё-таки однозначно лучше, чем 2.