Домой / Осваиваем ПК / Радион 480. Видеокарты. Новые возможности по выводу изображения

Радион 480. Видеокарты. Новые возможности по выводу изображения

Новый середнячок, догоняющий топовые ускорители предыдущего поколения

  • Часть 2 - Практическое знакомство

Представляем базовый детальный материал с исследованием AMD Radeon RX 480.

Объект исследования : Ускоритель трехмерной графики (видеокарта) AMD Radeon RX 480 8 ГБ 256-битной GDDR5 PCI-E

Сведения о разработчике : Компания ATI Technologies (торговая марка ATI) основана в 1985 году в Канаде как Array Technology Inc. В том же году была переименована в ATI Technologies. Штаб-квартира в г. Маркхам (Торонто). C 1987 года компания сконцентрировалась на выпуске графических решений для ПК. Начиная с 2000 года основным брендом графических решений ATI становится Radeon, под которым выпускаются GPU как для настольных ПК, так и для ноутбуков. В 2006 году компанию ATI Technologies покупает компания AMD, в которой образуется подразделение AMD Graphics Products Group (AMD GPG). C 2010 года AMD отказывается от бренда ATI, оставив лишь Radeon. Штаб-квартира AMD в Саннивейл (Калифорния), а у AMD GPG остается главным офисом бывший офис AMD в Маркхаме (Канада). Своего производства нет. Общая численность сотрудников AMD GPG (включая региональные офисы) около 2000 человек.

Часть 1: Теория и архитектура

В своих прошлых статьях мы неоднократно сетовали на застой в области графических процессоров, связанный с задержками производства GPU по новым технологическим процессам и фактическим пропуском одного из них - 20 нм техпроцесса, который оказался непригодным для массового выпуска сложных видеочипов. На протяжении долгих пяти (!) лет обе компании, являющиеся производителями GPU, выпускали решения на основе уже весьма старого 28 нм техпроцесса.

Производители микроэлектронных чипов смогли наладить массовое производство с применением новых FinFET-техпроцессов (14 и 16 нм, в зависимости от производителя) таких сложных и крупных чипов лишь ближе к середине года. Не так давно «отстрелялась» компания Nvidia, выпустившая довольно дорогие видеокарты, предназначенные для верхней части их линейки, а теперь настало время компании AMD, которая пошла своим путем, выпустив сначала не самые дорогие видеокарты, примерно аналогичные моделям Radeon HD 4850 и HD 4870, ставшими достаточно популярными в свое время.

Чтобы лучше понять ход мысли представителей AMD, отличающийся от такового у их конкурентов, давайте рассмотрим их представления о наиболее востребованных на рынке видеокартах. По данным AMD, довольно малая доля игроков на ПК покупает дорогие видеокарты, обеспечивающие комфорт при высоких разрешениях и максимальных настройках, а большинство из них использует сильно устаревшие GPU. 84% игроков покупают видеокарты по цене от $100 до $300 по данным AMD, и лишь остальные игроки выбирают то, что дороже.

Понятно, что большинство не сможет даже попробовать столь популярную сейчас тему виртуальной реальности при таковом желании, ведь VR требует очень приличных вычислительных мощностей. Кроме этого, по мнению AMD, не все пользователи желают вкладываться в то оборудование, что устареет уже через пару лет. Правда, вряд ли все они кинутся покупать VR-шлемы... С другой стороны, с устаревшими видеокартами у них и возможности то опробовать виртуальную реальность не появится. Всего 13 миллионов ПК по всему миру имеют достаточно мощную конфигурацию для запуска VR-приложений - это всего 1% из почти полутора миллиардов компьютеров, имеющихся у пользователей на руках.

По данным опросов, приводимых AMD, две трети пользователей не планируют приобрести оборудование для VR именно из-за дороговизны такой конфигурации. Это в дополнение к вполне разумным доводам вроде тех, что шлемы пока что слишком громоздкие и с мешающими проводами, а виртуальная реальность в принципе применима лишь к малой части игровых применений. Все же, самой важной преградой для распространения VR является цена оборудования. И AMD считает для себя перспективной возможность обеспечить миллионы ПК графическими процессорами необходимой мощности в следующие несколько лет. Правда, остается непонятным, почему AMD считает недоступным компонентом именно видеокарту, если VR-шлем и контроллеры сами по себе стоят дороже? Впрочем, порог входа в VR они действительно могут немного снизить, предложив решения достаточной производительности за сравнительно малые деньги.

И AMD продвигает свои новые решения во многом именно как производительные и энергоэффективные видеокарты, призванные «демократизировать» довольно дорогую виртуальную реальность, обеспечив желающих достаточной мощью GPU. А еще одной целью новых графических решений компании являются как компактные ПК со сверхнизким потреблением энергии, так и игровые ноутбуки, для которых сейчас можно легко обеспечить мощность, аналогичную или даже превосходящую возможности игровых консолей. К примеру, младший чип Polaris имеет не только низкое энергопотребление, но и специально предназначен для компактных ноутбуков - общая высота упаковки этого GPU составляет всего 1,5 мм по сравнению с 1,9 мм у Bonaire, что поможет AMD выиграть конкурсы на поставку решений для мобильных ПК.

Для четкого попадания в такие требования, в AMD решили спроектировать две модели графических процессоров: Polaris 10 и Polaris 11, соответствующие определенным уровням возможностей и производительности. Старший чип серии Polaris обеспечит ПК-игроков достаточной мощностью для VR-приложений и всех современных игр, а менее производительный младший GPU предназначен для тонких и легких ноутбуков, но предлагает возможности и производительность, превосходящие параметры игровых приставок.

Соответственно, на момент анонса, AMD предлагает следующие решения для настольных компьютеров:
Radeon RX 460 - энергоэффективная видеокарта с низким потреблением энергии для нетребовательных игр и будущих мобильных решений, с мощностью в более чем 2 терафлопа, имеющая 2 ГБ видеопамяти, соединенной по 128-битной шине;
Radeon RX 470 - весьма выгодная видеокарта среднего уровня за приемлемую цену, обладающая достаточной мощностью для игр в Full HD-разрешении, с мощностью более чем 4 терафлопа, 4 ГБ видеопамяти и 256-битной шиной;
Radeon RX 480 - пока что самое производительное решение нового семейства, предназначенное для VR и современных игр с производительностью более чем 5 терафлопа, 4 или 8 гигабайтами памяти с 256-битной шиной, потребляющее менее чем 150 Вт.

Сегодня мы рассмотрим как раз модель Radeon RX 480, которая предлагает премиальные возможности для игроков - Premium HD Gaming. Что это за термин в понимании AMD? Сюда включены как возможности новых графических API, вроде асинхронного исполнения в DirectX 12, так и технологии FreeSync и CrossFire. Но главное - преимущество над аналогичными по цене решениями конкурента, в современных играх с поддержкой DirectX 12:

В большинстве игр текущего года с поддержкой DirectX 12 (Ashes of the Singularity, Hitman, Total War: Warhammer, Quantum Break, Gears of War и Forza APEX) даже видеокарты предыдущего поколения AMD Radeon зачастую превосходят аналоги по цене у Nvidia: мы отмечали преимущество Fury X против 980 Ti, R9 390 против GTX 970 и R9 380 против GTX 960, а уж свежая модель на базе Polaris 10 просто обязана выступить еще лучше.

Кроме DirectX 12 можно отметить и еще один API - Vulkan. В соответствующей версии игры Doom компания AMD заявляет прирост до 45% на Radeon RX 480 по сравнению с OpenGL-версией игры, хотя на старых видеокартах разница ожидается несколько меньше - порядка 20-25%.

А что с виртуальной реальностью, действительно ли новинка AMD способна на достаточную производительность для VR-приложений? Благодаря высокой мощности GPU и поддержке таких возможностей как Asynchronos Time Warp, обеспечивается комфортный просмотр соответствующих VR-приложений, да еще при невысоком потреблении энергии. Так, общепринятый тест для оценки производительности SteamVR Performance Test показывает явное превосходство над решениями предыдущего поколения (непонятно, правда, почему сравнивали именно с Radeon R9 380?):

Так как основой модели Radeon RX 480 является графический процессор Polaris 10, имеющий архитектуру GCN четвертого поколения, которая во многих деталях схожа с ранее вышедшими решениями компании AMD, то перед прочтением теоретической части статьи будет полезно ознакомиться и с нашими предыдущими материалами по прошлым видеокартам компании, основанным на архитектуре GCN предыдущих поколений:

  • AMD Radeon R9 Fury X: Новый флагман AMD с поддержкой HBM
  • AMD Radeon R9 285: Tahiti получил шину 256 бит и превратился в Tonga
  • AMD Radeon R9 290X: Дотянись до Гавайев! Получишь новые вершины скорости и функциональности
  • AMD Radeon HD 7970: Новый однопроцессорный лидер 3D-графики

Рассмотрим подробные характеристики видеоплаты Radeon RX 480, основанной на полной версии графического процессора нового поколения Polaris 10.

Графический ускоритель Radeon RX 480
Параметр Значение
Кодовое имя чипа Polaris 10 XT (Ellesmere)
Технология производства 14 нм FinFET
Количество транзисторов 5,7 млрд.
Площадь ядра 232 мм²
Архитектура Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_0
Шина памяти 256-битная: восемь независимых 32-битных контроллеров памяти с поддержкой GDDR5-памяти
Частота графического процессора 1120 (1266) МГц
Вычислительные блоки 36 вычислительных блоков GCN, включающих 144 SIMD-ядер, состоящих в целом из 2304 ALU для расчетов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP16, FP32 и FP64)
Блоки текстурирования 144 текстурных блока, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растеризации (ROP) 32 блока ROP с поддержкой режимов сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт, а в режиме без цвета (Z only) - 128 отсчетов за такт
Поддержка мониторов Интегрированная поддержка до шести мониторов, подключенных по интерфейсам DVI, HDMI 2.0b и DisplayPort 1.3/1.4 Ready

Спецификации референсной видеокарты Radeon RX 480
Параметр Значение
Частота ядра 1120 (1266) МГц
Количество универсальных процессоров 2304
Количество текстурных блоков 144
Количество блоков блендинга 32
Эффективная частота памяти 7000-8000 (4×1750-2000) МГц
Тип памяти GDDR5
Шина памяти 256-бит
Объем памяти 4/8 ГБ
Пропускная способность памяти 224-256 ГБ/с
Вычислительная производительность (FP32) до 5,8 терафлопс
Теоретическая максимальная скорость закраски 41 гигапиксел/с
Теоретическая скорость выборки текстур 182 гигатекселя/с
Шина PCI Express 3.0
Разъемы Один разъем HDMI и три DisplayPort
Энергопотребление до 150 Вт
Дополнительное питание Один 6-контактный разъем
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $199/$229 (для рынка США)

Название выпущенной сегодня модели видеокарты компании AMD вполне соответствует их текущей системе наименований. Ее имя отличается от предшественников измененным символом в первой части индекса и цифрой поколения - RX 480. Если со вторым изменением все понятно, ведь поколение действительно новое, то замена R9 на RX не совсем логична, на наш взгляд, ведь эта цифра раньше показывала уровень видеокарты: R7 были медленнее, чем R9, но все они выпускались в рамках одного поколения. А теперь непонятно, во-первых, почему у RX 480 эта цифра больше, чем у R9 390X, к примеру, и какие цифры после R в имени будут у младших решений, основанных на новых GPU.

Первая модель в новом семействе Radeon 400 становится в текущей линейке компании на место предыдущих решений, аналогичных по позиционированию, замещая их на рынке. Так как выпущенная видеокарта относится скорее к среднему уровню по цене и скорости с учетом нового поколения, то для будущих решений на GPU еще большей мощности решили оставить индекс 490.

Референсный вариант Radeon RX 480 будет предлагаться по рекомендованной цене в $199 в случае 4 ГБ варианта и $229 для 8-гигабайтной модели, и эти цены ну очень привлекательны! По сравнению с топовыми видеокартами предыдущего поколения, это очень хороший ценник, так как Radeon RX 480 по скорости не должна уступать таким моделям, как Radeon R9 390 и GeForce GTX 970. Именно с ними и будет конкурировать новинка, по крайней мере, в начале своего жизненного пути, до выхода планируемой к скорому выпуску GeForce GTX 1060. Но на момент своего выхода, сегодняшняя новинка абсолютно точно становится лучшим предложением по производительности в своем классе.

Референсные видеокарты Radeon RX 480 будут поставляться в версиях с 4 ГБ памяти GDDR5 с эффективной частотой в 7 ГГц, и с 8 ГБ памяти с частотой в 8 ГГц. Но по мере поступления в продажу видеокарт собственного производства партнеров AMD, появятся и другие варианты, но все они будут оснащены GDDR5-памятью с частотой как минимум 7 ГГц - такова воля AMD.

Решение по установке 4 и 8 ГБ памяти очень мудрое. Младший вариант позволит немного сэкономить, ведь 4 ГБ на данный момент можно считать «золотой серединой», а преимущество от 8 ГБ памяти у второго варианта Radeon RX 480 раскроется в перспективе. Хотя и 4-гигабайтный вариант видеокарты обеспечит приемлемую производительность в современных играх, но 8 ГБ памяти позволят иметь приличный запас на будущее, так как требования к объему видеопамяти у игр постоянно растут. В качестве примера, преимущество в котором уже заметно, можно привести игру Rise of the Tomb Raider в DirectX 12-версии, при очень высоких настройках и разрешении 2560x1440 пикселей:

Больший объем видеопамяти у Radeon RX 480 8 ГБ и Radeon R9 390 помогает избежать крайне неприятных падений производительности и рывков FPS, по сравнению с 4-гигабайтными вариантами, включая решения конкурентов GeForce GTX 970 и GTX 960. Именно Radeon RX 480 8 ГБ дает возможность получения плавного игрового процесса с отсутствием притормаживаний, связанных с подгрузкой данных, не помещающихся в локальную видеопамять. И так как игровые консоли нынешнего поколения имеют по 8 ГБ общей памяти, то преимущество от большего объема памяти будет только расти со временем, и 8-гигабайтный вариант Radeon RX 480 отлично подойдет для игр, который будут выходить в следующие несколько лет.

Для дополнительного питания платой используется один 6-контактный разъем, а значение типичного энергопотребления у модели Radeon RX 480 на графическом процессоре Polaris 10 установлено на уровне 150 Вт. В реальности без разгона плата потребляет даже еще меньше, порядка 120 Вт энергии, но небольшой запас по питанию позволит улучшить оверклокерский потенциал. К слову, партнерами AMD планируется скорый выход фабрично разогнанных версий этой видеокарты, отличающихся и системами охлаждения и питания.

Архитектурные особенности

Графический процессор Polaris 10 относится к четвертому поколению архитектуры Graphics Core Next, самому совершенному на данный момент. Базовым блоком архитектуры является вычислительный блок Compute Unit (CU), из которых собраны все графические процессоры AMD. Вычислительный блок CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память первого уровня с возможностью чтения и записи и полноценный текстурный конвейер с блоками выборки и фильтрации, он разделен на подразделы, каждый из которых работает над своим потоком команд. Каждый из таких блоков занимается планированием и распределением работы самостоятельно.

В своей основе, архитектура Polaris изменилась не слишком сильно, хотя не основные блоки видеочипа изменились заметнее - были серьезно улучшены блоки кодирования и декодирования видеоданных и вывода информации на устройства отображения. В остальном, это очередное поколение известной архитектуры Graphics Core Next (GCN), уже четвертое по счету. Пока что в состав семейства вошли два чипа: Polaris 10 (ранее известный как Ellesmere) и Polaris 11 (ранее известный как Baffin).

И все же некоторые аппаратные изменения в GPU были внесены. В список улучшений и изменений входит: улучшенная обработка геометрии, поддержка нескольких проекций при рендеринге VR с разным разрешением, обновленный контроллер памяти с улучшенным сжатием данных, модифицированная предвыборка инструкций и улучшенная буферизация, планирование и приоритезация вычислительных задач в асинхронном режиме, поддержка операций над данными в формате FP16/Int16. Рассмотрим схему нового графического процессора (по клику на изображении доступна увеличенная версия иллюстрации):

В состав полноценного графического процессора Polaris 10 входит один командный процессор Graphics Command Processor, четыре асинхронных вычислительных движка Asynchronous Compute Engines (ACE), два планировщика задач Hardware Scheduler (HWS), 36 вычислительных блоков Compute Unit (CU), четыре геометрических процессора, 144 текстурных модуля TMU (включающих по четыре блока загрузки и сохранения данных LSU на каждый TMU) и 32 блоков ROP. Подсистема памяти нового графического процессора компании AMD включает восемь 32-битных контроллеров GDDR5-памяти, дающих общую 256-битную шину памяти, и кэш-память второго уровня объемом в 2 МБ.

Заявлено улучшение геометрических движков в Polaris - в частности, появился так называемый ускоритель отбрасывания геометрических примитивов Primitive Discard Accelerator, который работает в самом начале графического конвейера, отбрасывая невидимые треугольники (например, с нулевой площадью). Также в новом GPU был введен новый индексный кэш для дублированной (instanced) геометрии, который оптимизирует перемещения данных и освобождает ресурсы внутренних шин передачи данных и увеличивает эффективность использования ПСП при дублировании геометрии (instancing).

Ускоритель отбрасывания геометрических примитивов помогает увеличить скорость обработки геометрии, особенно в задачах вроде тесселяции с мультисэмплингом. На диаграмме видно, что в разных условиях новый блок позволяет увеличить производительность до трех раз. Впрочем, это синтетические данные заинтересованной стороны, лучше смотреть по игровым результатам независимых тестов.

Также в четвертом поколении GCN была улучшена эффективность исполнения шейдеров - введена предвыборка инструкций, улучшающая кэширование инструкций, снижающая простои конвейера и увеличивающая общую вычислительную эффективность. Еще был увеличен размер буфера инструкций для массива инструкций (wavefront), увеличивающий однопоточную производительность, введена поддержка операций над данными в форматах FP16 и Int16, помогающая снизить нагрузку на память, повысить скорость вычислений и улучшить энергоэффективность. Последнюю возможность можно применять в широком круге задач графики, машинного зрения и обучения.

В очередной раз был улучшен и планировщик заданий hardware scheduler (HWS), использующийся при асинхронных вычислениях. В его задачи входит: разгрузка CPU от задач планирования, приоритезация задач реального времени (виртуальная реальность или обработка звука), параллельное выполнение задач и процессов, менеджмент ресурсов, координация и балансирование загрузки исполнительных блоков. Функциональность этих блоков можно обновить при помощи микрокода.

Кроме того, что объем кэш-памяти второго уровня был увеличен вдвое до 2 МБ, была изменена обработка и кэширование данных в L2-кэше и увеличена общая эффективность работы подсистемы кэш-памяти и локальной видеопамяти. Контроллер памяти получил поддержку GDDR5-памяти с эффективной тактовой частотой до 8 ГГц, что в случае Polaris означает пропускную способность шины памяти до 256 ГБ/с. Но и на этом в AMD не остановились, дополнительно улучшив алгоритмы сжатия данных без потерь (Delta Color Compression - DCC), которым поддерживаются режимы сжатия с соотношением 2:1, 4:1 и 8:1.

Внутричиповое сжатие данных увеличивает общую эффективность работы, обеспечивает более полное использование шины данных и сказывается на энергоэффективности. В частности, если в Radeon R9 290X внутреннего сжатия информации не было и эффективная ПСП равна его физической ПСП, то в случае решения на чипе Fiji сжатие позволило сэкономить почти 20% ПСП, а в случае Polaris и до 35-40%.

Если сравнивать Radeon RX 480 с Radeon R9 290, то новое решение потребляет заметно меньше энергии для обеспечения той же эффективной пропускной способности, по сравнению с видеокартой предыдущего поколения. В результате, у новинки заметно выше и производительность в пересчете на бит - хотя у Radeon R9 290 выше пиковая ПСП, но она куда энергоэффективнее используется в Polaris 10 - общее потребление энергии интерфейсом памяти составляет 58% от потребления старого GPU.

В целом, изменения четвертого поколения GCN в графическом процессоре Polaris связаны с применением продвинутого технологического процесса 14 нм FinFET, микроархитектурными изменениями, оптимизациями физического дизайна и техник управления питанием. Все это принесло свои плоды в виде значительного прироста производительности и эффективности, по сравнению с предыдущими решениями. Если брать самый низкий уровень, то вычислительные блоки CU в Polaris 10 (Radeon RX 480) примерно на 15% производительнее блоков чипа Hawaii (Radeon R9 290).

Сложно судить, насколько велик вклад той или иной оптимизации в общий прирост скорости, но если брать все оптимизации в комплексе, то разница в энергоэффективности между Radeon RX 470 и Radeon R9 270X, по оценке специалистов компании AMD, достигает 2,8-кратной. Причем, они оценивают вклад FinFET-техпроцесса меньше вклада своих оптимизаций. Вероятно, было выбрано самое выгодное сравнение, а для других моделей прирост по энергоэффективности несколько меньше. Например, если сравнить показатели RX 480 и R9 290, то разница по энергоэффективности будет ближе к двукратной. В любом случае, такие огромные приросты бывают раз в несколько лет, и уже поэтому у нас нет никаких сомнений в том, что продажи Radeon RX 480 будут успешными.

Технологический процесс и его оптимизация

Как мы уже говорили, главное в Polaris - это не изменения в аппаратных блоках, а большой шаг вперед из-за применения в производстве этого GPU нового техпроцесса 14 нм с использованием транзисторов с вертикально расположенным затвором (FinFET - Fin Field Effect Transistor), также известных как транзисторы с трехмерной структурой затвора или 3D-транзисторы.

Динамическое энергопотребление растет линейно с ростом количества вычислительных блоков, и кубически при повышении частоты при помощи повышения напряжения (так, прирост частоты и напряжения на 15% увеличивает потребление более чем наполовину!), и в результате графические процессоры зачастую работают на более низких тактовых частотах, зато используют чипы большей плотности, чтобы поместить в них большее количество вычислительных устройств, которые работают параллельно.

Последние пять лет графические процессоры выпускались при помощи 28 нм техпроцессов, а промежуточный 20 нм не дал требуемых параметров. Освоения еще более совершенных техпроцессов пришлось ждать довольно долго, и вот, для производства графических процессоров семейства Polaris, компания AMD выбрала производства компаний Samsung Electronics и GlobalFoundries с их 14 нм FinFET-техпроцессом, который обеспечивает производство одних из самых плотных микропроцессоров. Применение FinFET-транзисторов имеет решающее значение для снижения энергопотребления и снижения напряжения GPU примерно на 150 мВ, по сравнению с предыдущим поколением, сокращая мощность на треть.

На иллюстрации схематично показано условное изменение размеров одного и того же GPU, произведенного с применением различных техпроцессов. Компании Samsung Electronics и GlobalFoundries разделяют заказы на выпуск 14 нм центральных и графических процессоров компании AMD, так как техпроцесс у них одинаковый и наладить одновременное производство несложно, разделяя между ними заказы исходя из выхода годных чипов и других параметров, что должно позволить решить потенциальные проблемы с недостаточными объемами производства.

Архитектура Polaris изначально разрабатывалась под возможности FinFET-техпроцессов, и должна использовать все их возможности. Если описывать вкратце, то FinFET-транзистор - это транзистор с каналом, окруженным затвором через прослойку в виде изолятора с трех сторон - по сравнению с планарным, где поверхность сопряжения - это одна плоскость. FinFET-транзисторы имеют более сложное устройство, и трудностей при реализации новой технологии было предостаточно, для освоения соответствующих техпроцессов потребовалось пять лет.

Зато новая форма транзисторов обеспечивает больший выход годных, меньшие утечки и заметно лучшую энергоэффективность, что является основной задачей современной микроэлектроники. Количество транзисторов в графических процессорах на квадратный миллиметр площади удваивалось примерно каждые два года, вместе с этим удвоились и статические утечки (static leakage). Для решения части этих проблем использовались специальные средства, вроде островков из транзисторов с разным напряжением питания и схем управления тактовыми сигналами (clock gating), которые помогали снизить токи утечек в режимах простоя или сна. Но эти техники не помогают при активных состояниях работы и способны снизить максимальную производительность.

В FinFET-процессах многие проблемы решены, что позволяет добиться революционного улучшения в производительности и потреблении энергии, по сравнению с предыдущими чипами, произведенными при помощи традиционных технологий. Новые техпроцессы позволяют не просто повысить производительность, но и снизить вариативность характеристик (разницу в характеристиках всех произведенных чипов одной модели) - сравните разброс параметров для FinFET-техпроцесса 14 нм и привычного 28 нм у TSMC:

На этой диаграмме видны как большая средняя производительность для FinFET-продуктов, так и меньшие утечки в среднем, и меньший разброс в показателях производительности и величине утечек для разных образцов. Улучшение вариативности этих характеристик для GPU в случае FinFET означает, что можно повысить итоговую частоту для всех продуктов, в то время как для планарных транзисторов приходилось обращать большее внимание на худшие показатели и снижать референсные характеристики для всех конечных продуктов.

В итоге графические процессоры, произведенные при помощи техпроцессов с применением FinFET-транзисторов, обеспечивают фундаментальный рост характеристик производительности и энергоэффективности, по сравнению с аналогами, в производстве которых были использованы традиционные планарные транзисторы. По оценке специалистов AMD, применение FinFET-техпроцессов позволяет обеспечить или на 50-60% меньшее потребление энергии, или на 20-35% большую производительность при прочих равных.

Новые техпроцессы с применением FinFET-транзисторов помогают не только снизить потребление энергии и значительно улучшить энергоэффективность, но и открыть новые форм-факторы и форматы для применения будущих графических процессоров. Так, в будущем возможно появление относительно тонких и легких игровых ноутбуков, которые не будут требовать значительного снижения настроек качества 3D-графики, достаточно мощных настольных ПК ультракомпактного размера, ну а привычные игровые видеокарты смогут обходиться меньшим количеством разъемов питания.

Но для того, чтобы добиться большей энергоэффективности, недостаточно просто перевести чип на более «тонкий» техпроцесс, требуются многочисленные изменения в его дизайн. К примеру, в Polaris применяется адаптивное тактирование GPU. Графические процессоры работают при низком напряжении и высокой силе тока, и поставлять качественное напряжение от схем питания довольно сложно. Разброс в напряжении может достигать 10-15% от номинального значения, и среднее напряжение приходится повышать для того, чтобы перекрыть эту разницу, и на это тратится впустую куча энергии.

Адаптивное тактирование в решениях AMD восстанавливает эти потери со снижением энергозатрат на четверть. Для этого, в дополнение к уже существующим сенсорам энергопотребления и температуры добавляется еще и сенсор частоты. В результате работы алгоритма достигается максимальная энергоэффективность для всего чипа.

Также производится калибровка блока питания при загрузке системы. При испытаниях процессора запускается специальный код для анализа напряжения, и интегрированными мониторами питания записывается значение напряжение. Затем при загрузке ПК запускается тот же код и замеряется полученное напряжение, и регуляторы напряжения на плате устанавливают такое же напряжение, какое было при тестировании. Это исключает затраты энергии, которая расходуется из-за разницы в системах.

Есть в Polaris и адаптивная компенсация старения транзисторов - обычно графические процессоры требуют запаса тактовой частоты порядка 2-3% для приспособления к старению транзисторов чипа, да и другие компоненты также демонстрируют старение (например, GPU получает более низкое напряжение от системы). Современные решения AMD умеют делать самостоятельную калибровку и адаптироваться к изменяющимся условиям со временем, что обеспечивает надежную работу видеокарты в течение продолжительного времени и немного повышенную производительность.

Radeon WattMan - новые возможности разгона и мониторинга

Важной составляющей любого современного видеодрайвера являются настройки для разгона, позволяющие выжать из GPU все его возможности. Ранее этим заведовал раздел AMD Overdrive в драйверах решений этой компании, а вместе с выходом новых решений в AMD решили кардинально обновить и этот раздел драйвера, назвав его Radeon WattMan.

Radeon WattMan - это новая утилита AMD для разгона, позволяющая изменять напряжение GPU, частоту графического процессора и видеопамяти, скорость вращения вентилятора системы охлаждения и целевую температуру. Radeon WattMan основан на возможностях, виденных ранее в Radeon Software, но предлагает несколько новых функций по тонкому разгону - с иными возможностями по управлению напряжением и частотой GPU. Также в WattMan появился удобный мониторинг активности GPU, тактовых частот, температур и скорости вентилятора.

Удобно сделано то, что как и в других настройках Radeon Software Crimson Edition, можно задать собственный профиль разгона для каждого приложения или игры, который будет применен при их запуске. А после завершения работы приложения, настройки вернутся к глобальным по умолчанию. Radeon WattMan можно найти в Radeon Settings, он заместил текущую панель AMD OverDrive, и совместим с серией AMD Radeon RX 400.

Возможно как простое управление частотой GPU, так и тонкая настройка кривой частот. Простая настройка частоты работает по умолчанию и позволяет изменять заданные инженерами AMD значения, оптимальные для каждого состояния GPU. Изменение кривой частоты возможно с точностью в 0,5%. Есть и динамическое изменение кривой частоты, когда тактовая частота ядра GPU и видеопамяти может изменяться для каждого состояния вместе с изменением напряжения для каждого из них. Напряжения для GPU и памяти устанавливаются независимо друг от друга.

Есть в WattMan и продвинутое управление скоростью вращения вентилятора в системе охлаждения, когда устанавливается минимальная скорость, целевая скорость и минимальный акустический предел. При этом целевая скорость вращения - это максимум, при котором будет вращаться вентилятор при температуре не выше целевой. Улучшенное управление температурой позволяет выставить максимальное и целевое значения температуры. Вместе с пределом потребления энергии, это позволяет выставить более тонкие настройки.

Максимальная температура - это абсолютный максимум, при котором частота графического чипа не снижается, но после ее достижения, частота начнет снижаться. А целевая температура - значение, по достижению которого будет расти скорость вращения вентилятора. Предельное значение питания для GPU можно повысить или понизить в пределах до 50% (в случае модели Radeon RX 480).

Кажется, мы где-то уже видели возможность тонкого изменения кривой частот и напряжений, причем совсем недавно, правда? Но чего мы еще точно не видели, так это удобного интерфейса мониторинга и настроек в самих драйверах, а не сторонних утилитах, и AMD можно лишь похвалить за такую заботу о пользователях.

Новый интерфейс мониторинга позволяет записывать и просматривать активность графического процессора, его температуру, скорость вентилятора и частоты. Причем, есть как глобальный мониторинг (Global WattMan), так и отдельный мониторинг для пользовательских профилей, который мониторит пиковые и средние данные только когда приложение открыто. Данные собираются и в фоновом режиме, утилите Radeon Settings не обязательно быть запущенной, данные собираются максимум до 20 минут работы приложения.

В целом, AMD есть еще над чем работать для улучшения удобства интерфейса WattMan, так как он не предназначен для управления с клавиатуры, например, но саму по себе инициативу можно лишь приветствовать - удобные инструменты настройки и мониторинга прямо в драйверах могут стать дополнительным плюсом новых решений семейства Radeon RX 400.

Новые возможности по выводу изображения

Мы уже рассказывали ранее о том, что новые решения компании AMD будут отличаться поддержкой самых последних стандартов DisplayPort и HDMI. Новые видеокарты семейства Radeon RX стали одними из первых решений с поддержкой DisplayPort 1.3 HBR3 и DisplayPort 1.4-HDR. Новые версии этого стандарта используют существующие кабели и разъемы, но могут накладываться дополнительные ограничения на их длину.

Главным преимуществом стандарта DisplayPort 1.3 HBR3 является увеличение пропускной способности до 32,4 Гбит/с (на 80% больше, чем у HDMI 2.0b), что отодвигает предел по пропускной способности, имеющийся в предыдущем поколении DisplayPort 1.2. Новый стандарт позволяет подключать 5K-мониторы в RGB-формате при 60 Гц, используя единственный кабель (сейчас приходится подключать пару разъемов и кабелей), а также UHDTV-телевизоры с разрешением 8K (7680×4320), используя цветовую субдискретизацию 4:2:0 при 60 Гц. Также по DisplayPort 1.3 можно подключать и стереодисплеи с 120 Гц и 4K-разрешением. Появление 5K-дисплеев, рассчитанных на один кабель, и 4K-дисплеев с поддержкой HDR, ожидается ближе к концу этого года.

Также Polaris готов к внедрению стандарта DisplayPort 1.4-HDR, поддерживающего вывод изображения с глубиной цвета до 10-bit в разрешении 4K и с частотой обновления до 96 Гц. Новинкой компании поддерживаются Рекомендации ITU Rec.2020 по цветовому пространству для UHDTV, а также стандарты CTA-861.3 и SMPTE 2084 EOTF для передачи HDR-данных.

Новый стандарт DisplayPort 1.3 будет полезен и для продвижения технологии FreeSync для 4K-мониторов. Компания AMD ожидает появления первых таких устройств с поддержкой технологии динамического обновления до 120 Гц к концу 2016 года. Такие мониторы будут способны работать в 4K-разрешении с применением технологий FreeSync при 30-120 FPS и будут поддерживать компенсацию низкой частоты кадров Low Framerate Compensation.

Вот список характеристик для мониторов нового поколения, которые становятся возможными при использовании новой версии стандарта DisplayPort 1.3 с расширенной пропускной способностью: мониторы с разрешением 1920×1080 пикселей: 240 Гц SDR и 240 Гц HDR, мониторы с разрешением 2560×1440: 240 Гц SDR и 170 Гц HDR, 4K-мониторы: 120 Гц SDR и 60 Гц HDR, 5K-мониторы: 60 Гц SDR.

Если уж мы начали говорить про FreeSync, то нужно упомянуть, что в решениях архитектуры Polaris эта технология будет работать и с мониторами, имеющими разъемы HDMI 2.0b. На данный момент компания работает со своими партнерами, в числе которых Acer, LG, Mstar, Novatek, Realtek и Samsung, для обеспечения работы технологии динамического частоты обновления, в том числе и при помощи HDMI. Список планируемых к выпуску мониторов включает изделия с размерами экрана от 20 до 34 дюймов и различным разрешением.

Одной из самых интересных и перспективных возможностей Polaris по выводу информации является поддержка HDR-дисплеев с расширенным динамическим диапазоном. Для получения качественной картинки нужен вывод изображений в широком цветовом охвате с увеличенной контрастностью и максимальной яркостью, а на нынешних дисплеях человек видит лишь малую часть того, что может наблюдать своими глазами в окружающем мире. Диапазон воспринимаемых нами яркостей и цветов куда больше того, что могут дать нам текущие устройства вывода.

Внедрения High Dynamic Range во все стадии конвейера обработки изображения ждут многие энтузиасты качественного изображения. Для того чтобы хоть приблизиться к возможностям человеческого зрения, был введен новый индустриальный стандарт для телевизоров - HDR UHDTV, обеспечивающий диапазон яркости от 0.005 до 10000 нт. Первые HDR-устройства имеют яркость до 600-1200 кд/м 2 , а ЖК-мониторы с поддержкой High Dynamic Range (HDR) и локальной подсветкой в будущем смогут обеспечить до 2000 нт, а OLED-дисплеи - до 1000 нт, но при идеальном черном цвете и большей контрастности.

При использовании HDR пользователям будет демонстрироваться и расширенный цветовой диапазон, так как распространенное сейчас цветовое пространство sRGB сильно отстает от возможностей зрения человека. Нынешний контент почти весь создан в рамках стандартов BT.709, sRGB, SMPTE 1886 (Gamma 2.4), а новый стандарт HDR-10, Rec.2020 (BT.2020), SMPTE 2084 способен обеспечить отображение более миллиарда цветов при 10-бит на компонент, что приближает качество цветопередачи к естественному для человека.

Не нужно путать тему устройств отображения с HDR-возможностями с тем, что давно появилось в играх и называется HDR-рендерингом. Действительно, многие современные игровые движки используют рендеринг с расширенным динамическим диапазоном, чтобы сохранить данные в тенях и светах, но делается это исключительно до вывода информации на дисплей. А далее изображение все равно приводится к обычному динамическому диапазону, чтобы вывести его на SDR-монитор.

Для этого используются специальные алгоритмы тонального отображения (tone mapping ) - преобразования тональных значений из широкого диапазона в узкий. С учетом появления HDR-устройств нужны как улучшенные алгоритмы tone mapping, так и ориентация их уже на HDR-дисплеи. Аппаратный движок обработки цветовых данных в Polaris имеет программируемые возможности по управлению гаммой и преобразования цветового охвата (gamut remapping), все расчеты идут с высокой точностью, и результат будет полностью соответствовать возможностям дисплея.

Хотя даже нынешние видеокарты Radeon в определенной мере готовы для работы с HDR-мониторами, вышедшие новые модели обеспечивают заметно более высокую частоту обновления и глубину цвета. Графические процессоры Polaris готовы к HDR-мониторам с глубиной цвета в 10-бит и 12-бит на компоненту, хотя первые такие дисплеи будут поддерживать только 10-бит, но затем последуют и более продвинутые, которые превзойдут возможности человеческого зрения.

Для того, чтобы получить качественное HDR-изображение в игровых приложениях, необходимо переделывать не только графическую часть игрового движка, но и часть контента: те же текстуры должны также храниться в форматах, позволяющих использовать широкий цветовой и яркостный охват. Компания AMD работает с игровыми разработчиками для того, чтобы будущие игры уже могли полноценно использовать возможности HDR-дисплеев, и для этого они выпустили специальный Radeon Photon SDK.

И тут есть над чем поработать. Тональное отображение (tone mapping) в играх должно делаться графическим движком, так как этот процесс, производимый дисплеем добавляет значительные задержки. AMD предлагает делать так: монитор опрашивается на предмет его возможностей по цвету, контрасту и яркости, затем с учетом этой информации игровой движок делает tone mapping и выводит его на дисплей в готовом виде. Так как игровые движки уже делают tone mapping в SDR, им просто нужно добавить возможность вывода в HDR.

Photon SDK уже доступен для разработчиков, поддержка HDR для видеоданных и рендеринга в DirectX 11-приложениях в драйвере уже готова, а поддержка DirectX 12 планируется с будущим его обновлением. Остается добавить, что Polaris поддерживает HDR-дисплеи, соединенные при помощи разъема HDMI 2.0b (с HDCP 2.2) в разрешении 1920×1080 при 192 Гц, в разрешении 2560×1440 при 96 Гц и 3840×2160 при 60 Гц и кодировании цвета 4:2:2. В случае присоединения по DisplayPort 1.4-HDR (также с HDCP 2.2) возможности шире: 1920×1080 при 240 Гц, 2560×1440 при 192 Гц и 3840×2160 при 96 Гц. Осталось дождаться таких мониторов с ценой ниже, чем у чугунного моста.

Улучшенное кодирование и декодирование видеоданных

Как часто бывает, в новых поколениях графических процессоров заодно улучшают и блоки аппаратной обработки видеоданных. Ведь время не стоит на месте, появляются все новые форматы и условия их использования (частота кадров, глубина цвета и т.п.) Поэтому неудивительно, что в Polaris были проведены кое-какие улучшения по декодированию и кодированию видеоданных.

Если кодировать видеоряд в формат H.264 вплоть до 4K-разрешения при 30 или даже 60 FPS умели и предыдущие решения, то кодирование видео в формат HEVC (H.265) Polaris научился впервые. Аппаратным блоком кодирования видео в новом GPU поддерживаются следующие разрешения и частоты кадров: 1080p при 240 FPS, 1440p при 120 FPS и 4K при 60 FPS.

Мало того, на видеокартах серии Radeon RX была добавлена поддержка и высококачественного кодирования потокового видео из игр. Ведь качество кодирования всегда было слабым местом потокового видео, и при быстро меняющемся изображении его качество серьезно страдало. Высокого же качества картинки можно добиться при двухпроходном кодировании с анализом картинки в первом проходе, которое и было внедрено в Polaris. Аппаратное двухпроходное кодирование работает как с H.264, так и с форматом HEVC, и подобный подход дает заметно более высокое качество видеопотока.

Чтобы раскрыть аппаратные возможности архитектуры Polaris, нужна поддержка и со стороны программного обеспечения. Качественный аппаратный кодер для игр поддерживается следующими утилитами: Plays.TV, AMD Gaming Evolved, Open Broadcaster Software.

Также Polaris оснащен и самым продвинутым аппаратным блоком, декодирующий видеоданные. Видеодекодер компании AMD умеет работать с форматом HEVC и профилем кодирования Main-10 в разрешениях до 4K с частотой кадров в 60 FPS, MJPEG в 4K-разрешении с 30 FPS, H.264 в разрешении 4K до 120 FPS, MP4-P2 до 1080p при 60 FPS и VC1 до 1080p при 60 FPS.

Поддержка систем виртуальной реальности

За несколько последних лет текущая реинкарнация шлемов виртуальной реальности прошла немалую дорогу, постоянно улучшая свои потребительские характеристики (хотя до идеала все равно еще очень далеко). Если начиналось все с менее чем Full HD-разрешения на оба глаза в 2014 году при не более чем 30 FPS, то теперь дело дошло до разрешения 1080×1200 пикселей на каждый глаз при 90 FPS и 10 мс задержками. И сейчас ощущения от VR куда комфортнее и реалистичнее.

Компания AMD также со своей стороны занимается улучшением характеристик, связанных с VR. Так, технология LiquidVR предполагает реализацию некоторых возможностей, улучшающих VR на решениях компании. В числе последних изменений поддержка аудиотехнологии TrueAudio Next, резервирование вычислительных блоков под конкретные задачи, технология асинхронных вычислений Quick Response Queue, переменное разрешение и качество рендеринга для VR, поддержка DirectX 12 и Vulkan.

Так, технология продвинутой обработки звука TrueAudio Next включает всю работу со звуками на GPU в реальном времени - с соблюдением физических законов распространения звуковых волн и применением просчета лучей (рейтрейсинг) для множества источников звука. Это позволяет получить качественный звук с низкими задержками и при помощи настроек (количество обрабатываемых источников и количество отражений звуковых волн) получить хорошо масштабируемое решение.

Еще одной возможностью по работе с VR, которая недавно появилась, стало выделение нескольких вычислительных устройств Compute Unit под различные задачи, вроде обработки звука - в таком случае, эти CU будут заниматься исключительно этими задачами, чтобы избежать проблем, связанных с одновременным исполнением различных задач на GPU в реальном времени - это решение обеспечивает немедленное исполнение критичного кода и работает с любыми типами шейдеров, вычислительными или графическими.

А архитектуре Polaris был улучшен командный процессор - появилась новая техника качества обслуживания (QoS - quality of service) под названием Quick Response Queue. Эта техника позволяет разработчикам через API назначать высокоприоритетными некоторые вычислительные задачи. Оба типа задач (обычные и приоритетные) разделяют те же ресурсы GPU, но высший приоритет позволяет удостовериться, что такие задачи будут использовать большее количество ресурсов и завершатся первыми, без переключения командного процессора на низкоприоритетные задачи.

Конкретно в LiquidVR эта техника используется при асинхронном искажении времени (Asynchronous Time Warp), используемом в системах виртуальной реальности для того, чтобы избежать отброшенных кадров, ухудшающих плавность процесса - в VR это очень требовательная к задержкам задача, и приоритезация задач поможет удостовериться, что искажение времени происходит ровно тогда, когда нужно. Техника Quick Response Queue (QRQ) дает четкое управление над таймингами, минимизируя их.

Без использования техники асинхронного искажения времени в системах виртуальной реальности получается так, что графический процессор при работе отбрасывает около 5% кадров, а с Asynchronous Time Warp эти кадры не отбрасываются, что снижает «дрожание» (разное время рендеринга соседних кадров) в десятки раз. На данный момент возможность уже входит в состав библиотеки, доступной на сайте GPUOpen.

Мы уже знаем еще об одной оптимизации, связанной с VR - использование нескольких проекций при рендеринге сцены виртуальной реальности с разным разрешением. Мы уже не один раз рассказывали об этой возможности, которая оптимизирует VR-рендеринг, используя независимые настройки разрешения и качества разрешения для нескольких проекциях, которыми имитируется воронкообразный тип рендеринга, используемый в VR-шлемах. В этом случае для центра кадра применяется рендеринг в высоком разрешении, а на периферии оно снижается для оптимизации производительности.

В составе LiquidVR есть поддержка DirectX 12 - идеального графического API для виртуальной среды, так как он позволяет повысить количество функций вызовов отрисовки в сцене, помогает снизить нагрузку на CPU, имеет родную поддержку для асинхронного исполнения вычислений и многочипового рендеринга, а также дает некоторые возможности для низкоуровневого доступа к GPU. Примеры использования DirectX 12 в составе LiquidVR, а также соответствующая документация доступны на сайте GPUOpen.com.

Программные технологии Radeon Software

В компании AMD продолжают улучшать не только аппаратную составляющую своих продуктов, но и программные компоненты. В очередной раз они решили оптимизировать частоту выпуска новых версий видеодрайверов, так как некоторые пользователи оставались недовольны тем, что было в прошлом году. Долгие годы они ежемесячно выпускали обновленные WHQL-драйверы, но некоторым пользователям казалось, что это слишком часто. После того, как они снизили частоту выпуска релизов драйверов, другие пользователи оказались недовольны уже редкими выходами.

Так, в 2015 году было выпущено три WHQL драйвера и 9 бета-версий, а план на 2016 такой: шесть полноценных драйверов с WHQL-сертификацией за год + такое количество специальных версий с оптимизациями для игр, какое понадобится (в идеале - также WHQL). Пока что у них получается почти всегда, с момента выхода игр были доступны драйверы Radeon Software Crimson Edition для игр The Division, Far Cry Primal, Hitman, Quantum Break и других. С игрой Doom и видеокартами на чипах предыдущих поколений GCN вышла небольшая заминка, правда, но с кем не бывает?

Продолжают в AMD обращать внимание на оптимизацию драйверов, предназначенную для плавной смены кадров, особенно в многочиповых конфигурациях. Так, CrossFire API для DirectX 11 был включен в состав GPUOpen, а для некоторых DirectX 12-приложений планируется поддержка многочипового рендеринга с плавной сменой кадров и малой разницей во времени рендеринга соседних кадров, а не только с высоким FPS.

В будущих драйверах Radeon Software для DX12–игр планируется специальная поддержка AFR frame pacing - технология, которая специальным образом добавляет задержки перед тем, как вывести изображение на экран, что улучшает плавность и устраняет рывки при многочиповом рендеринге.

Очень важно, что все большее внимание уделяется операционным системам, отличным от Windows. Так, представлена поддержка Polaris для дистрибутивов Linux на основе открытого кода - в этих драйверах уже есть поддержка Vulkan-версии игры Dota 2, например.

Из любопытного отметим специальную программу для бета-тестирования Radeon Software Beta Program. Эта программа работает под управлением отдела обеспечения качества (Quality Assurance - QA), и в нее может вступить любой пользователь, написав по адресу [email protected] для получения дополнительной информации.

Самые важные изменения произошли с настройками Radeon Settings, включенными в состав нового драйвера. Там появилась глобальная поддержка Crossfire и энергоэффективности, масштабирование HDMI и масштабирование в зависимости от конкретного приложения, изменение цветовой температуры, выбор языка пользовательского интерфейса и многое другое - о возможностях разгона и мониторинга мы уже рассказали выше.

Все это касается конечных пользователей, но постоянно происходят и изменения в программной поддержке, предназначенные для разработчиков. Открытая инициатива GPUOpen давно известна как удобный метод для обеспечения разработчиков SDK, библиотеками и примерами с открытым кодом. Только за последний месяц на портале появилось 14 больших обновлений, за четыре месяца разработчиками было написано 41 блогов, а всего с момента запуска инициативы в конце января было размещено более 60 примеров кода, SDK, библиотек и утилит.

Из последних примеров отметим ShadowFX с поддержкой DirectX 12, улучшения GeometryFX для DirectX 11, обновленный TressFX 3.1 (DirectX 11). Появились новые библиотеки, SDK и примеры для многочипового рендеринга в DirectX 12, пример out of order растеризации для Vulkan, FireRays для Vulkan и OpenCL, поддержка CrossFire API для DirectX 11. Также AMD стала первым производителем аппаратного обеспечения, выпустившим расширение для SPIR-V - шейдерного языка в графическом API Vulkan с поддержкой инструкций GCN). Также появилась поддержка Radeon для OpenVX - открытого кроссплатформенного стандарта для ускорения приложений машинного зрения.

А недавно AMD представила расширение Shader Intrinsic Functions для библиотеки GPUOpen, которое облегчит оптимизацию ПК-версий игр, облегчив разработку многоплатформенных приложений и портирование игр с консолей. При использовании Shader Intrinsic Functions разработчик может получить прямой доступ к низкоуровневым инструкциям, как на консолях - при помощи вставок низкоуровневого кода в исходники высокого уровня. Эту возможность можно использовать в приложениях с поддержкой DirectX 11, DirectX 12 и Vulkan.

Выводы по теоретической части

Видеокарта модели Radeon RX 480 стала первенцем семейства Polaris, первой вышедшей на рынок моделью в новой линейке компании AMD, основанной на графических процессорах, спроектированных и произведенных при помощи технологического процесса 14 нм FinFET. Вместе с архитектурными оптимизациями, это позволило серьезно повысить энергоэффективность нового решения, и в результате по этому показателю новинка вдвое-втрое лучше предыдущих видеокарт компании AMD.

Хотя графический процессор Polaris 10 архитектурно весьма схож с предыдущими чипами и во многом повторяет их решения, и графические архитектуры разных поколений GCN не слишком сильно отличаются друг от друга, в новом графическом процессоре было сделано множество улучшений для более эффективных вычислений различных типов, в том числе при асинхронном исполнении кода, были серьезно улучшены возможности вывода изображения на дисплеи и функциональность блоков кодирования и декодирования видео.

Polaris 10 - лучшее графическое ядро компании AMD, которое принесло новые функциональные возможности, но главное - стало значительно более эффективным. Так, улучшения в вычислительных ядрах привели к 15%-ному росту производительности математических вычислений, по сравнению с архитектурой GCN предыдущих поколений. Вместе с применением нового техпроцесса 14 нм FinFET и другими оптимизациями, это позволило заметно улучшить энергоэффективность - вплоть до 2,8 раз, по оценке компании. А это, в свою очередь, означает лучшие пользовательские характеристики по тепловыделению и шуму от системы охлаждения.

В списке функциональных изменений и улучшений - поддержка кодирования и декодирования современных видеоформатов с новыми возможностями: поддержка более высоких битрейтов и продвинутых форматов, готовность к декодированию потокового HDR-видео с онлайновых сервисов, запись игрового процесса на лету без участия мощностей CPU, качественный режим кодирования видео с двумя проходами, и т.д. Также можно отметить появление поддержки стандартов вывода изображения, которые станут весьма важными в будущем: 10- и 12-битные форматы вывода для HDR-телевизоров и мониторов, а также поддержка дисплеев с высокими разрешением и частотами обновления.

Но главное в представленном сегодня продукте Radeon RX 480 - его цена. Пусть некоторым покажется, что функциональных нововведений и оптимизаций в Polaris не так уж много, зато этот новый продукт, использующий современный технологический процесс, позволил серьезно снизить цену видеокарты, вполне достаточной как для последних игр с высокими настройками качества, так и для применения в составе систем виртуальной реальности, довольно требовательной к мощности GPU.

Сочетание сравнительно низкой цены и достаточно высокой производительности делает Radeon RX 480 одной из самых удачных по соотношению цены и производительности видеокарт на момент ее выпуска, если не самой выгодной. Важно, что она ориентирована на средний ценовой сегмент, привлекающий куда большее количество потенциальных покупателей, чем топовые решения, и выпуск именно такой модели в первую очередь может положительно сказаться на рыночной доле компании AMD в сегменте игровых видеокарт.

В следующих частях нашей статьи мы оценим производительность новой видеокарты AMD Radeon RX 480 на практике, сравнив ее скорость с показателями близких по цене ускорителей компаний Nvidia и AMD. Сначала мы рассмотрим данные, полученные в нашем наборе синтетических тестов, а затем перейдем и к самому интересному - игровым тестам.

Блок питания Thermaltake DPS G 1050W для тестового стенда предоставлены компанией Thermaltake Корпус Corsair Obsidian 800D Full Tower для тестового стенда предоставлен компанией Corsair Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

AMD Radeon RX 480 8Gb. Версия от HIS

С появлением новой игровой видеокарты RX 480 большинство геймеров задумались о том, чтобы обновить свой ПК, это не удивительно ведь такой производительности в этой ценовом не видели уже давно. AMD выпустила два решения RX 480 4GB которая стоит 199$ и RX 480 8GB которая обойдётся вам на 40$ дороже, давайте решим стоит ли оно того, и является ли различие в размерах памяти существенной разницей.

Характеристики Radeon RX 480

Как показывает практика 4 и 8 ГБ практически не отличаются, но память у 8Gb версии быстрее она 256 GB/сек, а у её младшей модели 224 GB/сек.

А теперь посмотрев на тесты:

Можно понять, что версия за 199$ немного проигрывает, в каждом тесте показывая результаты на 3-4% хуже, чем видеокарта за 240$. Но эти проценты явно не оправдывают наценку, ведь при работе видеокарты вы вряд ли почувствуете эти незначительные отличия, да и если взглянуть на системные требования современных игр, можно понять что 4Гб хватает с головой.

RX 480 4Gb — Unigine Heaven — Haswell RX 480 4Gb — Unigine Valley — Skylake RX 480 4Gb — Unigine Heaven — Skylake RX 480 4Gb — Unigine Valley — Haswell

А теперь перейдем к версии на 8GB. хотелось сказать что тактовая частота ограниченна планкой в 1266 Мгц, но это не придел чипа который создан по технологии 14 FiNFER. Сами AMD заверяют что переход между узлами с 28 нм на 14 нм поднял производительность видеокарты в 1,8 раз, а что до оптимизации, её довели к соотношению 2,9. И сразу же в голову приходит сравнение с GeForce GTX 1070, которая с такой же мощностью обладая немного более вместительным GPU доходит до частоты 1683 Мгц.

Коротко поговорим о характеристиках RX 480:

  1. Архитектура — GCN 4-е поколение.
  2. Количество вычислительных блоков — 36.
  3. Потоковые процессы – 2304.
  4. Тактовые частоты. Базовая и ускорение – 1120 Мгц / 1266 Мгц.
  5. Пик производительности – достигает до 5,8 терафлопс.
  6. Тип памяти – GDDR
  7. Полоса пропуска памяти — 224 Гб и иногда выше.
  8. Стандартное потребление платы – 150 ВТ.
  9. Версия кабеля HDMI – 2,0.
  10. Максимальное разрешение — 5120×2880.
  11. Объем видеопамяти — 8192 Мб.
  12. Интерфейс — PCI-E 16x 3.0

Имеется поддержка Directx 12, а так же новая архитектура Polaris c технологией AMD LiquidVR, дают ощущения глубокой реалистичности в сочетании с гарнитурами погружения VR.

Производители и тесты

ASUS

ASUS предлагает два варианта дизайна RX 480, первый собственной разработки, разработанный для адаптеров ROG STRIX. И Asus Rog Strix-Rx480-O8g-Gaming с заводским разгоном частота которого составляет 1330 Мгц. Видеокарта имеет 8 гб памяти модели GDDR5, работающий на частоте 8000 Мгц. В видеокарте реализован гибридный режим работы системы охлаждения, это означает что в режиме покоя RX 480 бесшумна.

Радиатора достаточно для того чтобы поддерживать температуру GPU на отметке в 40-50 градусов. При тестирование видеокарты её пиковая температура не превысила 70 градусов, чтобы не допускать более сильного нагрева чипа вентиляторы крутились на скорости свыше 2000 об/мин. Также благодаря утилитам можно настроить свой режим охлаждения, но без соответствующих знаний этого делать не стоит.

Тестирование

  • Unigine Valley Benchmark — FPS: 53, Score 2228.
  • Unigine Heaven Benchmark — FPS: 52, Score 1313.
  • Benchmark Sky Diver – graphics score 4043

Игровые тесты:

Расширение во всех играх было установлено 1920×1080, а также были отключены функции VSync, все остальные настройки были установлены на максимальные. Процессор Intel Core i7-7700K с частотой 4.2GHz.

И вот какие результаты мы получили:

  • Crysis 3 – 52 Fps.
  • DOOM- 67 Fps.
  • Dying Light: — The Following 42 Fps.
  • GTA5 — 47 Fps.

Из этих данных можно сделать вывод что RX 480 прекрасно подходит для геймеров, и обеспечивает им хорошее погружение без тормозов.

Sapphire

Sapphire Radeon RX 480 Nitro+ 8Gb – у компании Sapphire есть несколько не совершенных моделей на архитектуре Polaris 10. Созданные на основе базы Nitro они совместили в себе качественное использование элементной базы и нерефернсной системы охлаждения, что в дальнейшем обеспечило этим видеокартам высокие характеристики, а так же низкий уровень шума, а также богатый набор функциональных возможностей. На модель 480 был установлен кулер DualX с новой технологией Quick Connect, данная технология позволяет быструю замену вентилятора, что позволяет проводить чистку в несколько раз быстрее, также как установлена утилита TriXX она отвечает за работоспособность вашего кулера, согласно словам разработчика если ваш кулер сломался, то связавшись с тех поддержкой вам могут выслать замену.

Тестирование

Sapphire Radeon RX 480 Nitro+ 8Gb получает несущественный заводской разгон, однако смотря на конкурентов это шаг вперёд. Частота возрастает от 1120 Мгц до 1160 Мгц а в режиме буста с 1266 до 1306. Также хотелось отметить, что в режиме когда видеокарта не нагружена система замедляет вентиляторы и температура держится на отметке 40-45 градусов, это уменьшает затраты электроэнергии. Чтобы дать оценку производительности был использован 3DMark Fire Strike, в результате проверки RX 480 Nitro+ 8Gb показала себя довольно неплохо частота чипа составила 1250-1285 Мгц, при этом вентиляторы работали всего на 39% от совей пиковой мощности. Сама видеокарта при тесте работала тихо, а её температура составила 75-76 градусов.

  • Unigine Valley Benchmark — FPS: 54, Score 2265.
  • Unigine Heaven Benchmark — FPS: 53, Score 1358.
  • Benchmark Fire Strike – graphics score 13163.

В игровых тестах:

Процессор Intel Core i7-7700K с частотой 4.2GHz.

  • Crysis 3, Текстуры: Макс, MSAAx8, 1920×1080 – стабильные 55 fps, хотя бывали просадки до 40, в моменты когда было слишком много взрывов.
  • Ведьмак 3: Дикая охота, Высокие настройки,HairWorks выкл, 1920×1080 – показатели fps вирировались от 50 до 90 в местах разной загруженности таких как города. Делаем вывод вполне играбельно.
  • Rise Of Tomb Rider: 1920×1080 Высокие настройки графики – игра показывает среднее значение 41 fps, чего тоже вполне достаточно для комфортной игры.

Gigabyte

Лето 2016 года, именно в этот момент состоялся выход графических чипов AMD Polaris. Который стал первой ступенью Gigabyte при переходе на чипы 14 нм, и после этого им открылись новые возможности построенные на этой базе модели серии RX 480, RX 470, стали движущей силой производства в среднем ценовом сегменте.

Тестирование

Как показали тесты, на видеокарты с альтернативными системами охлаждения, сильно влияют тактовые частоты, а также температуры. На RX 480 установлен кулер WindForse который справляется с температурой до 78 градусов, конечно это не самый низкий уровень, но и будем откровенны не самый высокий. Важно чтобы температура не превышала критическое значение, иначе видеокарта может сгореть.

  • Unigine Valley Benchmark — FPS: 56, Score 2285.
  • Unigine Heaven Benchmark — FPS: 50, Score 1318.
  • Benchmark Fire Strike – graphics score 14163.

В игровых тестах:

Расширение во всех играх 1920×1080, настройки bestquality, все тесты в DirectX 11: Процессор Intel Core i7-7700K с частотой 4.2GHz.

  • Rise Of the Tomb Raider – 45 Fps.
  • Fallout 4 – 45 Fps.
  • The Witcher 3: Wild Hunt — 50 Fps.
  • BattleField 1 – 40 Fps.

Вывод

На данный момент Radeon RX 480 является лучшем решением в среднем ценовом сегменте, где соперничает с GTX 1060. Благодаря утилитам которые можно подстроить под свои нужды, спектр решаемый ею задач велик, она одинакова хороша, как и в играх, так и в работе с графикой. А так же если вы обладатель VR вы, без каких либо проблем можете погрузиться в виртуальную реальность так как мощности карты будет вполне достаточно для этого.

  • Анализ среднегеометрических результатов и привлекательности покупки
  • реклама

    Вступление

    В данном обзоре будет изучена производительность новой видеокарты AMD – Radeon RX 480 8192 Мбайт. Ее соперниками стали следующие модели:

    • Radeon R9 Fury 4096 Мбайт;
    • Radeon R9 390X 8192 Мбайт;
    • Radeon R9 390 8192 Мбайт;
    • Radeon R9 380X 4096 Мбайт;

    • GeForce GTX 980 Ti 6144 Mбайт;
    • GeForce GTX 980 4096 Mбайт;
    • GeForce GTX 970 4096 Mбайт;
    • GeForce GTX 960 2098 Mбайт.

    реклама

    Тестовая конфигурация

    Тесты проводились на следующем стенде:

    • Процессор: Intel Core i7-6700K (Skylake, L3 8 Мбайт), 4000 @ 4600 МГц;
    • Материнская плата: Gigabyte GA-Z170X-Gaming 3, LGA 1151;
    • Система охлаждения CPU: Corsair Hydro Series H105 (~1300 об/мин);
    • Оперативная память: 2 x 4096 Мбайт DDR4 Corsair Vengeance LPX CMK8GX4M1A2400C14 (Spec: 2400 МГц / 14-16-16-31-1t / 1.2 В) , X.M.P. - on;
    • Дисковая подсистема №1: 64 Гбайт, SSD ADATA SX900;
    • Дисковая подсистема №2: 1 Тбайт, HDD Western Digital Caviar Green (WD10EZRX);
    • Блок питания: Corsair HX850 850 Ватт (штатный вентилятор: 140 мм на вдув);
    • Корпус: открытый тестовый стенд;
    • Монитор: 27" ASUS PB278Q BK (Wide LCD, 2560x1440 / 60 Гц).

    Видеокарты:

    • Radeon RX 480 8192 Мбайт - 1266/8000 @ 1320/8700 МГц (Sapphire);

    • Radeon R9 Fury 4096 Мбайт - 1000/500 @ 1100/500 МГц (Sapphire);
    • Radeon R9 390X 8192 Мбайт - 1050/6000 @ 1160/6500 МГц (Sapphire);
    • Radeon R9 390 8192 Мбайт - 1000/6000 @ 1140/6500 МГц (ASUS);
    • Radeon R9 380X 4096 Мбайт - 970/5700 @ 1150/6500 МГц (Gigabyte);

    • GeForce GTX 980 Ti 6144 Mбайт - 1076/7012 @ 1420/8100 МГц (Zotac);
    • GeForce GTX 980 4096 Mбайт - 1216/7012 @ 1440/8000 МГц (Palit);
    • GeForce GTX 970 4096 Mбайт - 1178/7012 @ 1430/8000 МГц (Zotac);
    • GeForce GTX 960 2098 Mбайт - 1178/7012 @ 1450/8000 МГц (Gigabyte).

    Программное обеспечение:

    • Операционная система: Windows 7 x64 SP1;
    • Драйверы видеокарты: Nvidia GeForce 372.70 WHQL и AMD Radeon Software Crimson 16.9.1.
    • Утилиты: Fraps 3.5.99 Build 15618, D3DGear 4.99.2017, AutoHotkey v1.0.48.05, MSI Afterburner 4.3.0 Beta 14.

    Инструментарий и методика тестирования

    Для более наглядного сравнения видеокарт все игры, используемые в качестве тестовых приложений, запускались в разрешениях 1920 х 1080 и 2560 х 1440.

    В качестве средств измерения быстродействия применялись встроенные бенчмарки, утилиты Fraps 3.5.9 Build 15586 и AutoHotkey v1.0.48.05. Список игровых приложений:

    • Assassins Creed Syndicate (Пригород Лондона).
    • Doom (Поверхность Марса).
    • Dying Light: The Following (Ферма).
    • Fallout 4 (Перед ядерным взрывом).
    • Homefront: The Revolution (Рискованное предприятие).
    • Lords of the Fallen (Цитадель Замкового Камня).
    • Overwatch (Тренировочная база).
    • The Witcher 3: Wild Hunt - Blood and Wine (Туссент).
    • Tom Clancy"s The Division (Манхэттен).
    • Total War: Warhammer (Рейкландский руноклык).

    Во всех играх замерялись минимальные и средние значения FPS. В тестах, в которых отсутствовала возможность замера минимального FPS , это значение измерялось утилитой Fraps. VSync при проведении тестов был отключен.

    Перейдем непосредственно к тестам.

    Результаты тестов: сравнение производительности

    Assassins Creed Syndicate (Пригород Лондона)

    • Версия 1.5.0.
    • DirectX 11.
      • Сглаживание - FXAA.
      • Качество окружения - максимальное.
      • Качество текстур - высокое.
      • Качество теней - максимальное (PCSS).
      • Объемный свет – HBAO + Ultra.

    1920х1080

    Номинал
    Разгон

    Включите JavaScript, чтобы видеть графики

    2560х1440

    Номинал

    Включите JavaScript, чтобы видеть графики


    Разгон

    Включите JavaScript, чтобы видеть графики

    Минимальный и средний FPS

    реклама

    Doom (Поверхность Марса)

    реклама

    • Версия 1.0 Update 2.
    • id Tech 6.
      • Сглаживание - FXAA.
      • Хроматическая аберрация - включена.
      • Поле зрения - 90.
      • Масштабирование разрешения - 100%.
      • Качество освещения - ультра высокое.
      • Качество теней - ультра высокое.
      • Тень игрока - включена.
      • Качество направленного затемнения - высокое.
      • Качество декалей - ультра высокое.
      • Фильтрация декалей - анизотропная, х16.
      • Размер страницы при виртуальном текстурировании - ультра высокий.
      • Качество отражений - ультра высокое.
      • Качество частиц - ультра высокое.
      • Процедурные шейдеры - включены.
      • Качество размытия в движении - ультра высокое.
      • Глубина поля зрения - включена.
      • Сглаживание глубины поля зрения - включено.
      • HDR Bloom - включен.
      • Эффект бликов - включен.
      • Грязь на объективе - включена.
      • Режим рендеринга - кинематографический.
      • Степень увеличения резкости - 2.0.
      • Зернистость - 1.0.

    1920х1080

    Номинал

    Включите JavaScript, чтобы видеть графики


    Разгон

    Включите JavaScript, чтобы видеть графики

    2560х1440

    Номинал

    Включите JavaScript, чтобы видеть графики


    Разгон

    Включите JavaScript, чтобы видеть графики

    Минимальный и средний FPS В конце июня текущего года компания AMD анонсировала линейку новых графических процессоров Polaris 10 и Polaris 11, в основе которых лежит самый современный технологический процесс 14 нм FinFET. На данный момент в числе видеокарт, выпускаемых на новых графических процессорах, три модели: AMD Radeon RX 480, AMD Radeon RX 470 и AMD Radeon RX 460. В сегодняшней статье мы проведём краткий обзор эталонной модели старшей видеокарты и её всестороннее тестирование.

    Поскольку все теоретические выкладки об архитектуре новых графических процессоров Polaris уже давно опубликованы другими ресурсами, сегодня мы не будем затрагивать эту тему. Лишь кратко отметим, что основные нововведения в обновлённой архитектуре Graphics Core Next четвёртого поколения коснулись улучшенной обработки геометрии и блоков кодирования и декодирования видеоданных, поддержки асинхронных вычислений в DirectX 12, поддержки API Vulkan, более эффективных методов компрессии данных, повышения энергоэффективности, поддержки видеовыходов DisplayPort 1.4-HDR и HDMI 2.0b и много всего прочего.

    1. Обзор видеокарты AMD Radeon RX 480 8 Гбайт

    технические характеристики и рекомендованная стоимость

    Технические характеристики и стоимость видеокарты AMD Radeon RX 480 приведены в таблице в сравнении с эталонными AMD Radeon R9 390, Radeon R9 380X и NVIDIA GeForce GTX 1060.



    * – по данным Яндекс.Маркет на 15.09.2016 .

    дизайн и особенности печатной платы

    Эталонный дизайн AMD Radeon RX 480 практически не отличается от дизайна Radeon R9 Fury X и Nano, представляя собой простую, но в то же время довольно стильную видеокарту размерами 244 x 102 х 38 мм. Всю лицевую сторону закрывает пластиковый кожух со структурой из мелких круглых ячеек, а слева выштампована крупная надпись RADEON.




    Она же видна и в верхней части кожуха.



    Вкупе со стилизованным таким же образом ротором вентилятора, дизайн эталонной модели Radeon RX 480 выглядит законченным и строгим.




    Панель с видеовыходами имеет три DisplayPort версии 1.4 и один HDMI версии 2.0b.



    Как видим, большую часть этой панели занимает решётка для беспрепятственного пропуска нагретого воздуха за пределы корпуса системного блока. А греется видеокарта весьма сильно, нужно заметить.

    Для питания Radeon RX 480 предназначен один шестиконтактный разъём, расположенный в верхней части кожуха. Заявленный уровень энергопотребления видеокарты составляет 150 ватт, а для системы с одной такой видеокартой рекомендуется блок питания мощностью 500 ватт. Силовая часть печатной платы выполнена по семифазной схеме, где шесть фаз отведены на питание графического процессора и одна – на видеопамять.

    В новом графическом процессоре Polaris 10 XT, выпущенном по нормам 14-нм техпроцесса и содержащем около 5,7 млрд. транзисторов, содержатся 2304 унифицированных шейдерных процессоров, 144 текстурных блока и 32 блока растровых операций (ROP).



    Частота работы графического процессора в 3D-режиме должна изменяться в диапазоне от 1120 до 1266 МГц, но на практике далеко не всегда было так, о чём мы расскажем ниже.

    На Radeon RX 480 может быть установлено как 4 Гбайт ($199), так и 8 Гбайт ($229) видеопамяти. Наш экземпляр видеокарты имел 8 Гбайт DDR5 памяти с микросхемами Samsung (по данным GPU-Z).


    Эффективная частота работы видеопамяти составляет 8000 МГц, что при 256-битной шине может обеспечить пропускную способность 256 Гбайт/с. Это сразу на 33% выше, чем у основного конкурента NVIDIA GeForce GTX 1060 с его 192-битной шиной (192,2 Гбайт/с).

    система охлаждения

    С практической точки зрения оценивать эффективность штатного кулера эталонной версии AMD Radeon RX 480 уже не имеет смысла, поскольку к сегодняшнему дню на рынке появились оригинальные версии с фирменными кулерами. Но так как они до нас ещё не доехали, то выбора нет, поэтому сегодня протестируем штатный кулер, представляющий собой сочетание алюминиевого радиатора с медным основанием для графического процессора, металлической пластины-теплораспределителя для силовых цепей и турбины, прокачивающей сквозь радиатор воздушный поток.



    Вся система накрыта пластиковым кожухом, который направляет нагретый видеокартой воздух на панель с видеовыходами и решёткой. Скорость турбины регулируется PWM в диапазоне от 1200 до 4960 об/мин.

    Для проверки температурного режима работы видеокарты в качестве нагрузки мы использовали девятнадцать циклов стресс-теста 3DMark.



    Поскольку обновлённой версии MSI Afterburner на момент подготовки статьи у нас ещё не было, то для мониторинга температур использовалась утилита GPU-Z версии 1.9.0. Все тесты проводились в закрытом корпусе системного блока, конфигурацию которого вы сможете увидеть в следующем разделе статьи, при средней комнатной температуре 25 градусов Цельсия.

    Сначала мы проверили температурный режим работы видеокарты при полностью автоматической регулировке скорости вентилятора.



    Автоматический режим (1200~2450 об/мин)


    Температуры очень высокие, очевидно, что штатный кулер, даже разогнавшись до 2450 об/мин, попросту не пригоден для обеспечения работы Radeon RX 480 на стандартной максимальной частоте 1266 МГц, поскольку во время тестирования она снижалась вплоть до 1000 МГц, а в среднем «плавала» у отметки 1050-1070 МГц.

    При максимально возможной скорости вентилятора кулера пиковая температура процессора на 12 градусов Цельсия ниже, за счёт чего частота GPU скачет не так сильно, как при автоматической регулировке.



    Максимальная скорость (~4960 об/мин)


    Что примечательно, процент стабильности видеокарты в стресс тесте 3DMark также вырос с 87,6% до 97,8%.



    Поэтому можно сделать вывод, что для обеспечения стабильной работы Radeon RX 480 и поддержания частоты её графического процессора на высоком уровне (а следовательно и производительности) эффективное охлаждение её нужно как никогда прежде, несмотря на новый 14-нм техпроцесс.

    Что касается разгона, то на эталонной видеокарте мы его, по понятным причинам, не изучали. Будем надеяться, что оригинальные модели Radeon RX 480 позволят раскрыть этот вопрос в полной мере и познакомиться с фирменной технологией AMD WattMan, реализованную одновременно с появлением Radeon RX 480.


    2. Тестовая конфигурация, инструментарий и методика тестирования

    Тестирование производительности видеокарт было проведено в закрытом корпусе на системе следующей конфигурации:

    системная плата: ASUS Sabertooth X79 (Intel X79 Express, LGA2011, BIOS 4801 от 28.07.2014);
    центральный процессор: Intel Core i7-3970X Extreme Edition 3,5/4,0 ГГц (Sandy Bridge-E, C2, 1,1 В, 6 x 256 Kбайт L2, 15 Мбайт L3);
    система охлаждения CPU: ARCTIC Liquid Freezer 240 (4 х 1100 об/мин);
    термоинтерфейс: ARCTIC MX-4 ;
    видеокарты:

    Inno3D iChill GF GTX 980 Ultra HerculeZ X4 Air Boss 4 Гбайт 1266-1367/7200 МГц;
    Sapphire NITRO R9 390 OC Tri-X 8 Гбайт 1040/6000 МГц;
    NVIDIA GeForce GTX 1060 Founders Edition 6 Гбайт 1506-1708(1886)/8008 МГц;
    AMD Radeon RX 480 8 Гбайт 1120-1266/8000 МГц;
    ASUS GeForce GTX 970 DC Mini 4 Гбайт 1050-1178/7012 МГц (GTX970-DCMOC-4GD5);
    ASUS STRIX R9 380X Gaming 4 Гбайт 1030/5700 МГц;

    оперативная память: DDR3 4 x 8 Гбайт G.SKILL TridentX F3-2133C9Q-32GTX (X.M.P. 2133 МГц, 9-11-11-31, 1,6 В);
    системный и игровой диск: Intel SSD 730 480GB (SATA-III, BIOS vL2010400);
    диск для хранения программ и игр: Western Digital VelociRaptor (SATA-II, 300 Гбайт, 10000 об/мин, 16 Мбайт, NCQ);
    архивный диск: Samsung Ecogreen F4 HD204UI (SATA-II, 2 Тбайт, 5400 об/мин, 32 Мбайт, NCQ);
    звуковая карта: Auzen X-Fi HomeTheater HD ;
    корпус: Thermaltake Core X71 (четыре be quiet! Silent Wings 2 (BL063) на 900 об/мин);
    панель управления и мониторинга: Zalman ZM-MFC3 ;
    блок питания: Corsair AX1500i Digital ATX (1500 Вт, 80 Plus Titanium), 140-мм вентилятор.
    монитор: 27-дюймовый Samsung S27A850D (DVI, 2560 х 1440, 60 Гц).

    В качестве верхних ориентиров по производительности для AMD Radeon RX 480 мы включили в тестирование оригинальную Inno3D iChill GF GTX 980 Ultra HerculeZ X4 Air Boss со стороны NVIDIA и также оригинальную Sapphire NITRO R9 390 OC Tri-X со стороны AMD.






    Прямым конкурентом героине сегодняшнего тестирования будет выступать NVIDIA GeForce GTX 1060, которая представлена эталонной версией Founders Edition. Рядом с ней на фото приведена ASUS STRIX R9 380X Gaming, которая, следуя маркировке видеокарт в линейке AMD, заменяется новой Radeon RX 480.





    Ну и, наконец, пятой видеокартой тестирования является ASUS GeForce GTX 970 DC Mini, которая, как это ни странно, сегодня стоит едва дешевле Radeon RX 480, а значит также гипотетически может с ней конкурировать.





    Добавим, что значение Power Limit на всех видеокартах было выставлено на максимум.

    Для снижения зависимости производительности видеокарт от скорости платформы 32-нм шестиядерный процессор при множителе 48, опорной частоте 100 МГц и активированной на уровень Ultra High функции Load-Line Calibration был разогнан до 4,8 ГГц при повышении напряжения в BIOS материнской платы до 1,385 В.



    Технология Hyper-Threading активирована. При этом 32 гигабайта оперативной памяти функционировали на частоте 2,133 ГГц с таймингами 9-11-11-20_CR1 при напряжении 1,6125 В.

    Тестирование, начатое 8 августа 2016 года, было проведено под управлением операционной системы Microsoft Windows 10 Professional со всеми обновлениями на указанную дату и с установкой следующих драйверов:

    чипсет материнской платы Intel Chipset Drivers – 10.1.1.27 WHQL от 06.07.2016 ;
    Intel Management Engine Interface (MEI) – 11.5.0.1019 WHQL от 09.08.2016 ;
    драйверы видеокарт на графических процессорах NVIDIA – GeForce 369.05 WHQL от 04.08.2016;
    драйверы видеокарт на графических процессорах AMDAMD Radeon Software Crimson 16.8.1 WHQL от 07.08.2016.

    Производительность видеокарт была проверена в разрешениях 1920 х 1080 и 2560 х 1440 пикселей. Для тестов использовались два режима качества графики: Quality + AF16x – качество текстур в драйверах по умолчанию с включением анизотропной фильтрации уровня 16х и Quality + AF16x + MSAA 4х(8х) с включением анизотропной фильтрации уровня 16х и полноэкранного сглаживания степени 4x или 8x, в случаях, когда среднее число кадров в секунду оставалось достаточно высоким для комфортной игры. В отдельных играх, в силу специфики их игровых движков, были использованы иные алгоритмы сглаживания, что будет указано далее в методике и на диаграммах. Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр. Если же данные настройки в играх отсутствовали, то параметры изменялись в панели управления драйверов Crimson или GeForce. Там же была принудительно отключена вертикальная синхронизация (V-Sync). Кроме указанного, никаких дополнительных изменений в настройки драйверов не вносилось.

    Видеокарты были протестированы в одном полусинтетическом графическом тесте и в пятнадцати играх, обновлённых до последних версий на дату начала подготовки материала. Список тестовых приложений выглядит следующим образом (игры и далее результаты тестирования в них расположены в порядке их официального выхода):

    3DMark (DirectX 9/11/12) – версия 2.1.2852, тестирование в сценах Fire Strike, Fire Strike Extreme, Fire Strike Ultra и Time Spy;
    Crysis 3 (DirectX 11) – версия 1.3.0.0, все настройки качества графики на максимум, степень размытости средняя, блики включены, режимы с FXAA и с MSAA 4x, двойной последовательный проход заскриптованной сцены из начала миссии Swamp продолжительностью 105 секунд;
    Metro: Last Light (DirectX 11) – версия 1.0.0.15, использовался встроенный в игру тест, настройки качества графики и тесселляция на уровне Very High, технология Advanced PhysX в двух режимах тестирования, тесты с SSAA и без сглаживания, двойной последовательный прогон сцены D6;
    Company of Heroes 2 (DirectX 11) – версия 4.0.0.21543, двойной последовательный прогон встроенного в игру теста при максимальных настройках качества графики и физических эффектов;
    Battlefield 4 (DirectX 11) – версия 1.2.0.1, все настройки качества графики на Ultra, двойной последовательный прогон заскриптованной сцены из начала миссии TASHGAR продолжительностью 110 секунд (для видеокарт на GPU AMD использовался API Mantle);
    Thief (DirectX 11) – версия 1.7 build 4158.21, настройки качества графики на максимальный уровень, технологии Paralax Occlusion Mapping и Tessellation активированы, двойной последовательный прогон встроенного в игру бенчмарка (для видеокарт на GPU AMD использовался API Mantle);
    Sniper Elite III (DirectX 11) – версия 1.15a, настройки качества на уровне Ultra, V-Synс отключён, тесселяция и все эффекты активированы, тесты с SSAA 4x и без сглаживания, двойной последовательный прогон встроенного в игру бенчмарка (для видеокарт на GPU AMD использовался API Mantle);
    (DirectX 11) – build 1951.27, все настройки качества вручную выставлены на максимальный и Ultra-уровень, тесселляция и глубина резкости активированы, не менее двух последовательных прогонов встроенного в игру бенчмарка;
    Grand Theft Auto V (DirectX 11) – build 757.4, настройки качества на уровне Very High, игнорирование предложенных ограничений включено, V-Synс отключена, FXAA активировано, NVIDIA TXAA выключено, MSAA для отражений выключено, мягкие тени NVIDIA/AMD;
    DiRT Rally (DirectX 11) – версия 1.2, использовался встроенный в игру тест на трассе Okutama, настройки качества графики на максимальный уровень по всем пунктам, Advanced Blending – On; тесты с MSAA 8x и без сглаживания;
    Batman: Arkham Knight (DirectX 11) – версия 1.6.2.0, настройки качества на уровне High, Texture Resolutioin normal, Anti-Аliasing on, V-Synс отключена, тесты в двух режимах – с активацией двух последних опций NVIDIA GameWorks и без них, двойной последовательный прогон встроенного в игру теста;
    (DirectX 11) – версия 3.1, настройки качества текстур на уровне Very High, Texture Filtering – Anisotropic 16X, и прочие максимальные настройки качества, тесты с MSAA 4x и без сглаживания, двойной последовательный прогон встроенного в игру теста.
    Rise of the Tomb Raider (DirectX 12) – версия 1.0 build 668.1_64, все параметры на уровень Very High, Dynamic Foliage – High, Ambient Occlusion – HBAO+, тесселляция и прочие методики улучшения качества активированы, по два цикла теста встроенного бенчмарка (сцена Geothermal Valley) без сглаживания и с активацией SSAA 4.0;
    Far Cry Primal (DirectX 11) – версия 1.3.3, максимальный уровень качества, текстуры высокого разрешения, объёмный туман и тени на максимум, встроенный тест производительности без сглаживания и с активацией SMAA;
    Tom Clancy’s The Division (DirectX 11) – версия 1.3, максимальный уровень качества, все параметры улучшения картинки активированы, Temporal AA – Supersampling, режимы тестирования без сглаживания и с активацией SMAA 1X Ultra, встроенный тест производительности, но фиксация результатов FRAPS;
    Hitman (DirectX 12) – версия 1.2.2, встроенный тест при настройках качества графики на уровне Ультра, SSAO включено, качество теней Ультра, защита памяти отключена.

    Если в играх реализована возможность фиксации минимального числа кадров в секунду, то оно также отражалось на диаграммах. Каждый тест проводился дважды, за окончательный результат принималось лучшее из двух полученных значений, но только в случае, если разница между ними не превышала 1%. Если отклонения прогонов тестов превышали 1%, то тестирование повторялось ещё как минимум один раз, чтобы получить достоверный результат.

    3. Результаты тестов производительности и их анализ

    На диаграммах результаты тестирования видеокарт на графических процессорах NVIDIA выделены зелёной заливкой, а на графических процессорах AMD отражены привычной данному производителю красной гаммой. Для выделения показателей Radeon RX 480 мы выбрали тёмно-красный цвет заливки. Добавим, что на диаграммах в каждом режиме качества результаты тестов отсортированы сверху-вниз в порядке убывания стоимости видеокарт.

    3DMark



    Практически во всех тестовых сценах 3DMark производительность видеокарт подтверждает их стоимость, чётко располагая продукты сверху вниз. Только в тесте Time Spy плотность результатов выше. AMD Radeon RX 480 идёт на уровне ASUS GeForce GTX 970, немного отставая от прямого конкурента в лице NVIDIA GeForce GTX 1060 и заметно опережая ASUS STRIX R9 380X Gaming. Очевидно, что до производительности Sapphire NITRO R9 390 OC Tri-X героине сегодняшней статьи не дотянуться даже при разгоне.

    Crysis 3

    Игра Crysis 3 продемонстрировала нам уже другую картину.



    Здесь AMD Radeon RX 480 уже выглядит не столь уверенно, уступая даже ASUS GeForce GTX 970 из уходящего в прошлое модельного ряда NVIDIA. Преимущество новинки над ASUS STRIX R9 380X Gaming совершенно не впечатляет, а разница с Sapphire NITRO R9 390 OC Tri-X слишком велика. О какой-либо борьбе с NVIDIA GeForce GTX 1060 здесь не может быть и речи, к сожалению.

    Metro: Last Light

    Напомним, что игру Metro: Last Light мы тестировали как при активации Advanced PhysX, так и без неё.






    Правда, видеокартам AMD сегодня отключение Advanced PhysX совершенно не помогло, – конкуренты оказались значительно сильнее. Преимущество AMD Radeon RX 480 над ASUS STRIX R9 380X Gaming здесь колеблется от 16 до 28%, а отставание от Sapphire NITRO R9 390 OC Tri-X – от 2 до 24%.

    Company of Heroes 2

    Вот и в Company of Heroes 2 расстановка сил не сильно отличается от Metro: Last Light – видеокарты на графических процессорах AMD уступают своим конкурентам на чипах NVIDIA.



    AMD Radeon RX 480 здесь проигрывает даже ASUS GeForce GTX 970, что уж говорить про NVIDIA GeForce GTX 1060, которая, в свою очередь, успешно борется с Sapphire NITRO R9 390 OC Tri-X?

    Battlefield 4

    Ещё плачевнее для видеокарт с GPU AMD ситуация в Battlefield 4.



    AMD Radeon RX 480 смогла только продемонстрировать небольшое преимущество над ASUS STRIX R9 380X Gaming, но даже ASUS GeForce GTX 970 оказалась ей «не по зубам», не говоря про GeForce GTX 1060.

    Thief

    Куда лучше для AMD обстоят дела в игре Thief, где задействован API Mantle.



    Несмотря на отсутствие явных провалов в производительности, AMD Radeon RX 480 конкурирует только с ASUS GeForce GTX 970, немного опережая ASUS STRIX R9 380X Gaming. В свою очередь, NVIDIA GeForce GTX 1060 не только убедительно побеждает AMD Radeon RX 480, но и способна противостоять более дорогой Sapphire NITRO R9 390 OC Tri-X.

    Sniper Elite III

    Результаты тестирования видеокарт в игре Sniper Elite III очень зависимы от режима качества, а именно – активации SSAA 4.0.



    Тем не менее, и здесь мы не можем назвать выступление AMD Radeon RX 480 убедительным, поскольку преимущество над ASUS STRIX R9 380X Gaming совершенно незначительное, а о соперничестве с NVIDIA GeForce GTX 1060 вовсе говорить не приходится.

    Middle-earth: Shadow of Mordor



    Здесь производительность AMD Radeon RX 480 выше, чем у ASUS STRIX R9 380X Gaming на 4-26%, правда это касается только разрешения 1920 х 1080 пикселей, поскольку в большом 2560 х 1440 пикселей новинка опережает предшественницу лишь на пару средних кадров в секунду, а минимальный FPS у AMD Radeon RX 480 даже чуть ниже. NVIDIA GeForce GTX 1060 далеко впереди их обеих, как и Sapphire NITRO R9 390 OC Tri-X.

    Grand Theft Auto V

    В игре Grand Theft Auto V мы можем видеть уже ставшую привычной для сегодняшнего тестирования картину.



    И всё же, в отличие от предыдущих бенчмарков, здесь AMD Radeon RX 480 удаётся опередить ASUS GeForce GTX 970 в режимах без использования сглаживания и даже не сильно отстать от NVIDIA GeForce GTX 1060 с Sapphire NITRO R9 390 OC Tri-X. При включении MSAA4x речь идёт только о борьбе с ASUS GeForce GTX 970 и преимуществе над ASUS STRIX R9 380X Gaming. Не более того, к сожалению.

    DiRT Rally



    В симуляторе автогонок по грунтовым дорогам AMD Radeon RX 480 идёт на одном уровне с ASUS GeForce GTX 970 и совсем немного отстаёт от NVIDIA GeForce GTX 1060. Что касается огромной разницы с ASUS STRIX R9 380X Gaming, то она, скорее всего, объясняется не оптимизацией драйверов под эту видеокарту, либо особенностью работы последних патчей игры с видеокартами Radeon R9 3xx.

    Batman: Arkham Knight

    Batman: Arkham Knight создавалась при поддержке NVIDIA, и в ней активно используются графические технологии данной компании, однако данный факт не помешал видеокартам на графических процессорах AMD уверенно выступить в этих тестах.



    Да, AMD Radeon RX 480 вновь уступила NVIDIA GeForce GTX 1060, но на этот раз не так много, как в предыдущих играх. Да и разница с ASUS STRIX R9 380X Gaming здесь составляет неплохие 24-33%.

    Tom Clancy"s Rainbow Six: Siege

    Rainbow Six: Siege оказалась первой игрой, где AMD Radeon RX 480 опередила Sapphire NITRO R9 390 OC Tri-X и наконец-то составила достойную конкуренцию NVIDIA GeForce GTX 1060.



    Впечатляет и её разница с ASUS STRIX R9 380X Gaming, достигающая 48% в одном из режимов качества. Кроме этого, наконец-то с хорошим запасом побеждена ASUS GeForce GTX 970. В общем, первая игра, оправдывающая выпуск AMD Radeon RX 480. К сожалению, праздник длился недолго, – уже в Rise of the Tomb Raider всё вернулось на круги своя.

    Rise of the Tomb Raider

    Поддержка игрой Rise of the Tomb Raider API DirectX 12, казалось бы, должна помочь AMD Radeon RX 480, но результаты говорят об обратном – новинка по-прежнему проигрывает своему основному конкуренту.



    Зато в режимах без использования сглаживания AMD Radeon RX 480 вполне уверенно опережает ASUS STRIX R9 380X Gaming, а при активации AA фрейм-рейт настолько низок, то без разницы, какую из двух этих видеокарт выбрать.

    Far Cry Primal

    Игра Far Cry Primal очень чётко расставляет видеокарты по производительности, исходя из их стоимости, в особенности в наиболее ресурсоёмком режиме качества.



    AMD Radeon RX 480 быстрее ASUS STRIX R9 380X Gaming в этой игре на 14-23%, и одновременно медленнее NVIDIA GeForce GTX 1060 на 8-11%.

    Tom Clancy’s The Division

    За исключением аномально высоких результатов Sapphire NITRO R9 390 OC Tri-X, в остальном расстановка видеокарт по производительности в Tom Clancy’s The Division не выбивается из общего ряда.



    Тем не менее, отметим, что в этой игре AMD Radeon RX 480 отстаёт от NVIDIA GeForce GTX 1060 на считанные проценты.

    Hitman

    Последняя версия игры Hitman – праздник на «красных улицах» AMD, поскольку именно в этой игре видеокартам с графическими процессорами Polaris и Grenada удалось опередить конкурентов на GPU Pascal и Maxwell 2.0.



    Добавим, что на ASUS GeForce GTX 970 в разрешении 2560 х 1440 пикселей с использованием максимального режима сглаживания тест завершался ошибкой, поэтому результата данной видеокарты в этом режиме качества нет.

    Дополним построенные диаграммы итоговой таблицей с результатами тестов с выведенными средним и минимальным значением числа кадров в секунду по каждой видеокарте.



    В дополнение к игровым тестам, сегодня мы приведём результаты тестирования двух конкурирующих между собой видеокарт в бенчмарке CompuBench CL 1.5 .




    AMD Radeon RX 480 4 ГбайтNVIDIA GeForce GTX 1060 6 Гбайт

    4. Сводные диаграммы

    На первой паре сводных диаграмм мы оценим разницу в производительности между AMD Radeon RX 480 и её предшественницей Radeon R9 380X в лице ASUS STRIX R9 380X Gaming, результаты которой в каждой игре приняты за начальную точку отсчёта, а средний FPS героини сегодняшнего тестирования отложен в процентах от них.



    В принципе, AMD Radeon RX 480 демонстрирует неплохой прирост производительности в сравнении с Radeon R9 380X практически по всем играм. Если не считать аномально низких результатов Radeon R9 380X в игре DiRT Rally, то особенно показателен в этом плане Hitman, где Radeon RX 480, благодаря вдвое увеличенному объёму памяти и более быстрому графическому процессору, опережает предшественницу на величину от 62 до 83%. В среднем по всем играм Radeon RX 480 быстрее на 27-31%.

    Далее проверим, как выглядит Radeon RX 480 на фоне Sapphire NITRO R9 390 OC Tri-X с таким же объёмом видеопамяти, но старым графическим процессором Hawaii. К слову, сейчас стоимость оригинальных версий Radeon R9 390 вплотную опустилась до уровня новых Radeon RX 480, поэтому такое сравнение будет вполне уместным и актуальным.



    Ну что же, мы видим, как Radeon RX 480 не смог одолеть Radeon R9 390. Исключение составила только игра Rainbow Six: Siege и режим с использованием сглаживания в Hitman. В среднем по всем тестам новинка отстаёт на 10-11% в разрешении 1920 х 1080 пикселей и на 14-15% в разрешении 2560 х 1440 пикселей.

    Наконец, самая важная и интересная пара сводных диаграмм: сравнение производительности AMD Radeon RX 480 и NVIDIA GeForce GTX 1060 – двух видеокарт которые были выпущены для противостояния друг с другом с двухнедельной разницей по времени.



    Преимущество видеокарты с графическим процессором NVIDIA очевидно, за исключением, опять же Hitman. В целом нельзя не отметить тенденцию, что при переходе от старых к более новым играм (сверху вниз) производительность видеокарт выравнивается, и Radeon RX 480 вовсе не выглядит «мальчиком для битья», как это казалось поначалу. Тем не менее, в нашем тестовом пакете игр получилось, что в среднем Radeon RX 480 отстаёт от GeForce GTX 1060 на 13,7-14,7% в разрешении 1920 х 1080 пикселей и на 14,1-15,0% в разрешении 2560 х 1440 пикселей.

    5. Энергопотребление

    Измерение уровня энергопотребления проводилось с помощью блока питания Corsair AX1500i через интерфейс Corsair Link и программу мониторинга HWiNFO64 версии 5.35-2950. Измерялось энергопотребление всей системы в целом без учёта монитора. Измерение было проведено в 2D-режиме при обычной работе в Microsoft Word или интернет-сёрфинге, а также в 3D-режиме. В последнем случае нагрузка создавалась с помощью четырёх последовательных циклов вступительной сцены уровня Swamp из игры Crysis 3 в разрешении 2560 х 1440 пикселей при максимальных настройках качества графики и использованием MSAA 4Х. Добавим, что на диаграмме отражён как пиковый уровень энергопотребления в 3D-режиме, так и среднее значение потребления за весь цикл тестирования.

    Сравним уровень энергопотребления систем с протестированными сегодня видеокартами по диаграмме.



    Энергопотребление системы с видеокартой AMD Radeon RX 480 не превысило потребление конфигурации с Radeon R9 380X и оказалось значительно ниже, чем с видеокартой Radeon R9 390. Однако в сравнении с системой, в которой установлена GeForce GTX 1060, новинка проигрывает довольно много для одного класса видеокарт, противопоставляемых друг другу. Так, если в пике нагрузки конфигурация с GeForce GTX 1060 потребляет всего 461 ватт, то с Radeon RX 480 – уже 518 ватт, что на 12,3% больше. По среднему уровню энергопотребления картина практически такая же, а в 2D NVIDIA ещё экономичнее AMD. Конечно, уровень энергопотребления видеокарт не является определяющим фактором при их выборе, но мы не можем не отметить, что и по этому показателю AMD уступила извечному конкуренту.

    Заключение

    Подводя итоги сегодняшнему материалу, можем кратко резюмировать, что на данный момент AMD Radeon RX 480 уступает по производительности NVIDIA GeForce GTX 1060 около 14-15%, но в наиболее современных играх, поддерживающих DirectX 12, разница между этими видеокартами сокращается. Поэтому можем предположить, что перспективы у Polaris всё же имеются. В плане энергопотребления AMD также проиграла этот раунд NVIDIA – на данный момент референсная GeForce GTX 1060 экономичнее Radeon RX 480. В отношении оверклокерского потенциала обеих видеокарт выводы будем делать после проверки оригинальных моделей с усиленными печатными платами и эффективными системами охлаждения. Кроме того, в ближайшей перспективе в тестовом пакете появятся ещё две новые игры с поддержкой DirectX 12, которые также могут повлиять на расстановку сил между AMD и NVIDIA в этом классе видеокарт. По розничной стоимости эти видеокарты сейчас практически одинаковы, так что выбор, как и всегда, за вами.

    Благодарим компанию AMD за
    предоставленную на тестирование видеокарту
    .


    Обзор AMD Radeon RX 480 8GB | Встречайте Polaris 10

    Восемь месяцев назад AMD начала раскрывать возможности GPU следующего поколения, начав с обновлённого контроллера дисплея с поддержкой HDMI 2.0b и DisplayPort 1.3 HBR3, FreeSync по HDMI и HDR-совместимый конвейер. Позже стала появляться дополнительная информация, в которой говорилось о выпуске двух разных GPU, один из которых разработан специально для рынка массовых настольных систем, а другой для мобильных решений, предлагающих производительность уровня консолей в тонких и лёгких форм-факторах.


    Второй продукт включает 16 вычислительных блоков (CU), 128-битную шину памяти и ускоренное кодирование/декодирования 4K-видео. Пока он не доступен. Видеокарта AMD Radeon RX 480 использует более крупный процессорный дизайн Polaris 10. В плане физических размеров он не больше процессора Nvidia GP100 с 15,3 млрд. транзисторов, но его возможностей достаточно, чтобы управлять лучшими гарнитурами виртуальной реальности. По уровню производительности карта находится в одном ряду с AMD Radeon R9 290 и Nvidia GeForce GTX 970.

    Средний уровень производительности карты трудно назвать сногсшибательным, особенно на фоне нового графического процессора Nvidia GP104. Однако AMD Radeon RX 480 стоит заметно дешевле аналогичных по скорости решений, а потребляемая мощность ограничена 150 Вт. Таким образом, AMD рассчитывает сделать виртуальную реальность доступной для более широкой аудитории геймеров (хорошо, если бы ей подыграли компании, которые продают HMD за $800 и $600).

    Доступны две версии AMD Radeon RX 480 : модель за $200 (MSRP), оснащённая 4 Гбайт видеопамяти GDDR5 со скоростью передачи данных 7 Гбит/с и версия за $240 (MSRP) с 8 Гбайт GDDR5 со скоростью 8 Гбит/с. Сегодня мы тестируем модель с объемом памяти 8 Гбайт.

    Особенности Polaris 10

    Polaris 10 состоит из 5,7 миллиардов транзисторов на кристалле площадью 230 мм2. Для сравнения, кристалл Hawaii имеет 6,2 миллиардов транзисторов и площадь 438 мм2. Несмотря на меньшее число транзисторов и пониженную примерно на 55% потребляемую мощность, RX 480 в большинстве тестов находится между R9 290 и 390. Во многом, это заслуга техпроцесса FinFET 14 нм от GlobalFoundries, который обеспечивает AMD заметные преимущества в производительности и энергопотреблении по сравнению с планарными транзисторами, изготовленными с использованием техпроцесса 28 нм. FinFET даёт более высокую частоту при любом уровне потребляемой мощности, и наоборот, при любой тактовой частоте чип с 14 нм потребляет меньше энергии. В случае Polaris AMD использовала оба преимущества, увеличив тактовые частоты и понизив энергопотребление. Так ей удалось превзойти более мощный в плане ресурсов GPU Hawaii сохранив потолок мощности в 150 Вт (хотя наши измерения показывают, что эта цифра немного преуменьшена).

    Несмотря на новое кодовое имя, Polaris 10 основан на архитектуре AMD Graphics Core Next четвёртого поколения. Поэтому строительные блоки процессорного дизайна Polaris многим энтузиастам покажутся знакомыми, а нам будет проще его описать.

    Спецификации

    AMD Radeon RX 480 AMD Radeon R9 390 AMD Radeon R9 290
    Polaris 10 Grenada Pro Hawaii Pro
    Вычислительные блоки (CU) 36 40 40
    Потоковые процессоры 2304 2560 2560
    Тактовая частота (базовая/Boost), МГц 1120/1266 1000 947
    Пиковая скорость вычислений, GFLOPs (при базовой частоте) 5161 5120 4849
    Количество блоков текстур 144 160 160
    Скороть заполнения текстур Гтекс/с 182,3 160 160
    Количество блоков растеризации 32 64 64
    Объем кэша L2, Мбайт 2 1 1
    Скорость передачи данных памяти, Гбит/с 8 (8 Гбайт) / 7 (4 Гбайт) 6 5
    Пропускная способность памяти, Гбайт/с 256 384 320
    Шина памяти, бит 256 512 512
    Тепловой пакет, Вт 150 275 250
    Количество транзисторов, млрд. 5,7 6,2 6,2
    Площадь кристалла, мм2 230 438 438
    Техпроцесс, нм 14 28 28
    Стартовая цена $240 (8 Гбайт) / $200 (4 Гбайт) $330 (8 Гбайт) $400 (4 Гбайт)

    За диспетчеризацию очерёдности графических инструкций в шейдерные блоки (Shader Engine) по-прежнему отвечает один командный процессор (GCP-Graphics Command Processor). Очерёдностью вычислительных инструкций занимаются асинхронные вычислительные блоки (ACE - Asynchronous Compute Engine). Только вместо восьми блоков ACE логика исполнения команд теперь состоит из четырёх ACE и двух аппаратных планировщиков (Hardware Scheduler), выполняющих задачи приоритизации очередей, управления временными/пространственными ресурсами и разгрузки задач планирования драйвера режима ядра ЦП. По сути, это не отдельные или новые блоки, а скорее дополнительный режим, в котором могут работать существующие конвейеры. Дэйв Нэлэско, старший управляющий AMD по технологическим процессам в графике, дал следующий комментарий:

    "HWS (Hardware Workgroup/Wavefront Schedulers) в сущности являются конвейерами ACE без контроллеров диспетчеризации. Их задача заключается в разгрузке ЦП путём управления процессом планирования очередей, заданных пользователем/драйвером, на доступных аппаратных слотах очереди. Это программируемые процессоры с микрокодом, к которым могут применяться различные политики планирования. Мы использовали их, чтобы реализовать функции Quick Response Queue и CU Reservation. Также удалось портировать эти изменения на видеокарты с архитектурой GCN третьего поколения с помощью обновления драйверов."

    Функция Quick Response Queues позволяет разработчикам приоритизировать определённые задачи, которые выполняются асинхронно, не вытесняя другие процессы полностью. Более подробное объяснение можно найти в блоге Дэйва (англ.). Если коротко, AMD хочет добиться гибкости. Её архитектура даёт возможность использовать разные подходы для оптимизации загрузки ресурсов и сведения задержки рендеринга к минимуму, а оба этих фактора крайне важны для приложений виртуальной реальности.

    Хорошо знакомые нам вычислительные блоки CU состоят из 64 шейдерных модулей, совместимых со стандартом IEEE 754-2008, разделённые на четыре векторных модуля, скалярного блока и 16 модулей загрузки/хранения выборки текстуры. Кроме того, в каждый CU входят четыре блока текстурирования, 16 Кбайт кэша L1, 64 Кбайт локального пространства для обмена данными и регистровое пространство для векторных и скалярных единиц. В AMD утверждают, что внесли много корректировок для улучшения эффективности CU, включая добавление поддержки FP16 (и Int16), оптимизацию доступа к кэшу и улучшение упреждающей выборки команд. В совокупности, эти изменения обеспечивают прирост производительности CU до 15% по сравнению с GPU Hawaii (GCN 2-го поколения).

    Девять CU образуют крупный шейдерный блок (SE - Shader Engine). Видеочип Polaris 10 имеет четыре таких SE и нам известно, что это максимум для этой архитектуры. Всего получается 2304 потоковых процессора и 144 блока текстурирования (64 шейдеров х 9 CU х 4 SE).

    Каждый шейдерный блок связан с блоком геометрии (GE - Geometry Engine). По информации AMD, в геометрический блок был добавлен ускоритель отсеивания геометрических примитивов (primitive discard accelerator), он отсеивает простейшие геометрические элементы, которые не растеризуются в пиксель до сканирующего преобразования, таким образом, увеличивается пропускная способность. Это автоматическая функция этапа предварительной растеризации графического конвейера и она является новшеством для Polaris. Кроме того, появился индексный кэш для клонированной геометрии, хотя мы не знаем его объём и степень влияния при клонировании.

    По аналогии с видеочипом Hawaii, процессор Polaris 10 способен отрисовывать четыре простейших элемента за такт. Однако, по сравнению с графическими процессорами Hawaii/Grenada с частотой до 1050 МГц (в случае R9 390X), AMD подняла базовую частоту AMD Radeon RX 480 до 1120 МГц, а частоту в режиме Boost до 1266 МГц. Выходит, что потерю ресурсов на кристалле компания компенсирует повышенной частотой. Производительность вычислений одинарной точности с плавающей запятой у Radeon R9 290X составляет 5,6 TFLOPS, а RX 480 достигает в режиме Boost 5,8 TFLOPS.

    Насколько реальна тактовая частота 1266 МГц? GPU Hawaii с трудом поддерживал указанную в спецификациях частоту, поскольку сильно нагревался, и мы хотели удостовериться, что c Polaris подобного не случится. Используя GPU-Z, мы сняли показания тактовой частоты в интегрированном бенчмарке игры Metro: Last Light Redux, повторённом 10 раз подряд, и получили следующий график:

    Тактовая частота в стресс-тесте – встроенный бенчмарк Metro: Last Light Redux, 10 проходов, МГц

    Разница между верхней (1265 МГц) и нижней (1118 МГц) точками на графике составляет 148 МГц. Можно сказать, что AMD чётко вписывается в указанные лимиты, хотя частота в процессе теста постоянно корректируется. Но, по крайней мере, средний показатель 1208 МГц находится ближе к верхнему значению.

    SE графических процессоров Hawaii и Fiji имеют по четыре бэкэнда рендеринга, способные выводить 16 пикселей за такт (всего 64 пикселей за такт). У Polaris 10 этот компонент урезан наполовину. На каждый SE приходится два бэкэнда рендеринга, каждый с четырьмя блоками ROP, в совокупности они отрисовывают 32 пикселя за такт. Разница с Radeon R9 290 на базе Hawaii весьма существенная. Ситуацию усугубляет 256-разрядная шина памяти Polaris 10, которая вдвое уже шины памяти видеочипа Hawaii (512-бит). Версия AMD Radeon RX 480 4 Гбайт использует память GDDR5 со скоростью передачи данных 7 Гбит/с и имеет пропускную способность 224 Гбайт/с, в то время как модель на 8 Гбайт, которую мы тестируем сегодня, использует память со скоростью передачи данных 8 Гбит/с, и пропускная способность увеличена до 256 Гбайт/с. Но в любом случае, это намного меньше, чем 320 Гбайт/ у R9 290.

    Сокращение аппаратных ресурсов частично компенсируется улучшенной дельта-компрессией цвета, которая сокращает количество передаваемой через шину информации. Также AMD поддерживает сжатие в соотношении 2/4/8:1 без потерь, как и архитектура Nvidia Pascal. Ко всему прочему, Polaris 10 использует кэш L2 объёмом 2 Мбайт, такой же объём использовался в Fiji. Это позволит уменьшить число обращений к памяти GDDR5 и ещё больше снизить зависимость GPU от широкой шины и высокой скорости передачи данных.

    Тем не менее, обеднение бэкэнда GPU должно сказаться на производительности с ростом разрешения и интенсивности применения сглаживания. Нам было интересно, как Polaris будет выглядеть на фоне Hawaii с ростом интенсивности нагрузки. Чтобы это проверить, мы запустили тест Grand Theft Auto V в скромном разрешении 1920x1080 с "Очень Высокими" настройками детализации графики и постепенно увеличивали качество сглаживания.

    На графике хорошо видно, что при изменении сглаживания MSAA с 2х до 4х AMD Radeon RX 480 заметно быстрее теряет среднюю частоту кадров, чем R9 390. При отключённом сглаживании RX 480 достигает 97,3 FPS, а R9 390 – 90,4 FPS . Но к концу графика AMD Radeon RX 480 показала только 57,5 кадров в секунду, в то время как 390-я в среднем выдавала 62,9 кадров в секунду.

    Обзор AMD Radeon RX 480 8GB | Контроллер дисплея, UVD, VCE & WattMan

    Новый контроллер дисплея

    Мы уже рассматривали некоторые усовершенствования контроллера дисплея Polaris в статье "Планы функционального развития GPU AMD в 2016 году" . Но она была опубликована почти семь месяцев назад.

    Тогда нам было известно, что Polaris будет поддерживать интерфейс DisplayPort 1.3 с режимом High Bit Rate 3, используя существующие кабели и разъёмы, чтобы обеспечить скорость передачи до 32,4 Гбит/с через четыре линии. Теперь спецификация контроллера включает стандарт DisplayPort 1.4-HDR. Он не повышает скорость передачи данных, но включает технологию Display Stream Compression 1.2, позволяющий передавать 10-битный 4K-контент с частотой обновления 96 Гц. Также стандарт DisplayPort 1.4 поддерживает цветовое пространство.

    В краткосрочной перспективе AMD всё ещё рассматривает DP 1.3 как инструмент для реализации FreeSync в 4K. По заявлениям компании, панели с частотой обновления 120 Гц будут доступны уже к концу 2016 года, но чтобы добиться хорошей производительности с высокими настройками графики в такой конфигурации, возможностей AMD Radeon RX 480 будет недостаточно. При этом процессорный дизайн Vega с поддержкой HBM2 официально не появится до 2017 года.

    Поддержку HDR в Polaris мы уже обсуждали в конце прошлого года, но AMD повторяет, что конвейер дисплея готов к первому поколению 10-битных дисплеев с HDR, и 12-битных экранов с HDR в будущем. Легкопрограммируемый блок обработки цвета включает повторное наложение цветовой гаммы, управление гаммой, обработку с плавающей запятой и проекцию 1:1 с любым дисплеем.

    Ускорение кодирования/декодирования видео

    В годы расцвета компания ATI была известна производительными и качественными системами ускорения декодирования видео, которые переносили задачи воспроизведения видео с центрального процессора на комбинацию программируемых шейдеров и блоков с фиксированной функцией, установленных в GPU.

    У нас нет подробных данных насчёт того, на каком этапе декодер Polaris выполняет свои задачи, но известно, что он основан на декодере UVD и, по-видимому, имеет фиксированную функциональность. AMD указывает в спецификациях наличие декодирования HEVC в режиме до 4K60 с применением профиля Main 10, который поддерживает формат 10-бит 4:2:0 (всё это необходимо для работы HDR). Есть аппаратная поддержка декодирования стандарта VP9, хотя драйверы AMD её ещё не внедрили, нам лишь известно, что функция запланирована в будущем обновлении. Если AMD хочет реализовать цветовую субдискретизацию HEVC 10-bit/4:2:0 с HDR, потребуется совместимость как минимум с профилем 2. Также предусмотрено аппаратное ускорение формата M-JPEG в режимах до 4K30.

    Развитие кодировщика видео AMD (VCE - Video Coding Engine) также не очень хорошо задокументировано. Известно, что Polaris может кодировать видео в стандарте HEVC 8-бит до 4K60, но GPU на базе архитектуры GCN 1.2 имеют такое же оснащение. Складывается ощущение, что AMD работает над расширением списка совместимых с VCE приложений. Само собой, поддерживается фирменный клиент Gaming Evolved. Но кроме этого, в списках присутствует программа Open Broadcaster Software, которая ранее поддерживала только QuickSync и NVEnc. Также есть Plays.tv – социальная сеть от компании, отвечающей за клиент Gaming Evolved.