Измеряем энергопотребление видеокарт Nvidia — GeForce RTX 3080 Founders Edition
В этой статье будет измерено энергопотребление видеокарты GEFORCE RTX 3080 Founders Edition, видеокарта будет питаться от отдельного блока питания Corsair HX1000i c поддержкой Corsair Link Digital, позволяющей отслеживать параметры электропитания.
реклама
Блок питания CX750 используется для питания материнской платы, процессора, жестких дисков. К блоку питанию HX1000i подключена видеокарта RTX 3080. Видеокарта подключена к блоку питания HX1000i двумя 8-pin PCI-E и одним 6-pin PCI-E, один разъем питания питает видеокарту через Riser, а другие через стандартные разъем на видеокарте.
- Процессор: Intel Core i5-10600K 5 GHz;
- Материнская плата: ASUS PRIME Z490M-PLUS;
- Оперативная память: Team Xtreem 8Pack RAM 4000 MHz (2 x 8GB), TXBD432G4000HC18FQC01 (4000 MHz custom timings);
- Охлаждение: DEEPCOOL Watercooler GAMMAXX L240T WHITE, 2 штуки Gentle Typhoon D1225C12 GT3000-P 0,22 А;
- Корпус: отсутствует;
- Блок питания: Corsair СX750 750 Watt CP-9020015-EU, Corsair HX1000i 1000W CP-9020074-EU;
- Видеокарта: GEFORCE RTX 3080 Founders Edition.
Используемое ПО: HWiNFO64, GenericLogViewer.
реклама
GPU Power [W] – энергопотребление GPU из Hwinfo64 красная линия на графике.
+12V OPwr Supply [W] – энергопотребление на выходе блока питания только по 12 В зеленая линия на графике.
Содержание:
3DMark Time Spy Extreme
Bios 320 Вт
реклама
В первом тестовом отрезке 3DMark Time Spy Extreme получены следующие результаты: GPU Power [W] максимальное энергопотребление 320 Вт, среднее – 302 Вт, а для +12V OPwr Supply [W] максимальное –340 Вт, среднее – 309 Вт. Во втором тестовом отрезке 3DMark Time Spy Extreme получены следующие результаты: GPU Power [W] максимальное – 319 Вт, среднее – 305 Вт, а для +12V OPwr Supply [W] максимальное – 352 Вт, среднее – 311 Вт.
+16% Power Limit 370 Вт
реклама
В первом тестовом отрезке 3DMark Time Spy Extreme получены следующие результаты: GPU Power [W] максимальное энергопотребление 367 Вт, среднее – 339 Вт, а для +12V OPwr Supply [W] максимальное –397 Вт, среднее – 346 Вт. Во втором тестовом отрезке 3DMark Time Spy Extreme получены следующие результаты: GPU Power [W] максимальное – 370 Вт, среднее – 356 Вт, а для +12V OPwr Supply [W] максимальное – 417 Вт, среднее – 364 Вт.
FurMark
FurMark AAx0
Bios 320 Вт
+16% Power Limit 370 Вт
В Furmark AAx0 данные практически совпадают: максимальное значение GPU Power [W] 320 Вт, среднее – 317 Вт, +12V OPwr Supply [W] максимальное – 346 Вт, среднее – 323 Вт. С увеличением лимита на 16% были получены следующие значения энергопотребления: максимальное значение GPU Power [W] 370 Вт, среднее – 365 Вт, +12V OPwr Supply [W] максимальное – 409 Вт, среднее – 374 Вт.
FurMark AAx8
Bios 320 Вт
+16% Power Limit 370 Вт
В Furmark AAx8 данные практически совпадают: максимальное значение GPU Power [W] 320 Вт, среднее – 313 Вт, +12V OPwr Supply [W] максимальное – 340 Вт, среднее – 3203Вт. С увеличением лимита на 16% были получены следующие значения энергопотребления: максимальное значение GPU Power [W] 350 Вт, среднее – 327 Вт, +12V OPwr Supply [W] максимальное – 370 Вт, среднее – 334 Вт.
Company of Heroes 2
1920×1080
Bios 320 Вт
+16% Power Limit 370 Вт
В Company of Heroes 2 1920×1080 энергопотребление видеокарты составило: максимальное значение GPU Power [W] 301 Вт, среднее – 235 Вт, +12V OPwr Supply [W] максимальное – 330 Вт, среднее – 245 Вт. С увеличением лимита на 16% были получены следующие значения энергопотребления: максимальное значение GPU Power [W] 335 Вт, среднее – 252 Вт, +12V OPwr Supply [W] максимальное – 360 Вт, среднее – 260 Вт.
3840×2160
Bios 320 Вт
+16% Power Limit 370 Вт
В Company of Heroes 2 3840×2160 энергопотребление видеокарты составило: максимальное значение GPU Power [W] 318 Вт, среднее – 289 Вт, +12V OPwr Supply [W] максимальное – 364 Вт, среднее – 298 Вт. С увеличением лимита на 16% были получены следующие значения энергопотребления: максимальное значение GPU Power [W] 368 Вт, среднее – 339 Вт, +12V OPwr Supply [W] максимальное – 429 Вт, среднее – 349 Вт.
Обзор и тестирование видеокарты MSI GeForce RTX 3080 Suprim X 12G LHR. Сравнение GeForce RTX 3080 12GB и GeForce RTX 3080 10GB
Недавно компания Nvidia представила обновленную версию GeForce RTX 3080 с увеличенным объемом памяти. Новая видеокарта базируется на знакомом графическом процессоре GA102, но в иной конфигурации. О преимуществах GeForce RTX 3080 12GB поговорим в данном обзоре. Познакомимся с видеокартой GeForce RTX 3080 Suprim X 12G LHR, проверим ее потенциал в номинале и в разгоне, сравним со старой версией GeForce RTX 3080 и Radeon RX 6800 XT.
Стандартная версия GeForce RTX 3080 имеет 68 активных мультипроцессорных блоков SM с 8704 потоковыми ядрами, 272 тензорными ядрами и 68 ядрами RT. Память работает на шине 320 бит, объем памяти 10 гигабайт. Новая версия получила 70 активных SM, что дает 8960 потоковых ядер, 280 тензорных ядер и 70 ядер RT. Шина памяти расширена до 384 бит, что и позволило установить 12 гигабайт памяти. Для обоих вариантов GeForce RTX 3080 установлены идентичные частоты Boost Clock, но базовое значение у новинки ниже. Память GDDR6X работает при частоте обмена данными в 19000 МГц, что идентично другим вариантам серии GeForce RTX 3080. В модельном ряду Nvidia уже есть GeForce RTX 3080 Ti с 384-битной шиной и 12 гигабайтами памяти. При схожей конфигурации памяти старшая версия выигрывает за счет большего числа вычислительных блоков.
Видеоадаптер | GeForce RTX 3080 Ti | GeForce RTX 3080 12GB | GeForce RTX 3080 10GB |
---|---|---|---|
Ядро | GA102 | GA102 | GA102 |
Количество транзисторов, млн. шт | 28000 | 28000 | 28000 |
Техпроцесс, нм | 8 | 8 | 8 |
Площадь ядра, кв. мм | 627 | 627 | 627 |
Количество потоковых процессоров | 10240 | 8960 | 8704 |
Количество тензорных ядер | 320 | 280 | 272 |
Количество ядер RT | 80 | 70 | 68 |
Количество текстурных блоков | 320 | 280 | 272 |
Количество блоков ROP | 112 | 112 | 96 |
Базовая частота ядра, МГц | 1365 | 1260 | 1440 |
Частота Boost, МГц | 1665 | 1710 | 1710 |
Шина памяти, бит | 384 | 384 | 320 |
Тип памяти | GDDR6X | GDDR6X | GDDR6X |
Частота памяти, МГц | 19000 | 19000 | 19000 |
Объём памяти, ГБ | 12 | 12 | 10 |
Поддерживаемая версия DirectX | 12 Ultimate (12_2) | 12 Ultimate (12_2) | 12 Ultimate (12_2) |
Интерфейс | PCI-E 4.0 | PCI-E 4.0 | PCI-E 4.0 |
Мощность, Вт | 350 | 350 | 320 |
Мы познакомимся с новинкой на примере топовой видеокарты MSI из линейки Suprim. Эта модель оснащается мощной системой воздушного охлаждения и работает при повышенных частотах. Сравним ее с предыдущей версией MSI GeForce RTX 3080 Suprim, которая работает при таких же заводских частотах. Это позволит объективно определить преимущества новой конфигурации GPU и памяти у GeForce RTX 3080 12GB.
MSI GeForce RTX 3080 SUPRIM X 12G LHR
Видеоадаптер | MSI GeForce RTX 3080 Suprim X 12G LHR |
---|---|
Ядро | GA102 (LHR) |
Техпроцесс, нм | 8 |
Количество потоковых процессоров | 8960 |
Частота Game Clock, МГц | 1260 |
Частота Boost, МГц | 1890 |
Шина памяти, бит | 384 |
Тип памяти | GDDR6X |
Частота памяти, МГц | 19000 |
Объём памяти, ГБ | 12 |
Поддерживаемая версия DirectX | 12 Ultimate (12_2) |
Интерфейс | PCI-E 4.0 |
Вывод изображения | 3x DisplayPort 1.4a, 2x HDMI 2.1 |
Мощность, Вт | 390 |
Габариты, мм | 336 x 140 x 61 |
Вес, кг | 1,9 |
Средняя стоимость | н/д |
Видеокарта поставляется в большой белой коробке с собственным изображением на лицевой стороне. Вверху есть ручка для переноски.
Стоит отметить богатую комплектацию. В коробке присутствует большой коврик, набор дополнительных инструкций и прочая печатная продукция.
Важным дополнением является регулируемая подпорка. Огромная видеокарта весом в пару килограмм может прогибаться, что приведет к деформации текстолита. И хотя производитель позаботился о жесткости конструкции, обеспечив Suprim бэкплейтом и ребром жесткости, дополнительная опора минимизирует вероятность деформации громоздкого изделия.
Опора имеет регулируемую по высоте «лапку» для поддержки края видеокарты.
Перед нами настоящий графический монстр длиной 32 см, который занимает три слота расширения. Во внешнем дизайне есть определенная преемственность с MSI Gaming, но Suprim выглядит элегантнее.
Массивный радиатор накрыт пластиковым кожухом с металлической вставкой в центре. Вентиляторы вписаны в отверстия восьмиугольного типа. Дополняют дизайн стреловидные элементы корпуса.
Обратная сторона закрыта металлической пластиной. Сбоку есть подсвечиваемый логотип с эмблемой в форме дракона.
В углу расположено три восьмиконтактных разъема питания. Рядом с ними находится небольшой переключатель BIOS для выбора прошивки Gaming или Silent, которые отличаются рабочим режимом вентиляторов. Профиль Silent предусматривает пониженные обороты для меньшего шума.
Вдоль боковой грани тянется большая светодиодная полоса с логотипом Suprim.
Это полноценная RGB-подсветка с возможностью тонкой настройки через приложение MSI Dragon Center. Возможна синхронизация подсветки с другими компонентами MSI.
Чтобы детальнее изучить систему охлаждения TRI FROZR 2S, вначале снимаем бэкплейт. Это жесткая металлическая пластина, которая отводит тепло от горячих участков платы. Для этого предусмотрены термопрокладки в зоне микросхем памяти и под элементами VRM.
Конструкция радиатора осталась без изменений относительно MSI GeForce RTX 3080 Suprim X 10G. Используется единый радиатор для GPU и остальных компонентов на плате. Это массивный блок пластин с крупными контактными площадками внизу. Все элементы тщательно подогнаны друг к другу и имеют защитное никелированное покрытие.
Пластина, которая контактирует с графическим кристаллом, имеет зеркальную полировку. Вокруг этого основания тянется тепловая трубка, которая участвует в отводе тепла от горячих микросхем GDDR6X. По бокам предусмотрены площадки для контакта с транзисторами, дросселями и конденсаторами системы питания.
В конструкции используется семь тепловых трубок. В основании они спрессованы и плотно подогнаны друг к другу благодаря прямоугольной форме.
С внешней стороны на радиатор монтируются три больших вентилятора TorX Fan 4.0.
Диаметр крыльчатки таких вентиляторов 95 мм. Пары изогнутых лопастей соединены внешним полукольцом, что отчасти напоминает дизайн современных вентиляторов в видеокартах ASUS. Используется долговечный шарикоподшипник.
Радиатор состоит из большого количества плотно расположенных пластин. Для лучшего продува этой конструкции предусмотрены особые элементы — волнистые края пластин и направляющие дефлекторы.
MSI GeForce RTX 3080 Suprim X 12G и GeForce RTX 3080 Suprim X 10G используют плату единого дизайна, отличаясь только количеством распаянных микросхем памяти. Плата насчитывает 20 фаз, 16 из которых приходится на систему питания GPU.
Маркировка процессора GA102-220-A1. Он относится к чипам с защитой LHR (Low Hash Rate), которая снижает производительность в майнинге Ethereum. Распаяно 12 микросхем памяти Micron с маркировкой IOT77 D8BWW.
Базовая частота GPU на стандартном уровне в 1260 МГц при среднем Boost Clock 1890 МГц вместо 1710 МГц. Память обходится без разгона, частота обмена данными эквивалентна значению в 19000 МГц. Лимит мощности повышен с 350 Вт до 390 Вт.
Вначале посмотрим на частотные и температурные параметры в режиме Gaming. В большинстве тестов частоты Boost превышали уровень 1900 МГц. В стресс-тесте 3DMark Time Spy в формате 4K частоты варьировались в диапазоне 1905–1920 МГц. В игре Days Gone при формате 4K частоты варьировались в диапазоне 1830–1905 МГц.
Рабочие частоты до 2025 МГц наблюдались только в тестах Forza Horizon 5. Кратковременные пиковые значения Boost могли достигать 2025–2055 МГц.
В играх температура GPU не превышала 71 °C при скорости вентиляторов до 1900 об/мин. Температура самой горячей точки кристалла Hot Spot достигала 78 °C, память прогревалась до 82 °C. Данные показатели получены в открытом корпусе. В условиях летней жары в закрытом корпусе нагрев явно возрастет, но в целом мы имеем хорошие показатели для топового графического ускорителя мощностью 390 Вт.
Переключение на прошивку Silent ограничивает скорость вентиляторов уровнем 1500–1600 об/мин. Температура GPU возрастает до 77 °C.
Качественная PCB и мощное охлаждение обеспечивают высокий разгонный потенциал MSI Suprim. У рассматриваемого экземпляра удалось повысить частоту GPU на 130 МГц при ускорении памяти до 21800 МГц. Лимит мощности повышен до максимума.
В стресс-тесте 3DMark Time Spy частоты были на уровне 2010 МГц. В Days Gone наблюдались просадки до 1900 МГц. В Forza Horizon 5 графический процессор удерживал частоту около 2145 МГц. Пиковые значения Boost до 2175 МГц. Стоит отметить, что память уверенно гналась до 22000 МГц и выше, но в некоторых тестах вместо роста производительности могло наблюдаться падение редких событий 1% low. Поэтому мы остановились на оптимальной для производительности конфигурации GDDR6X с итоговым значением в 21800 МГц.
Охлаждение улучшалось за счет повышения скорости вентиляторов до 2000 об/мин. Видеокарта уверенно прошла все тесты без единого сбоя в таком режиме. При этом рабочие температуры остались на уровне начальных показателей.
Характеристики тестируемых видеокарт
Рассмотренную видеокарту сравним с MSI GeForce RTX 3080 Suprim X 10G. Как уже отмечалось выше, обе модели MSI показывают максимально близкие рабочие частоты в играх. Для наглядности старая версия GeForce RTX 3080 протестирована еще на рекомендованных частотах в качестве аналога простых моделей. Со стороны AMD в тестирование добавлена референсная версия Radeon RX 6800 XT, которая протестирована в номинале и в разгоне.
Видеоадаптер | MSI RTX 3080 Suprim X 12G | MSI RTX 3080 Suprim X 10G | GeForce RTX 3080 10GB | Radeon RX 6800 XT |
---|---|---|---|---|
Ядро | GA102 | GA102 | GA102 | Navi 21 |
Количество транзисторов, млн. шт | 28000 | 28000 | 28000 | 26800 |
Техпроцесс, нм | 8 | 8 | 8 | 7 |
Площадь ядра, кв. мм | 627 | 627 | 627 | 520 |
Количество потоковых процессоров | 8960 | 8704 | 8704 | 4608 |
Количество ядер RT | 70 | 68 | 68 | 72 |
Количество тензорных ядер | 280 | 272 | 272 | – |
Количество текстурных блоков | 280 | 272 | 272 | 288 |
Количество блоков ROP | 112 | 96 | 96 | 128 |
Базовая частота ядра, МГц | 1260 | 1440 | 1440 | 1825 |
Частота Game Clock, МГц | – | – | – | 2015 |
Частота Boost, МГц | 1890 | 1905 | 1710 | 2250 |
Шина памяти, бит | 384 | 320 | 320 | 256 |
Тип памяти | GDDR6X | GDDR6X | GDDR6X | GDDR6 |
Частота памяти, МГц | 19000 | 19000 | 19000 | 16000 |
Объём памяти, ГБ | 12 | 10 | 10 | 16 |
Поддерживаемая версия DirectX | 12 Ultimate (12_2) | 12 Ultimate (12_2) | 12 Ultimate (12_2) | 12 Ultimate (12_2) |
Интерфейс | PCI-E 4.0 | PCI-E 4.0 | PCI-E 4.0 | PCI-E 4.0 |
Мощность, Вт | 370 | 350 | 320 | 300 |
На графиках для GeForce указан полный диапазон частот — от базового до пикового уровня. Для Radeon указан диапазон от Game Clock до максимального значения Boost.
Тестовый стенд
Конфигурация тестового стенда следующая:
- процессор: Intel Core i9-9900K;
- система охлаждения: be quiet! Silent Loop 280mm;
- материнская плата: ASUS ROG Maximus XI Formula;
- память: Kingston Fury Renegade KF436C16RB1K2/32 (DDR4-3600);
- системный диск: Kingston SSDNow UV400 480GB;
- дополнительный диск №1: Kingston A2000 NVMe PCIe 1000GB;
- дополнительный диск №2: Kingston KC2000 NVMe PCIe 1000GB;
- корпус: Antec NX800;
- блок питания: Antec HCG850 Gold;
- монитор: ASUS PB278Q (2560х1440, 27″);
- операционная система: Windows 10 Pro x64;
- драйвер AMD Radeon Adrenalin Edition 22.1.2;
- драйвер NVIDIA GeForce 511.53.
Тестирование проведено по описанное методике с небольшим изменением рабочих режимов в Deathloop и Cyberpunk 2077.
Результаты тестирования
Aliens: Fireteam Elite
В Aliens: Fireteam Elite лидируют видеокарты Nvidia. Разница между двумя вариантами MSI Suprim с заводскими частотами на уровне 4%. Разгон ускоряет героя обзора на 5–7%.
Bright Memory: Infinite
Самая простая версия GeForce RTX 3080 демонстрирует серьезный отрыв от Radeon RX 6800 XT. Разница между двумя версиями GeForce RTX 3080 менее 3%.
Включение трассировки приводит к серьезному падению производительности, что можно компенсировать за счет технологии масштабирования DLSS. Сочетание «лучей» среднего качества и сбалансированного режима DLSS позволяет играть с комфортной частотой кадров, но при качественном режиме DLSS даже старший участник выдает менее 60 кадров. В последнем режиме игра загружает более 10 гигабайт видеопамяти, и мы наблюдаем наибольшую разницу между GeForce RTX 3080 12GB и GeForce RTX 3080 10GB на уровне 10%.
Cyberpunk 2077
Преимущество на стороне решений Nvidia, но даже топовая версия GeForce RTX 3080 не справляется с Cyberpunk 2077 в формате 4K.
Ситуацию можно легко исправить за счет активации DLSS, и тут хватает качественного режима. Разница между GeForce RTX 3080 12GB и GeForce RTX 3080 10GB около 5%.
Дополнительно проведены тесты при выборе стандартного профиля Ultra-качества трассировки лучей. Он предусматривает включение DLSS в режиме Performance.
MSI GeForce RTX 3080 Suprim X 12G демонстрирует хорошие результаты, но качество картинки в таком режиме DLSS заметно хуже полноценного 4K.
Days Gone
Видеоадаптеры Nvidia лидируют в Days Gone, позволяя играть при более высоком fps. Разница между двумя вариантами MSI GeForce RTX 3080 менее 4%.
Deathloop
При максимальных настройках без трассировки обычная версия GeForce RTX 3080 выигрывает у конкурента AMD считанные проценты. Разница между двумя вариантами MSI GeForce RTX 3080 на уровне 5–6%. Разгон обеспечивает дополнительное ускорение в 7%. Загрузка видеопамяти может достигать 9 ГБ.
Активация трассировки для Ambient Occlusion и теней приводит к серьезному падению производительности. У Radeon RX 6800 XT это падение результатов на 30-40%, у GeForce это около 15%. На видеокартах Nvidia вы сможете нормально играть с лучами при полноценном 4K.
Максимальный комфорт обеспечит Nvidia DLSS. В таком режиме можно рассчитывать на 80–90 кадров у тестируемых видеокарт. Разница между GeForce RTX 3080 12GB и GeForce RTX 3080 10GB укладывается в рамки 5%.
Far Cry 6
Вначале сравним результаты видеокарт в Far Cry при стандартных и HD-текстурах.
Во втором режиме резко снижаются показатели 1% Low, но средний fps остается неизменным. Игра легко загружается 11 ГБ видеопамяти во втором режиме. Radeon RX 6800 XT обгоняет старую версию GeForce RTX 3080. Лидирует новая версия MSI Suprim. Разница между GeForce RTX 3080 12GB и GeForce RTX 3080 10GB около 5%.
Далее посмотрим на результаты тестирования при активной трассировке без HD-текстур.
Немного снижается разрыв между Radeon RX 6800 XT и младшей версией GeForce RTX 3080. Разница между моделями MSI на 10 и 12 ГБ при одинаковых заводских частотах не более 4%. Загрузка видеопамяти 10 ГБ.
Farming Simulator 22
Игра не требовательная, легко идет в 4K и на более слабых видеоадаптерах. В номинале лидирует Radeon RX 6800 XT, но MSI GeForce RTX 3080 12GB компенсирует небольшое отставание за счет разгона.
Forza Horizon 5
При настройках Ultra (они же «Очень высоко») младшая версия GeForce RTX 3080 незначительно уступает конкуренту AMD, при максимальном качестве она быстрее. Разница между двумя вариантами MSI с разной памятью на уровне 3–5%.
God of War
Графические ускорители Nvidia показывают лучшие результаты в этой игре. Даже самая простая версия GeForce RTX 3080 способна обеспечить 60 кадров без масштабирования. Активация DLSS поможет повысить производительность до 80 кадров. Преимущество варианта на 12 ГБ относительно товарища с идентичными частотами укладывается в привычные 4%. Детальнее о производительности в игре рассказано в отдельном обзоре.
Horizon Zero Dawn
Тут разница между GeForce RTX 3080 12GB и GeForce RTX 3080 10GB при одинаковых частотах достигает 8%. Игра во время прохождения тестов загружает до 11 ГБ видеопамяти. При этом даже самая простая версия GeForce RTX 3080 обгоняет Radeon RX 6800 XT.
Marvel’s Guardians of the Galaxy
При обычной графике в Guardians of the Galaxy наибольший разрыв между конкурентами Nvidia и AMD по 1% low. По средней частоте Radeon RX 6800 XT незначительно уступает GeForce RTX 3080 10GB. Новая версия GeForce RTX 3080 12GB обходит товарища на 3-4%. Игра загружает менее 7 ГБ в тестовой сцене.
Задействована трассировка высокого уровня для отражений и трассировка для «прозрачных отражений». В таком режиме все участники зеленого лагеря показывают хорошие результаты, а Radeon RX 6800 XT находится ниже приемлемого уровня из-за серьезных просадок fps.
Red Dead Redemption 2
Привычная расстановка сил. Разница между GeForce RTX 3080 12GB и GeForce RTX 3080 10GB при идентичных частотах не более 5%. Radeon RX 6800 XT уступает самой простой версии GeForce RTX 3080 те же 5%.
На видеокартах Nvidia можно дополнительно задействовать технологию DLSS. Качественный режим обеспечивает ускорение до 20% по средней частоте кадров.
Resident Evil Village
Отличные результаты в Resident Evil Village при стандартной графике без трассировки лучей. Старая версия GeForce RTX 3080 слабее Radeon RX 6800 XT. Игра загружает до 10 ГБ в тестовой сцене.
Активация трассировки повышает загрузку видеопамяти. Однако Radeon RX 6800 XT теперь оказывается на последнем месте, уступая GeForce RTX 3080 10GB. Разрыв с новым GeForce RTX 3080 12GB еще больше. MSI GeForce RTX 3080 Suprim X 12G при заводских частотах быстрее разогнанного Radeon на 14–18%.
The Riftbreaker
Еще одна игра с поддержкой трассировки лучей. Вначале посмотрим на производительность с обычной графикой при DirectX 11.
Видеокарты Nvidia привычно обходят конкурента AMD. Разница между GeForce RTX 3080 12GB и GeForce RTX 3080 10GB до 6%.
С включенной трассировкой и масштабированием AMD FSR в режиме максимального качества видеоадаптер AMD немного обходит простую версию GeForce RTX 3080 по средней частоте кадров, но проигрывает по другим показателям. Старший MSI Suprim с повышенными частотами показывает максимальный отрыв от ускоренного Radeon RX 6800 XT по минимальному fps и редким событиям 1% low.
3DMark
Два варианта MSI при заводским частотах показывают разницу в результате почти 6%. Старая версия GeForce RTX 3080 проигрывает Radeon RX 6800 XT.
В бенчмарке Port Royal с трассировкой серьезное преимущество у решений Nvidia. Разница между двумя MSI Suprim менее 4%.
Энергопотребление
Ниже приведены результаты измерений общего энергопотребления системы с разными видеокартами.
Показатели соответствуют заявленным данным по мощности видеокарт. Наибольшее энергопотребление у MSI GeForce RTX 3080 Suprim X 12G. Самым экономичным решением в этом сегменте является Radeon RX 6800 XT.
Выводы
Подведем итоги. При идентичных рабочих частотах новая версия GeForce RTX 3080 12GB показывает преимущество над GeForce RTX 3080 10GB на уровне 3–5%, в отдельных играх до 8-10%. Это ускорение обеспечено иной конфигурацией GPU с увеличенным количеством вычислительных блоков и шиной памяти 384 бита вместо 320 бит у старой версии. Дополнительные два гигабайта пригодятся в тяжелых режимах с трассировкой или с включенными HD-текстурами. Видеокарта принадлежит к линейке LHR, т.е. имеет встроенный ограничитель майнинга Ethereum. Это минимизирует спрос со стороны майнеров и повысит доступность новой модели на рынке. Стоимость безусловно будет высокой, но вряд ли превысит цены на старую версию без ограничений по добыче Ethereum.
Рассмотренная видеокарта MSI GeForce RTX 3080 Suprim X 12G LHR конструктивно идентична предшествующей модели MSI GeForce RTX 3080 Suprim X 10G. Это продукт премиального уровня с качественной платой, мощным охлаждением, подсветкой и хорошим потенциалом для дополнительного разгона. Кулер справляется со своими задачами при довольно низких для такого «монстра» температурах. При скорости вентиляторов в 1900 об/мин видеокарту нельзя назвать тихой, но это справедливо для любой топовой модели, и в рамках воздушного охлаждения вы не найдете лучших вариантов. Требовательный пользователь всегда может выбрать второй BIOS с «тихой» прошивкой. Это мощная видеокарта для тех, кто хочет максимум производительности от GeForce RTX 3080 с качественным охлаждением. И с дополнительным разгоном она будет минимально отличаться от GeForce RTX 3080 Ti.
Специалисты проверили реальное потребление флагманских видеокарт Nvidia
С выпуском каждого поколения процессоров и видеокарт производители улучшают мощностные характеристики продукции, но стараются удержать энергопотребление и нагрев в тех же рамках. Энтузиастам стало интересно, работает ли данное правило по отношению к видеоускорителям 3000 поколения Nvidia, поэтому они сравнили реальное потребление представителей трех поколений с помощью осциллографа.
В тестировании участвовали GTX 1080 Ti, RTX 2080 Ti, RTX 3080 FE и RTX 3080 STRIX от Asus. В качестве графической нагрузки использовали 30 минутный отрезок игры Battlefield V.
Теория о повышении производительности при том же потреблении, кажется, провалилась. От поколения к поколению видеокарты прибавляют до 60 Ватт энергопотребления. При этом разогнанный вариант от Asus накидывает еще 60 Ватт к мощности стоковой RTX 3080 FE.
Подробные графики вовсе говорят о том, что вендорная RTX 3080 в пике потребляет 680 Ватт. Пиковые 56.8 A умножаем на 12 В и получаем 681.6 Ватт.
Стоит указать, что мощность видеокарт замеряли только по линии дополнительного питания, тогда как видеокарта может потреблять еще до 75 Ватт энергии через разъем PCI Express.
Добавляем 75 Ватт с разъема и получаем 755 Ватт! Для сравнения, пиковые показатели GTX 1080 Ti составляют всего 490 Ватт с учетом тока на разъеме PCIe.
То есть, будущая RTX 3080 Ti будет по всем канонам будет требовать еще больше мощности, чем 3080 в разгоне и станет чуть ли не в два раза прожорливее флагмана Pascal. Впрочем, это отражается и на повышенной игровой мощности. Но если говорить об архитектурных улучшениях, то ситуация остается спорной.
Другими словами — любишь играть, люби и киловаттные блоки питания покупать.
Подобрать подходящий для современных видеокарт блок питания можно в каталоге DNS.
Обзор видеоускорителя Nvidia GeForce RTX 3080 с 12 ГБ видеопамяти (на основе карты MSI GeForce RTX 3080 Suprim X 12G)
Казалось бы, компания Nvidia выпустила уже полную линейку видеоускорителей GeForce RTX 30, от RTX 3090 до RTX 3050, и ничего нового в ней уже не должно было появиться, особенно после того, как семейство пополнилось моделями RTX 3070 Ti и RTX 3080 Ti. И новых видеокарт действительно нет. Однако в январе Nvidia тихонько обновила спецификации GeForce RTX 3080 на своем сайте, там появилась модель с 12 ГБ памяти в дополнение к привычному варианту с 10 ГБ. С технической точки зрения, разница между ними заключается в разном объеме памяти, что означает и на 20% более высокую пропускную способность из-за расширенной шины памяти. Сам по себе графический процессор тоже немного отличается, он получил чуть большее количество блоков и поэтому в теории должен быть быстрее на несколько процентов. Но основное изменение — все же видеопамять: больше объем, выше ПСП, иногда это может сказываться в современных играх.
Так что 12-гигабайтный вариант RTX 3080 становится в линейку между RTX 3080 (обычной, с 10 ГБ памяти) и RTX 3080 Ti (а та почти соответствует топовой RTX 3090 по производительности). В целом, это неплохой апгрейд для RTX 3080, но успех видеокарт на рынке сейчас зависит скорее от реальных цен, чем от технических характеристик. Возможно, кто-то скажет, что лучше бы Nvidia решала проблемы с доступностью в продаже оригинальной RTX 3080, у которой и так достаточно видеопамяти. С другой стороны, 10 ГБ для GPU такого уровня — это совсем без запаса.
Зачем такое решение вообще нужно, если даже сама Nvidia не особенно распространялась о выходе новой модели и не давала ее на обзоры? Возможно, выход годных чипов GA102 со временем позволил выпустить такую модификацию. Если у Nvidia накопилось достаточно чипов, в которых работоспособны все контроллеры памяти, но больше четырех блоков SM нерабочие, то эти чипы уже нельзя использовать для RTX 3080 Ti, но можно — для чуть более дорогих карт, чем оригинальная RTX 3080. Ведь модификация графического процессора для модели с 12 ГБ памяти имеет больше активных блоков SM по сравнению с обычной RTX 3080, поэтому ее можно продать подороже.
А что даст новая модификация покупателям, будет ли толк от большего объема видеопамяти и возросшей пропускной способности? Мы даже не говорим об усиленном GPU, ведь он был ускорен совсем чуть-чуть, а партнеры прилично разгоняют видеокарты и так. С точки зрения цены и доступности ничего особенного для рынка новинка не приносит, в североамериканских магазинах оригинальная RTX 3080 продается примерно за $1400, но их уже почти распродали, а RTX 3080 Ti стоит ближе к $2000, и новый вариант с 12 ГБ памяти располагается где-то посередине. Так что покупатель может выбирать из трех вариантов RTX 3080, опираясь на соотношение цен и производительности.
Мы уже рассмотрели несколько видеокарт архитектуры Ampere, основанных на разных модификациях чипа GA102, и сегодня в обзоре один из мощных вариантов, основанных на этом GPU, но имеющем меньшее количество исполнительных блоков по сравнению с модификацией, используемой в RTX 3080 Ti. GPU поддерживает все технологии компании, и модель RTX 3080 с 12 ГБ памяти ничем не отличается от RTX 3090 по своим возможностям.
Основой рассматриваемой сегодня модели видеокарты является топовый графический процессор архитектуры Ampere, о котором мы уже неоднократно писали. Также, архитектура Ampere имеет достаточно много общего с предыдущими архитектурами Turing и Volta, и перед прочтением материала полезно ознакомиться с нашими предыдущими статьями по теме:
- [02.06.21] Nvidia GeForce RTX 3080 Ti: новый лидер, если не брать в расчет GeForce RTX 3090
- [30.09.20] Nvidia GeForce RTX 3090: самое производительное, но не чисто игровое решение
- [18.09.20] Nvidia GeForce RTX 3080, часть 2: описание карты Palit, игровые тесты, выводы
- [16.09.20] Nvidia GeForce RTX 3080, часть 1: теория, архитектура, синтетические тесты
- [19.09.18] Nvidia GeForce RTX 2080 Ti — обзор флагмана 3D-графики 2018 года
- [14.09.18] Игровые видеокарты Nvidia GeForce RTX — первые мысли и впечатления
С одной стороны, имя рассматриваемой сегодня модели осталось неизменным и оно соответствует принципу наименования решений компании — RTX 3080. С другой, это измененная RTX 3080 с 12 ГБ видеопамяти, основанная на графическом процессоре с другими характеристиками, по сравнению с обычной RTX 3080. Выпуск уже третьего варианта RTX 3080 (без LHR, с LHR и с 12 ГБ) приводит к некоей путанице, при этом партнеры пока что продолжают делать 10 ГБ и 12 ГБ варианты (все с LHR, естественно). Можно подумать, что 12 ГБ вариант заменит 10 ГБ, но пока что попадаются оба варианта, так что будьте внимательны.
В отличие от ранних модификаций, для RTX 3080 12 ГБ (мы будем называть ее так) не существует Founders Edition издания самой Nvidia, поэтому и рекомендованной цены на эту модель нет. Но так как она близка по спецификациям к RTX 3080 Ti, то большинство партнеров на североамериканском рынке выставили цены от $1200 и более. В рознице же новинка обычно стоит лишь чуть больше оригинальной модели с 10 ГБ памяти, что хорошо для покупателей. Майнеры гоняются за остатками RTX 3080 не-LHR, и так как RTX 3080 Ti и RTX 3080 12 ГБ в любом случае имеют защиту от майнинга LHR, то они менее интересны майнерам, а вот игроки могут чуть-чуть сэкономить, купив новинку вместо более дорогой RTX 3080 Ti.
По спецификациям это почти RTX 3080 Ti, но именно что почти. Да, у новинки полноценная 384-битная шина памяти и тот же ее объем в 12 ГБ, но вместе с этим и менее мощный GPU при том же энергопотреблении, что и у RTX 3080 Ti. Сами по себе лишние 2 ГБ не так уж и важны, но это дает и прирост в ПСП с 760 ГБ/с до 912 ГБ/с, и это уже приличная разница. Базовая частота у модифицированного GPU относительно низкая, но это не важно, так как в играх она все равно будет работать на турбо-частоте, да и еще более разогнанных версий на рынке достаточно. Что касается преимущества над простой RTX 3080 по вычислительной мощи, то это всего лишь 3%, что заметно медленнее, чем RTX 3080 Ti. Но в реальности, разогнанные варианты RTX 3080 12 ГБ чуть ли не догоняют RTX 3080 Ti по производительности, хотя и имеют меньшее количество исполнительных блоков, зато работают на более высокой частоте.
Что касается конкурентов, то прямым соперником новинки можно назвать видеокарты моделей Radeon RX 6800 XT и RX 6900 XT, имеющие близкую к разным вариантам RTX 3080 12 ГБ цену. В теории решение Nvidia дает больше вычислительной производительности и ПСП, но зато у Radeon еще больший объем видеопамяти с большим кэшем Infinity Cache в 128 МБ, что нивелирует разницу между ПСП для разных типов памяти: GDDR6 и GDDR6X. Но еще важнее преимущество по скорости аппаратной трассировки лучей у GeForce, ведь при включении эффектов, использующих трассировку, производительность Radeon падает куда сильнее. Также у Nvidia есть явное преимущество и в виде поддержки технологии увеличения производительности DLSS, использующей тензорные ядра.
А вот больший объем видеопамяти у решений AMD — 16 ГБ против 12 ГБ — вряд ли принесет им преимущество, и в играх обозримого будущего эта разница вряд ли как-то скажется. В отличие от профессионального применения для создания цифрового контента, для которого у Nvidia есть более мощная RTX 3090 с 24 ГБ памяти, лучше подходящая для профессиональных задач. Так что 12 ГБ в случае обновленной RTX 3080 можно считать оптимальным объемом видеопамяти для игровой видеокарты, с учетом ширины шины.
Любопытно, что уровень потребления энергии у RTX 3080 12 ГБ выставили на уровне старших решений RTX 3080 Ti и RTX 3090 — 350 Вт. И хотя GPU в них используется одинаковый, но разница в количестве активных блоков не в пользу новинки. Зато турбо-частота чипа у новой модификации RTX 3080 повышена, а памяти тут 12 ГБ — возможно, поэтому подняли потребление этой модели до уровня топовых вариантов. Заодно этот лимит не слишком «придушит» новинку, позволив раскрыть все ее возможности.
Партнеры компании, производящие видеокарты, анонсировали и выпустили несколько решений собственного дизайна, включая разогнанные варианты, имеющие довольно массивную систему охлаждения с тремя вентиляторами, отлично подходящую для столь горячего решения. Остается надеяться, что цены на видеокарты будут снижаться и проблема недостаточного объема производства и огромного спроса со стороны геймеров и майнеров все же решится, что вызовет снижение цен.
Архитектурные особенности
Топовый графический процессор GA102, используемый в GeForce RTX 3080 12 ГБ, давно известен нам по моделям RTX 3090 и RTX 3080, просто в этот раз он был урезан по возможностям несколько иначе. Как и все графические процессоры компании Nvidia, чип состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации Raster Operator (ROP) и контроллеры памяти.
Полный чип GA102 содержит семь кластеров GPC и 84 мультипроцессора SM — по 12 штук на каждый кластер. Каждый GPC содержит по шесть кластеров TPC, состоящих из пары мультипроцессоров SM, пары RT-ядер и одного движка PolyMorph Engine для работы с геометрией. И всего полная версия графического процессора GA102 содержит 10752 потоковых CUDA-ядра, 84 RT-ядра второго поколения и 336 тензорных ядер третьего поколения.
Модель GeForce RTX 3080 с 12 ГБ памяти использует урезанный по количеству блоков вариант чипа. Эта модификация получила 70 активных блоков SM — то есть, 7 кластеров TPC и 14 мультипроцессоров SM в нем были отключены. Соответственно, отличается и количество остальных блоков, и такой GPU в итоге имеет 8960 CUDA-ядер, 280 тензорных ядер и 70 RT-ядер. Текстурных блоков в этой модификации 280 штук, а вот количество блоков ROP осталось неизменным — 112. То есть, разница с RTX 3080 Ti довольно существенна, но скорее по вычислительным блокам, а не по подсистеме памяти и ROP.
Подсистема памяти в этой модификации чипа включает нетронутые двенадцать 32-битных контроллеров памяти, что дает нам 384-бит в общем. Каждый 32-битный контроллер связан с разделом кэш-памяти второго уровня объемом в 512 КБ, так что общий объем L2-кэша получается равным 6 МБ. Модификация GeForce RTX 3080 использует 12 ГБ новой GDDR6X-памяти, которая подключена по полной 384-битной шине при рабочей частоте в 9,5(19) ГГц, что дает те же 912 ГБ/с пропускной способности, что и у более дорогой RTX 3080 Ti.
На 384-битную шину можно было поставить 6, 12 или 24 ГБ, и последний вариант используется только топовой картой, так что на эту карту поставили 12 ГБ. Это больше, чем у обычной RTX 3080, но меньше, чем 16 ГБ у конкурента, хотя вряд ли это может вызвать какие-то реальные проблемы для новинки. Даже в 4K-разрешении при максимальных настройках игры до сих пор реально крайне редко требуют большего объема памяти, чем 8 ГБ. Хотя некоторые проекты и могут занимать всю имеющуюся видеопамять, занимая ее своими ресурсами, но производительность видеокарт с меньшим объемом видеопамяти при этом обычно не страдает.
Давайте сравним некоторые теоретические показатели производительности всех моделей GeForce RTX 30, основанных на разных версиях чипа GA102, что позволит наглядно оценить разницу между ними.
RTX 3090 | RTX 3080 Ti | RTX 3080 12 ГБ | RTX 3080 10 ГБ | |
---|---|---|---|---|
CUDA-ядра | 10496 | 10240 | 8960 | 8704 |
Тензорные ядра | 328 | 320 | 280 | 272 |
RT-ядра | 82 | 80 | 70 | 68 |
Базовая частота, ГГц | 1,40 | 1,37 | 1,26 | 1,44 |
Турбо-частота, ГГц | 1,70 | 1,67 | 1,71 | 1,71 |
Объем памяти, ГБ | 24 | 12 | 12 | 10 |
Шина памяти, бит | 384 | 384 | 384 | 320 |
ПСП, ГБ/с | 936 | 912 | 912 | 760 |
Потребление, Вт | 350 | 350 | 350 | 320 |
Если сравнивать две модели RTX 3080 с 10 и 12 ГБ памяти по теоретическим показателям, то видно, что новое решение имеет незначительно большее количество активных CUDA-ядер, и обеспечивает совсем небольшой прирост в скорости вычислений. А вот по ПСП разница приличная. Флагманскую RTX 3090 можно не рассматривать, а вот RTX 3080 Ti имеет те же характеристики по объему памяти и ПСП, но GPU там установлен явно побыстрее. Впрочем, мы не уверены, что стоило так сильно сегментировать линейку видеокарт в принципе, ведь разница между всеми тремя RTX 3080 по таблице не столь уж велика, а в реальности разброс будет еще меньше.
Рассматривать в очередной раз все архитектурные улучшения Ampere мы не будем, все уже было написано в теоретическом материале по GeForce RTX 3080. Основным нововведением Ampere является удвоение FP32-производительности для каждого мультипроцессора SM, по сравнению с семейством Turing, что привело к значительному повышению пиковой производительности. Почти то же самое касается и RT-ядер — хотя их число и не изменилось, внутренние улучшения привели к удвоению темпа поиска пересечений лучей с геометрией. Улучшенные тензорные ядра хоть и не увеличили производительность при обычных условиях, но темп таких вычислений удвоился, а также появилась возможность удвоения скорости обработки так называемых разреженных матриц.
Добавим немного информации о поддержке стандарта вывода изображения HDMI 2.1 и аппаратного декодирования видеоданных в формате AV1. Они поддерживаются всей серией GeForce RTX 30, включая и новую RTX 3080 12 ГБ, естественно. Разъемы стандарта HDMI 2.1 позволяют подключить устройства с 4K-разрешением и частотой обновления в 120 Гц или 8K с 60 Гц, а аппаратный декодер AV1 обеспечивает просмотр онлайн-видео в лучшем качестве, по сравнению с известными форматами, вроде H.264, HEVC и VP9.
Как и другие решения линейки, модель GeForce RTX 3080 12 ГБ поддерживает все полезные технологии компании Nvidia, такие как RTX, DLSS, Reflex и Broadcast. Также важно, что видеокарты семейства GeForce RTX 30 используются не только в играх и майнинге, но и при создании различного контента. Многие профессионалы используют эти GPU для ускорения своих задач при редактировании видео и фото, при создании 3D-анимации, рендеринге в реальном времени в таких средах, как Nvidia Omniverse или Unreal Engine.
Новая модификация GeForce RTX 3080 отлично подходит для таких задач, так как она имеет 12 ГБ быстрой GDDR6X-памяти на борту, что на 20% больше, чем у обычной RTX 3080 — это дает возможность увеличить разрешение текстур, сложность 3D-сцен и т. д. Больший объем видеопамяти позволяет работать с большим массивом данных одновременно, и объем VRAM весьма важен для профессиональных применений.
Особенности карты MSI GeForce RTX 3080 Suprim X 12G 12 ГБ
Сведения о производителе: Компания MSI (MicroStar International, торговая марка MSI) основана в 1986 году в Китайской Республике (Тайвань). Выпускала ОЕМ-продукцию по сторонним заказам. Выпуск продуктов под своим брендом был начат только с 1994 года. Штаб-квартира в Тайбэе/Тайвань. Производство в Китае и на Тайване. 50% продукции — по заказам сторонних компаний (ОЕМ). На рынке в России с 1997 года.
Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) MSI GeForce RTX 3080 Suprim X 12G 12 ГБ 384-битной GDDR6X
MSI GeForce RTX 3080 Suprim X 12G 12 ГБ 384-битной GDDR6X | ||
---|---|---|
Параметр | Значение | Номинальное значение (референс) |
GPU | GeForce RTX 3080 | |
Интерфейс | PCI Express x16 4.0 | |
Частота работы GPU (ROPs), МГц | BIOS Gaming: 1890(Boost)—2055(Max) BIOS Silent: 1890(Boost)—2040(Max) |
1710(Boost)—1965(Max) |
Частота работы памяти (физическая (эффективная)), МГц | 4750 (19000) | 4750 (19000) |
Ширина шины обмена с памятью, бит | 384 | |
Число вычислительных блоков в GPU | 70 | |
Число операций (ALU/CUDA) в блоке | 128 | |
Суммарное количество блоков ALU/CUDA | 8960 | |
Число блоков текстурирования (BLF/TLF/ANIS) | 280 | |
Число блоков растеризации (ROP) | 112 | |
Число блоков Ray Tracing | 70 | |
Число тензорных блоков | 280 | |
Размеры, мм | 340×140×60 | 285×100×37 |
Количество слотов в системном блоке, занимаемые видеокартой | 3 | 2 |
Цвет текстолита | черный | черный |
Энергопотребление пиковое в 3D, Вт (BIOS Gaming/BIOS Silent) | 388/380 | 352 |
Энергопотребление в режиме 2D, Вт | 35 | 35 |
Энергопотребление в режиме «сна», Вт | 11 | 11 |
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS Gaming/BIOS Silent) | 34/26,6 | 41,0 |
Уровень шума в 2D (просмотр видео), дБА | 18,0 | 18,0 |
Уровень шума в 2D (в простое), дБА | 18,0 | 18,0 |
Видеовыходы | 1×HDMI 2.1, 3×DisplayPort 1.4a | 1×HDMI 2.1, 3×DisplayPort 1.4a |
Поддержка многопроцессорной работы | нет | |
Максимальное количество приемников/мониторов для одновременного вывода изображения | 4 | 4 |
Питание: 8-контактные разъемы | 3 | 1 (12-контактный) |
Питание: 6-контактные разъемы | 0 | 0 |
Максимальное разрешение/частота, DisplayPort | 3840×2160@120 Гц, 7680×4320@60 Гц | |
Максимальное разрешение/частота, HDMI | 3840×2160@120 Гц, 7680×4320@60 Гц | |
Средняя цена карты MSI | примерно 165 000 рублей на момент написания материала |
Память
Карта имеет 12 ГБ памяти GDDR6X SDRAM, размещенной в 12 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6X, MT61K256M32JE-19G / D8BWW) рассчитаны на номинальную частоту работы в 4750 (19000) МГц.
Особенности карты и сравнение с Nvidia GeForce RTX 3080 Ti FE
MSI GeForce RTX 3080 Suprim X 12G (12 ГБ) | Nvidia GeForce RTX 3080 Ti FE (12 ГБ) |
---|---|
вид спереди | |
вид сзади | |
Еще больше года назад, по первым экземплярам RTX 3080/3090 новой серии MSI Suprim можно было понять, что инженеры MSI создали собственную PCB, которая лишь в самых общих чертах базируется на эталонном дизайне, и при этом плата получилась намного более габаритной, нежели референс-аналог. Если обратить внимание на обилие пустых мест на печатной плате, то становится очевидно, что такое решение было принято из-за очень громоздкой СО, которая не рассчитана на сквозной продув и требует большого числа точек крепления к PCB.
Мы сравниваем карту MSI с референс-продуктом на базе RTX 3080 Ti по двум причинам: во-первых, эталонной карты Nvidia на базе RTX 3080 12 ГБ никто из медиасообщества не получал, да ее и просто не существует; во-вторых, наиболее близкой к «новому» RTX 3080 оказалась карта на базе RTX 3080 Ti ввиду таких же объема памяти и шины обмена с памятью в 384 бит. Кстати, по первой фотографии в начале статьи можно оценить различие габаритов у карты MSI и Nvidia GeForce RTX 3080 Ti FE. Просто как монстр и карлик, при этом вторая карта даже мощнее.
Мы видим, что ядро имеет маркировку GA102-220, при этом «20» означает наличие защиты от майнинга LHR.
Суммарное количество фаз питания у GeForce RTX 3080 Ti FE — 18, а у карты MSI — 20. При этом распределение фаз такое: у GeForce RTX 3080 Ti FE — 15 фаз на ядро и 3 на микросхемы памяти, а у карты MSI — 16+4.
Зеленым цветом отмечена схема питания ядра, красным — памяти. При этом удвоителей (даблеров) фаз нет (не только у матплат, но и у видеокарт подобные схемы встречались), для управления схемой питания GPU используются два ШИМ-контроллера uP9512R (uPI Semiconductor), расположенные на оборотной стороне платы.
На лицевой стороне имеется ШИМ-контроллер NCP81611 (On Semiconductor), который управляет 4-фазной схемой питания микросхем памяти.
В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае NCP302150 (On Semiconductor), каждая из которых рассчитана максимально на 50 А.
На обеих сторонах платы имеется по одному контроллеру uS5650Q (uPI Semiconductor), которые отвечают за мониторинг карты (отслеживание напряжений и температуры).
А подсветкой управляет отдельный контроллер ITE8295FN (ITE Tech).
Карта имеет два режима работы, они заложены в двух вариантах BIOS, которые переключаются на верхнем торце карты: Gaming и Silent. Разница между режимами заключается лишь в оборотах вентиляторов, а Boost-частоты GPU и частоты памяти одинаковые.
Штатные частоты памяти у карты MSI равны референсным значениям, а вот Boost-значение частоты работы ядра увеличено почти на 10% относительно референс-значения, при этом максимальная частота GPU выше референс-аналога уже только на 5%. Энергопотребление карты MSI в тестах доходило до 388 Вт. Исследования показали, что в среднем мы получили в играх прирост производительности в 5,4% относительно референс-карты. Драйвера Nvidia не позволяют поднять лимит потребления (ведь надо еще продавать более дорогие решения типа RTX 3080 Ti), так что подъем частот происходит лишь короткими всплесками, и производительность в реальности выросла мало. У карты MSI есть еще дополнительный режим Extreme, активируемый через программу MSI Center (о ней ниже), в нем Boost-частота ядра поднимается на 11% относительно референсной, а максимум остается примерно таким же. Но в итоге этот режим обеспечивает в играх прирост производительности около 5,5%, то есть разницы с двумя другими режимами на деле нет.
Я попробовал ручной разгон, однако поскольку предел потребления поднять нельзя, драйверы не позволили достичь заданного уровня. При попытке выставить +100 МГц по ядру и +1100 МГц по памяти я получил максимальные частоты 2055/21000 МГц (то есть максимум по частоте ядра остался тем же, разгон возможен только по памяти), что обеспечило прирост в играх в разрешении 4К в среднем почти на 6% относительно референсных значений. Энергопотребление карты выросло до 392 Вт.
Питание на карту MSI подается через три 8-контактных разъема.
Управление работой карты обеспечивается с помощью фирменной утилиты MSI Center. Эта программа является универсальным средством для огромного ассортимента продуктов MSI, включая не только видеокарты и материнские платы, но также СЖО и ноутбуки.
MSI Center включает в себя целый десяток утилит
Имеется вкладка мониторинга состояния
Кроме режимов, включаемых выбором одного из вариантов BIOS, есть и дополнительные: легкий авторазгон и более тихий режим
Возможность управления вентиляторами (требуется первоначальное тестирование)
В цепом MSI Center является очень мощным универсальным инструментом, нарекания имеются лишь на процесс установки: во-первых, требуется запуск установки от имени администратора, во-вторых, в процессе установки ряда встроенных в MSI Center утилит типа Mystic Light безо всяких оповещений и подготовки пользователя происходит перезагрузка системы, что может повлечь потерю каких-либо данных, если на тот момент параллельно были открыты какие-то еще программы, а как итог — Mystic Light не работает, и ее надо переустанавливать). Эти нарекания имеются уже давно, и странно, что смена версий MSI Center не устраняет этих проблем.
Для небольшого ускорения игровой производительности есть универсальный игровой режим
Нагрев и охлаждение
При выпуске поколения RTX 30 в Nvidia решили сделать у карт GeForce RTX 3080/3090 более компактную PCB и придумали новую систему охлаждения, продувающую радиатор насквозь (при этом частично оставляющую нагретый воздух в объеме корпуса). Однако в MSI пошли традиционным путем: сделали очень длинную PCB и установили кулер стандартной конструкции. Основой кулера является огромный двухсекционный пластинчатый никелированный радиатор с тепловыми трубками, припаянными к никелированной же подошве, контактирующей с GPU. Форма ребер и концевые направляющие помогают рассеивать потоки нагретого воздуха.
Микросхемы памяти частично охлаждаются основной подошвой, а частично — отдельной тепловой трубкой, идущей вокруг центральной подошвы. Преобразователи питания VRM охлаждаются с помощью отдельных подошв на основном радиаторе (одна из этих пластин служит еще и ребром жесткости).
Задняя пластина служит не только элементом защиты PCB, но и участвует в охлаждении оборотной стороны платы через термоинтерфейс. Следует отметить, что из-за возросшей площади кристалла GPU стали применять «четырехлапый» прижим-амортизатор, который помогает равномерно распределять прижим подошвы радиатора по всей площади кристалла.
Поверх радиатора установлен кожух с тремя вентиляторами ∅95 мм типа Torx 4.0, имеющими особый дизайн лопастей (соединенных попарно) для усиления потока воздуха, направленного на радиатор.
Остановка вентиляторов при малой нагрузке видеокарты происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти — ниже 80 градусов. Разумеется, СО при этом становится бесшумной. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются. Ниже есть видеоролик на эту тему.
Мониторинг температурного режима с помощью MSI Afterburner:
Режим Gaming mode:
После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 69 градусов, а температура микросхем памяти — 85 градусов, что является очень хорошим результатом для видеокарт флагманского уровня. Энергопотребление карты доходило до 388 Вт. Напомним, что безопасный предел нагрева памяти GDDR6X — 105 °C.
Режим Silent mode:
В этом случае максимальная температура ядра достигала 77 градусов, а микросхем памяти — 89 °C, что, в принципе, является приемлемым результатом для видеокарт такого уровня. Энергопотребление карты практически не изменилось (380 Вт).
При ручном разгоне (режим Gaming) параметры нагрева и шума менялись очень мало, максимальное потребление выросло лишь до 392 Вт.
Мы засняли и ускорили в 50 раз 8-минутный прогрев (Gaming mode):
Максимальный нагрев наблюдался в центральной части PCB, в основном около ядра.
Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.
- Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
- Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
- Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark
Оценка градаций уровня шума следующая:
- менее 20 дБА: условно бесшумно
- от 20 до 25 дБА: очень тихо
- от 25 до 30 дБА: тихо
- от 30 до 35 дБА: отчетливо слышно
- от 35 до 40 дБА: громко, но терпимо
- выше 40 дБА: очень громко
В режиме простоя в 2D в обоих режимах Gaming/Silent температура была не выше 40 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.
При просмотре фильма с аппаратным декодированием ничего не менялось.
Режим BIOS: Gaming
В режиме максимальной нагрузки в 3D температура достигала 69/85 °C (ядро/память). Вентиляторы при этом раскручивались до 1820 оборотов в минуту, шум вырастал до 34 дБА: это отчетливо слышно. В видеоролике ниже можно оценить, как вырастает шум (он фиксировался на пару секунд через каждые 30 секунд).
Режим BIOS: Silent
В режиме максимальной нагрузки в 3D температура достигала 77/89 °C (ядро/память). Вентиляторы при этом раскручивались лишь до 1520 оборотов в минуту, шум вырастал до 26,6 дБА: это уже тихо. В видеоролике ниже это продемонстрировано (шум фиксировался на пару секунд через каждые 30 секунд).
С учетом того, сколько данная карта потребляет, столь тихая работа системы охлаждения в режиме Silent заслуживает похвалы. Правда, не стоит забывать, что тепло, выделяемое картой, остается внутри системного блока, так что использование корпуса с хорошей вентиляцией крайне желательно.
Подсветка
Подсветка у карты реализована в ломаных полосах вдоль верхнего торца карты, логотипах на том же торце, а также вставках между вентиляторами и на логотипе с оборотной стороны карты. Подсветка явно предназначена в первую очередь для тех, кто использует видеокарту в традиционной горизонтальной ориентации (вставленной в слот на материнской плате).
Управление подсветкой выполнено с помощью MSI Center (утилита Mystic Light).
Выбор режимов очень широк (это традиционно для карт MSI).
Комплект поставки и упаковка
Комплект поставки, кроме традиционного руководства пользователя и бонусных стикеров, включает разборную металлическую подставку-штатив под карту и фирменный коврик для мыши.
Мы помним, что раньше компания MSI со своими массивными топовыми видеокартами поставляла металлические кронштейны, а теперь было решено изменить вид подставки на штатив, упирающийся в дно корпуса.
Понятно, что подставка легко регулируется по высоте, так что можно подобрать нужный вариант (в ролике ниже этому уделено внимание). Такой вариант опоры не перекрывает слоты ниже видеокарты в системном блоке. Однако не всегда прямо под видеокартой имеется открытое пустое пространство на дне корпуса для установки такой подставки-штатива (корпуса сейчас делают очень разные). Да и в случае переноски системного блока, скорее всего, придется демонтировать подставку.
Коврик для мыши в качестве бонуса — очень приятный и удобный в работе.
Тестирование: синтетические тесты
Конфигурация тестового стенда
- Компьютер на базе процессора AMD Ryzen 9 5950X (Socket AM4):
- Платформа:
- процессор AMD Ryzen 9 5950X (разгон до 4,6 ГГц по всем ядрам);
- ЖСО Cougar Helor 240;
- системная плата Asus ROG Crosshair Dark Hero на чипсете AMD X570;
- оперативная память TeamGroup T-Force Xtreem ARGB (TF10D48G4000HC18JBK) 32 ГБ (4×8) DDR4 (4000 МГц);
- SSD Intel 760p NVMe 1 ТБ PCI-E;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
- блок питания Seasonic Prime 1300 W Platinum (1300 Вт);
- корпус Thermaltake Level20 XT;
Мы провели тестирование новой модели видеокарты со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.
Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько разнообразных тестов для измерения производительности трассировки лучей, программной и аппаратной. В качестве полусинтетических тестов у нас также используется набор подтестов из довольно популярного пакета 3DMark: Time Spy, Port Royal, DX Raytracing и др.
Синтетические тесты проводились на следующих видеокартах:
- GeForce RTX 3080 12 ГБ со стандартными параметрами (RTX 3080 12 ГБ)
- GeForce RTX 3090 со стандартными параметрами (RTX 3090)
- GeForce RTX 3080 Ti со стандартными параметрами (RTX 3080 Ti)
- GeForce RTX 3080 со стандартными параметрами (RTX 3080)
- Radeon RX 6900 XT со стандартными параметрами (RX 6900 XT)
- Radeon RX 6800 XT со стандартными параметрами (RX 6800 XT)
Для анализа производительности новой видеокарты GeForce RTX 3080 12 ГБ, мы выбрали несколько видеокарт компании Nvidia из текущего поколения. В частности, это модели RTX 3080, RTX 3080 Ti и RTX 3090, которые основаны на одном и том же графическом процессоре и находятся в современной линейке ниже и выше новинки — посмотрим, насколько отличается производительность варианта RTX 3080 с 12 ГБ памяти относительно них.
Соперниками для новинки у компании AMD можно назвать пару видеокарт, также основанных на одном и том же GPU. Главным конкурентом для GeForce RTX 3080 12 ГБ является все же Radeon RX 6900 XT, имеющий близкую розничную цену, но мы также добавили в некоторые тесты и результаты Radeon RX 6800 XT, чтобы посмотреть, насколько все они далеки друг от друга. По цене же к новинке Nvidia близок скорее все же наиболее производительный графический процессор архитектуры RDNA второго поколения, поэтому сравниваем в основном с RX 6900 XT.
Мы традиционно рассматриваем устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы.
Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя иногда они все же получаются несколько заниженными для некоторых GPU. Урезанная версия GA102 в исполнении RTX 3080 12 ГБ имеет достаточно большое количество текстурных модулей и вполне ожидаемо находится между RTX 3080 и RTX 3080 Ti на диаграмме.
Сравнение новинки с единственным конкурентом компании AMD повторяет предыдущие сражения, начиная с RTX 3090 против RX 6900 XT. Скорость текстурирования у нового семейства Radeon весьма высока — из-за большого количества текстурных блоков. С количеством TMU в архитектуре RDNA 2 все отлично, и Radeon имеют большее количество блоков текстурирования и справляются лучше видеокарт конкурента с аналогичным ценовым позиционированием в таких тестах. Сегодняшняя новинка в этом тесте далека от RX 6900 XT, ставшего единоличным лидером.
Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.
Результаты второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP, но в этом случае разница между всеми GeForce получилась странной, как будто дело не в скорости ROP и не в ПСП. RTX 3080 12 ГБ находится между RTX 3080 Ti и RTX 3080, но ближе к последней. А так как блоков ROP в этой модификации GA102 столько же, что и у RTX 3080 Ti, то новинка должна быть как минимум наравне с ней, но нет.
А вот единственный Radeon показал отличную производительность и в этот раз, снова обогнав все представленные GeForce. Видеокарты компании Nvidia по пиковой скорости заполнения сцены почти всегда были не так хороши, и GeForce RTX 3080 12 ГБ ожидаемо уступает Radeon RX 6900 XT.
Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нем часто неплохо коррелируют с тем, что получается в игровых тестах.
Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель GeForce RTX 3080 12 ГБ показала вполне ожидаемый результат ближе к уровню RTX 3080, чем к RTX 3080 Ti, так как она уступает последней по скорости вычислений, а ПСП тут не влияет. Новинка снова заметно медленнее единственного соперника в виде Radeon RX 6900 XT — графические процессоры AMD в этом тесте всегда были сильны, и неудивительно, что их решение оказалось быстрее.
Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы давно уже получаем явно некорректные результаты в этом тесте, поэтому учитывать результаты всех видеокарт GeForce тут просто нет смысла, они просто неверны. И модель RTX 3080 с 12 ГБ памяти ничего не изменила, так как дело в драйверах, которые одинаковы для всех GPU — никто уже не оптимизирует их для столь древнего тестового пакета.
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты, но они хотя бы чуть ближе к правде, чем в прошлом подтесте этого же бенчмарка. Представленные видеокарты Nvidia и в этот раз необъяснимо медленны, и явным лидером тут снова является топовая видеокарта Radeon семейства RX 6000. Рассматриваемая сегодня RTX 3080 12 ГБ выступила на уровне своих сестер на основе архитектуры Ampere. Впрочем, их результаты некорректны и в этом случае.
Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она обычно близка к пиковой производительности видеочипов в предельных задачах. В тесте используются операции с плавающей запятой, и новая архитектура Ampere должна бы раскрыть свои уникальные возможности, но тест слишком устарел и не показывает современные GPU с лучшей стороны.
Рассматриваемая новинка показала ожидаемый результат между RTX 3080 и RTX 3080 Ti, как мы и ожидали, так что ничего нового. Но современное решение компании AMD на основе архитектуры RDNA 2 в этом тесте выступило еще лучше, RX 6900 XT почти достала RTX 3080 Ti, обогнав новую RTX 3080 с увеличенным объемом VRAM. Далее мы рассмотрим более современные тесты, использующие повышенную нагрузку на GPU.
Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.
В первом Direct3D11-тесте новая GeForce RTX 3080 12 ГБ показала скорость ближе к RTX 3080 10 ГБ, а от RTX 3080 Ti они обе отстали. Ну а Radeon RX 6900 XT выступила еще сильнее, опередив вообще все карты Nvidia. Правда, по опыту предыдущих тестов мы знаем, что GeForce в этом тесте выступают не очень хорошо. Да и, судя по крайне высокой частоте кадров, вычисления в этом примере из SDK уже слишком просты для мощных видеокарт, и лучше рассматривать другие тесты.
Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.
Производительность рендеринга в этом тесте больше всего зависит от оптимизации драйвера и командного процессора GPU. С ними дела неплохо обстоят у решений Nvidia, но видеокарты семейств RDNA 1 и 2 заметно улучшили позиции конкурирующей компании, особенно мощнейшая Radeon RX 6900 XT, ставшая лидером сегодняшнего сравнения. Если рассматривать RTX 3080 12 ГБ по сравнению с другими решениями на том же чипе, то она расположилась ровно там, где мы и ожидали — между RTX 3080 и RTX 3080 Ti.
Третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно любопытный. При тестировании мы использовали настройки по умолчанию.
Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Новая видеокарта GeForce RTX 3080 12 ГБ показала ожидаемый результат близко к показателям соседних по линейке RTX 3080 и RTX 3080 Ti, так что ничего нового . Единственная карта Radeon, представленная в нашем сравнении, в этот раз оказалась далеко позади. Хотя и в этом тесте частота кадров излишне высока — очередная задача является слишком простой, особенно для высокопроизводительных современных GPU.
Переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.
Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Ampere. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.
Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU в целочисленных вычислениях. Решения Nvidia лучше справляются с такими операциями, и новая GeForce RTX 3080 с 12 ГБ памяти почти не отстала от RTX 3080 Ti, также к ним очень близка и RTX 3080. А вот единственная видеокарта Radeon модели RX 6900 XT оказалась почти вдвое медленнее всех GeForce — вероятнее всего, дело в недостатке программной оптимизации в драйверах.
Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1 048 576 штук.
В этом тесте видеокарты Nvidia также всегда доминировали, и сегодняшний расклад сил это подтверждает. Производительность в тесте зависит от драйвера, командного процессора и мультипроцессоров GPU. Наш предыдущий опыт говорит также о влиянии программной оптимизации драйвера на результаты теста, и в этом смысле видеокартам AMD похвастать обычно нечем, включая и новые решения архитектуры RDNA 2 — даже мощнейшая RX 6900 XT далека от всех видеокарт Nvidia. Рассматриваемая же сегодня GeForce RTX 3080 12 ГБ справилась с задачей почти на уровне более дорогой RTX 3080 Ti, да и RTX 3080 от них отстала совсем немного.
Последний пример с поддержкой D3D12 — известный тест nBody Gravity. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10 000 до 64 000.
По количеству кадров в секунду видно, что эта вычислительная задача довольно сложна, хотя современные GPU справляются с ней заметно легче предыдущих поколений. Сегодняшняя новинка GeForce RTX 3080 12 ГБ, основанная на урезанной версии топового графического процессора GA102, показала ожидаемый результат между RTX 3080 и RTX 3080 Ti. Единственная Radeon в этой задаче явно не раскрыла свои возможности и сильно проиграла — под этот набор тестов драйверы AMD явно плохо оптимизированы.
В качестве дополнительного вычислительного теста с поддержкой Direct3D12 мы взяли известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Для верности мы протестировали видеокарты сразу в двух графических тестах.
Если рассматривать производительность новой модели GeForce RTX 3080 12 ГБ в этой задаче по сравнению с близкими видеокартами на основе того же чипа, то новинка находится примерно посередине между RTX 3080 и RTX 3080 Ti, как и должна по теории. Сравнение с Radeon RX 6900 XT показывает, что их результаты весьма близки, что делает дальнейшее игровое тестирование интересным. Возможно, все GPU тут ограничивает сравнительно низкое тестовое разрешение 2560×1440, выбранное нами несколько лет назад.
Одним из первых тестов производительности трассировки лучей стал бенчмарк Port Royal создателей известных тестов серии 3DMark. Этот тест работает на всех графических процессорах с поддержкой DirectX Raytracing API. Мы проверили несколько видеокарт в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей в двух режимах, а также традиционным для растеризации методом.
Бенчмарк показывает сразу несколько новых возможностей применения трассировки лучей через DXR API, в нем используются алгоритмы отрисовки отражений и теней с применением трассировки, но тест в целом не слишком хорошо оптимизирован и очень сильно загружает в том числе и мощные GPU. Но для сравнения производительности разных GPU в этой конкретной задаче тест отлично подходит.
Тест хорошо показывает разницу в подходах компаний AMD и Nvidia к поддержке аппаратного ускорения трассировки лучей. Рассматриваемая сегодня модель RTX 3080 12 ГБ немного проигрывает RTX 3080 Ti, как и должно быть по большинству теоретических показателей, хотя разница между этими моделями при включении трассировки лучей большей сложности почему-то увеличилась. Впрочем, неудивительно, что новинка ближе к RTX 3080, чем к RTX 3080 Ti. А вот конкурент в лице RX 6900 XT тут явно отстает, особенно в сложных условиях — мы давно знаем, что трассировка лучей в его исполнении менее эффективна.
Позднее вышел еще один подтест 3DMark, направленный на тестирование производительности трассировки лучей — DirectX Raytracing. В отличие от предыдущего, он не гибридный, и не использует растеризацию вовсе, а только трассировку лучей, поэтому гораздо лучше отражает скорость GPU именно по возможностям аппаратного ускорения трассировки. Сцена в бенчмарке используется уже известная нам по другим подтестам 3DMark, и она довольно небольшая — BVH-структура в теории может поместиться в Infinity Cache, что может помочь новым видеокартам серии Radeon RX 6000.
Новая модель GeForce RTX 3080 12 ГБ снова показывает результат между RTX 3080 и RTX 3080 Ti на том же чипе, но с разной степенью урезанности. Что касается условных конкурентов AMD, то даже RX 6900 XT уступает новинке чуть ли не вдвое, не говоря про младшую модель. Соперничать с RTX 3080 12 ГБ в таких задачах решения AMD вряд ли смогут. Выделенные RT-ядра Nvidia, использующие модель MIMD, выполняют заметно большую часть работы и более универсальны, они не теряют в производительности при включении трассировки так сильно, как ядра Ray Accelerator + обычные SIMD-ядра у решений AMD.
Переходим к полусинтетическим бенчмаркам, которые сделаны на игровых движках, и соответствующие проекты должны выйти в скором времени. Первым тестом стал Boundary — один из китайских игровых проектов с поддержкой DXR и DLSS. Это бенчмарк с очень серьезной нагрузкой на GPU, трассировка лучей в нем используется весьма активно — и для сложных отражений с несколькими отскоками луча, и для мягких теней, и для глобального освещения. Также в тесте используется технология DLSS, качество которой можно настраивать, и мы протестировали два варианта — без DLSS, чтобы сравнить с AMD Radeon, и с максимально возможным качеством для DLSS.
Без включения DLSS даже в Full HD-разрешении приемлемо работают только мощные видеокарты серии GeForce RTX 30, а карты RX 6000 сильно отстают от них, ну а 4K-разрешение без масштабирования неиграбельно вообще, даже на RTX 3090. Новая модель RTX 3080 12 ГБ снова где-то между RTX 3080 и RTX 3080 Ti, что вполне объяснимо. Новинка лишь чуть-чуть опережает RTX 3080, и разница в объеме памяти и ПСП почти не сказывается. Результаты единственной карты Radeon вновь показали, что в тестах трассировки лучей они не могут конкурировать с GPU Nvidia. Тем более, что у последних есть еще и поддержка DLSS:
В 4K-разрешении старшие видеокарты линейки RTX 30 вполне обеспечивают приемлемую частоту кадров с DLSS, хотя в реальных условиях можно использовать и менее качественный вариант этой технологии. Результат новой GeForce RTX 3080 12 ГБ оказался снова между RTX 3080 и RTX 3080 Ti, что объяснимо теоретически. Новинка вполне позволит поиграть в 4K при максимальных настройках с включением DLSS, судя по этому бенчмарку.
Рассмотрим еще один полуигровой бенчмарк, также основанный на китайской игре — Bright Memory. Интересно, что оба теста довольно похожи по результатам и по качеству изображения, хотя по тематике они совсем разные. И все же этот бенчмарк даже еще чуть более требователен, особенно конкретно к производительности трассировки лучей. Жаль, что на видеокартах AMD он не работает, требуя именно Nvidia RTX.
В этом тесте новая модель на урезанном графическом процессоре GA102 снова показала ожидаемый результат, уступив RTX 3080 Ti и обойдя RTX 3080. Разный объем видеопамяти и ПСП у этих моделях тут практически не сказывается, куда важнее количество CUDA- и RT-ядер, которых ощутимо больше именно у RTX 3080 Ti.
Мы продолжаем поиск бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается довольно старый и не слишком хорошо оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.
Рассматриваемая сегодня модель GeForce RTX 3080 12 ГБ отстает от RTX 3080 Ti, что вполне ожидаемо, а вот обычную RTX 3080 она опередила совсем чуть-чуть, особенно в самом тяжелом подтесте. Памяти и ПСП тут всем хватает, больше упирается в скорость CUDA-ядер. Результат новинки позволил опередить обе Radeon, что особенно хорошо видно по самому сложному подтесту, где отставание RX 6900 XT получилось почти двукратным.
Рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества новых видеокарт. В прошлых тестах мы использовали разные версии бенчмарка: которая выдает результат в виде времени, затраченного на рендеринг и в виде количества миллионов просчитанных путей за секунду.
Тест также показывает программную трассировку лучей, но на решениях архитектуры RDNA 2 нам не удалось запустить тест, к сожалению. Новая модель GeForce RTX 3080 12 ГБ оказалась медленнее RTX 3080 Ti всего на секунду, да и RTX 3090 ушла не так далеко вперед. Хотя и обычная RTX 3080 тут смотрится очень сильно. В общем, в сложных вычислительных тестах все новые представители архитектуры Ampere показывают отличные результаты.
Рассмотрим еще одно приложение рендеринга — OctaneRender. Это довольно популярный рендерер, который можно использовать в большинстве приложений для создания 3D-контента, а главное, что он использует возможности CUDA и RTX, а версия OctaneRender 2020.1.5 получила поддержку Ampere. Бенчмарк на основе этого рендерера позволяет отключать RTX-ускорение и тестирует производительность сразу в нескольких тестовых сценах, отличающихся по нагрузке. Увы, но OpenCL тестом и рендерером не поддерживается. Приведем общее количество очков:
Новая модель GeForce RTX 3080 12 ГБ ожидаемо уступила старшей сестре из того же семейства, отставание от RTX 3080 Ti было ожидаемо, как и опережение RTX 3080. Включение аппаратного ускорения RTX серьезно улучшает результаты всех графических процессоров архитектуры Ampere — в этом виновата и повышенная производительность RT-ядер второго поколения, а также удвоенный темп FP32-вычислений и изменения в системе кэширования. И если кто-то хочет использовать RTX 30 для рендеринга, но не имеет денег на RTX 3090, то новинка — отличный компромисс, имеющий 12 ГБ памяти, а не 10 ГБ, как обычная RTX 3080.
Мы решили включить в материалы отдельный тест второй версии технологии DLSS, хотя ранее уже были проведены тесты с применением DLSS в приложениях с трассировкой лучей, мы посчитали полезным сделать и отдельное тестирование в разрешении 4K. Рассмотрим результаты четырех GPU компании Nvidia в популярном разрешении с включением технологии DLSS максимально возможного качества:
Без включения DLSS 2.0, рендеринг производится в полном разрешении, что сильно сказывается на производительности, и такого уровня частоты кадров будет явно недостаточно даже в случае RTX 3090. Сегодняшняя новинка отстала от старших решений не так уж много, но и обычная RTX 3080 в этом тесте очень к ним близка. Так что преимущество от 12 ГБ в данном случае точно не сработало. В любом случае, подобная сложность сцены требует применения исключительно видеокарт, основанных на чипе GA102, совместно с технологией повышения производительности DLSS, обеспечивающей отличное качество картинки.
Тестирование: игровые тесты, майнинг
Список инструментов тестирования
Во всех игровых тестах использовалось максимальное качество графики в настройках.
- Hitman III (IO Interactive/IO Interactive)
- Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 1.4 (версия 1.5 еще не тестировалась)
- God of War (Sony IE/Sony IE)
- Assassin’s Creed Valhalla (Ubisoft/Ubisoft)
- Marvel’s Guardians of the Galaxy (Eldos/Square Enix)
- The Medium (Bloober/Bloober)
- Godfall (Gearbox Publishing/Counterplay Games)
- Resident Evil Village (Capcom/Capcom)
- Far Cry 6 (Ubisoft/Ubisoft)
- Battlefield 2042 (DICE/EA)
Для подсчета хэшрейта (hashrate) при майнинге «эфира» (Ethereum/ETH) использовался майнер T-Rex (0.21.04), фиксировался средний показатель за 2 часа в двух режимах:
- по умолчанию (лимит потребления снижен до 70%, частота GPU снижена на 200 МГц, частота памяти по умолчанию, вентиляторы выставлены в ручном режиме на 70%)
- оптимизация (лимит потребления снижен до 70%, частота GPU снижена на 200 МГц, частота памяти повышена на 500—1000 МГц (в зависимости от карты), вентиляторы выставлены в ручном режиме на 80%)
Для тестирования GeForce RTX 3060 (не LHR) использовался драйвер версии 470.05, в котором отключена защита от майнинга, на других версиях он составляет 24/26 MH/s.
Кратко о производительности в 3D-играх
Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Все это нами субъективно оценивается по шкале из пяти градаций.
Игры без использования трассировки лучей (классическая растеризация)
Даже прежняя версия RTX 3080 с 10 ГБ демонстрировала отменную производительность в классических играх во всех разрешениях, включая 4К, и это на ультравысоких настройках графики. Учитывая, что RTX 3080 c 12 ГБ еще быстрее, то очевидно, что такой дорогой ускоритель 3D-графики создан именно для высоких разрешений типа 3840×2160. Более того, еще на примере RTX 3080 Ti мы могли убедиться, что подобным флагманским видеокартам, включая и RTX 3080 12 ГБ, «по зубам» даже разрешение 8К, особенно если в игре имеется поддержка DLSS. Что касается карты MSI, то она чуть быстрее референс-аналога, но до RTX 3080 Ti все равно не дотягивает (Nvidia этого попросту не позволит).
Игры с использованием трассировки лучей
Конечно, падение производительности при активизации в играх трассировки лучей имеется, и подчас весьма существенное. Однако появляется все больше и больше игр с поддержкой Nvidia DLSS, а эта технология «умного» антиалиасинга позволяет резко поднять производительность, компенсируя падение от включения RT, а иногда DLSS поднимает производительность даже выше уровня, который выдают карты семейства RTX без трассировки лучей. С учетом этих факторов, а также того, что все больше становится и игр с поддержкой AMD FSR (еще одна технология умного масштабирования картинки), очень сложно дать однозначную среднюю оценку. По итогам анализа производительности в нашем большом наборе тестов мы пришли к выводу, который изложен на диаграмме выше.
Что касается именно RTX 3080 12 ГБ, то ее рейтинг в играх с RT лишь ненамного снизился по сравнению с классическими играми: даже с RT (+DLSS/FSR) такой ускоритель очень хорошо подходит для игр в разрешении 4К. Карта MSI немного быстрее референс-аналога, поэтому выводы по ней еще более оптимистичны.
- Платформа: