Когда вышла 2070 rtx
Перейти к содержимому

Когда вышла 2070 rtx

  • автор:

Обзор Nvidia GeForce RTX 2070: третий по скорости ускоритель игрового класса нового поколения

Мы уже рассматривали в своих материалах как топовую видеокарту GeForce RTX 2080 Ti, так и среднюю из трех анонсированных летом моделей GeForce RTX 2080, оказавшуюся довольно выгодным вариантом. Но вместе с ними компания Nvidia анонсировала и самую доступную модель — GeForce RTX 2070, на которую рассчитывают многие любители игр из-за сравнительно низкой цены и хорошего соотношения цены и производительности.

Напомним, что Nvidia анонсировала решения линейки GeForce RTX, основанные на новой архитектуре Turing, еще в августе. На игровой выставке Gamescom были объявлены три модели, основанные на графических процессорах разной сложности и производительности: TU106, TU104 и TU102. Используемый при производстве графических процессоров архитектуры Turing техпроцесс 12 нм FinFET по характеристикам лишь чуть лучше 16-нанометрового, известного по предыдущему поколению Pascal, поэтому чипы семейства Turing получились довольно большими по размеру и дорогими, что отразилось и на розничных ценах.

Основной отличительной особенностью семейства GeForce RTX стала поддержка аппаратно ускоренной трассировки лучей, что позволяет использовать физически корректные расчеты лучей света, в отличие от растеризации, лишь примерно имитирующей их распространение в 3D-сцене. Для того чтобы в очередной раз не рассказывать об основах и особенностях трассировки и отличиях от более привычной растеризации, мы предлагаем прочитать большую и подробную статью об этом.

Анонс технологии RTX и аппаратно поддерживающих ее GPU дал разработчикам возможность начать внедрение алгоритмов, использующих трассировку лучей. Со временем она заменит растеризацию, но это произойдет постепенно, а в первые годы использование трассировки предполагается исключительно в гибридном виде — с сочетанием растеризации и трассировки лучей, используемой для рендеринга некоторых эффектов, слишком сложных или вообще невозможных при растеризации.

К примеру, поддержка трассировки уже появилась в свежем проекте Battlefield V, в котором она используется исключительно для рендеринга реалистичных отражений, а вскоре планируется добавить поддержку этой технологии и в игру Shadow of the Tomb Raider, где она будет использоваться для отрисовки реалистичных теней. В дальнейшем трассировка лучей будет появляться в играх с самой продвинутой графикой.

Но кроме специализированных ядер для аппаратного ускорения трассировки лучей, в составе новых GPU есть и блоки, предназначенные для ускорения задач глубокого обучения — тензорные ядра, которые перешли в Turing от вычислительной архитектуры Volta. Они могут быть полезны как в широком ряде неграфических задач, так и в игровых применениях: для шумоподавления результата трассировки лучей с малым количеством сэмплов на пиксель, для хитрого полноэкранного сглаживания методом DLSS, о котором мы писали в статье по RTX 2080 Ti, и для многого другого.

Но достаточно ли мощности для таких применений у младшей на сегодня модели GeForce RTX 2070? В нынешнем обзоре мы как раз и попробуем в этом разобраться, сравнив новинку со старшими сестрами и решениями предыдущего поколения. Так как рассматриваемая модель видеокарты компании Nvidia основана на графическом процессоре архитектуры Turing, имеющей очень много общего с предыдущими архитектурами Pascal и Volta, то перед прочтением материала мы советуем ознакомиться с нашими предыдущими статьями:

  • [08.10.18] Обзор новинки 3D-графики 2018 года — Nvidia GeForce RTX 2080
  • [19.09.18] Nvidia GeForce RTX 2080 Ti — обзор флагмана 3D-графики 2018 года
  • [14.09.18] Игровые видеокарты Nvidia GeForce RTX — первые мысли и впечатления
  • [06.06.17] Nvidia Volta — новая вычислительная архитектура
  • [09.03.17] GeForce GTX 1080 Ti — новый король игровой 3D-графики

Стало уже привычным для последних семейств видеокарт Nvidia, что в линейке GeForce предлагаются и специальные продукты самой компании — так называемые Founder’s Edition. В этот раз при несколько более высокой стоимости ($599 против $499 для рынка США — цены без учета налогов) они обладают и более привлекательными характеристиками.

У таких видеокарт есть изначально весьма приличный фабричный разгон, а также видеокарты Founder’s Edition должны быть надежными и они выглядят очень солидно из-за строгого дизайна и специально подобранных материалов. Чтобы в надежности работы таких FE-видеокарт не оставалось сомнений, каждая плата тестируется на стабильность и обеспечивается трехлетней гарантией. Что оказалось весьма полезным делом, так как в некоторых из видеокарт первых партий топового решения допустили брак — но все вышедшие из строя такие карты без проблем заменяются по гарантии.

В видеокартах GeForce RTX Founder’s Edition применяется оригинальная система охлаждения с испарительной камерой на всю длину печатной платы и с двумя вентиляторами — для более эффективного охлаждения (по сравнению с одним вентилятором в предыдущих версиях FE). Длинная испарительная камера и большой двухслотовый алюминиевый радиатор обеспечивают довольно большую площадь рассеивания тепла, а тихие вентиляторы отводят горячий воздух в разные стороны, а не только наружу корпуса. В последнем есть и плюс и минус. К примеру, при очень плотном размещении видеокарт (не через слот, а в каждом) они могут перегреваться, ведь это — не самые обычные условия работы для GeForce.

Кроме описанных отличий, FE-видеокарты отличаются и несколько большим уровнем энергопотребления, что обусловлено повышенными тактовыми частотами GPU для таких вариантов. В этот раз партнерам компании приходится предлагать варианты с еще большим фабричным разгоном — экстремальные варианты с лучшими характеристиками по дополнительному питанию, а также усиленными системами охлаждения.

Архитектурные особенности

Младшая модель видеокарты GeForce RTX 2070 основана на графическом процессоре TU106. Этот GPU используется только для этой платы и имеет площадь 445 мм² (сравните с 545 мм² у TU104, на котором сделан RTX 2080, и с 471 мм² у лучшего игрового чипа семейства Pascal — GP102, основе GeForce GTX 1080 Ti), содержит 10,8 млрд транзисторов, по сравнению с 13,6 млрд транзисторов у среднего TU104 и с 12 млрд транзисторов у GP102 — основе GTX 1080 Ti.

Так как все новые GPU линейки Turing серьезно усложнились из-за появления дополнительных аппаратных блоков, которых вообще не было в Pascal, а техпроцессы для их производства применяются схожие, то по площади и сложности новые GPU увеличились. Заодно заметно увеличилась и себестоимость их производства, что сказалось и на выходе годной продукции и на розничных ценах.

Полная версия чипа TU106 содержит три кластера Graphics Processing Cluster (GPC), каждый из которых содержит по шесть кластеров Texture Processing Cluster (TPC), состоящих из одного движка PolyMorph Engine и пары мультипроцессоров SM. Соответственно, каждый SM состоит из: 64 CUDA-ядер, 256 КБ регистровой памяти и 96 КБ конфигурируемых L1-кэша и общей памяти, а также четырех блоков текстурирования TMU. Для нужд аппаратной трассировки лучей каждый мультипроцессор SM имеет также и по одному RT-ядру. Всего чип включает 36 мультипроцессоров SM, столько же RT-ядер, 2304 CUDA-ядер и 288 тензорных ядер.

Рассматриваемая нами модель GeForce RTX 2070 основана на полной версии этого чипа, поэтому все указанные характеристики соответствуют также и ей. Подсистема памяти аналогична той, что мы видели в TU104 и GeForce RTX 2080, она содержит восемь 32-битных контроллеров памяти (256-бит в целом), при помощи которых GPU имеет доступ к 8 ГБ GDDR6-памяти, работающей на эффективной частоте в 14 ГГц, что дает пропускную способность в очень приличные 448 ГБ/с в итоге. К каждому контроллеру памяти привязаны по восемь блоков ROP и по 512 КБ кэш-памяти второго уровня. То есть, всего в чипе 64 блока ROP и 4 МБ L2-кэша.

Что касается тактовых частот нового графического процессора в составе младшей модели линейки GeForce RTX, то турбо-частота GPU у референсного варианта (не путать с FE!) карты составляет 1620 МГц. Как и две другие модели линейки, предлагаемая компанией со своего сайта видеокарта RTX 2070 Founder’s Edition имеет фабричный разгон до 1710 МГц — на 90 МГц больше, чем у стандартных вариантов от производителей видеокарт.

По строению мультипроцессоров SM все чипы новой архитектуры Turing схожи друг с другом, в них появились новые типы вычислительных блоков: тензорные ядра и ядра ускорения трассировки лучей, а также были усложнены сами CUDA-ядра, в которых появилась возможность одновременного исполнения целочисленных вычислений и операций с плавающей запятой. Обо всех важных изменениях мы очень подробно сообщали в обзоре GeForce RTX 2080 Ti, и очень советуем ознакомиться с этим большим и важным материалом.

Архитектурные изменения в вычислительных блоках привели к 50%-ному улучшению производительности шейдерных процессоров при равной тактовой частоте в среднем. Также были улучшены технологии сжатия информации без потерь, архитектура Turing поддерживает новые техники компрессии, также до 50% более эффективные, по сравнению с алгоритмами в семействе чипов Pascal. Вместе с применением нового типа памяти GDDR6 это дает приличный прирост эффективной ПСП. Хотя конкретно у RTX 2070 пропускной способности памяти и так довольно много — не меньше, чем у RTX 2080.

Многие изменения в новой архитектуре Turing нацелены на будущее, вроде mesh shading — новых типов шейдеров, ответственных за всю работу над геометрией, вершинами, тесселяцией и т. д. Если вкратце, то они позволяют значительно снизить зависимость от мощности CPU и во много раз увеличить количество объектов в сцене.

Также можно отметить технологию Variable Rate Shading (VRS) — шейдинг с переменным количеством сэмплов, позволяющий оптимизировать рендеринг при помощи переменного количества сэмплов при закраске, упрощая шейдинг лишь там, где это оправдано. Этот вариант оптимизированного шейдинга на днях появился в последнем обновлении игры Wolfenstein II: The New Colossus, он позволяет получить до 10% преимущества в производительности за счет почти незаметного ухудшения качества рендеринга.

Очень важно отметить, что поддержки высокопроизводительного интерфейса NVLink второй версии, который используется для объединения GPU в том числе и для работы над изображением в режиме SLI, конкретно в младшем чипе линейки TU106 нет, хотя в TU102 в наличии два порта NVLink, а в TU104 — один. Похоже, в компании Nvidia таким образом разделяют рынки, предлагая заинтересованным в SLI-системах приобретать более дорогие варианты графических карт.

А вот новый блок вывода информации, поддерживающий дисплеи с высоким разрешением, с HDR и высокой частотой обновления, есть во всех графических процессорах семейства Turing, в том числе и в TU106. Все GeForce RTX имеют порты DisplayPort 1.4a, позволяющие вывести информацию на 8K-монитор с частотой обновления 60 Гц с поддержкой технологии VESA Display Stream Compression (DSC) 1.2, обеспечивающей высокую степень сжатия.

Платы Founder’s Edition содержат три таких выхода DisplayPort 1.4a, один разъем HDMI 2.0b (с поддержкой HDCP 2.2) и один VirtualLink (USB Type-C), предназначенный для будущих шлемов виртуальной реальности. Это новый стандарт подключения VR-шлемов, обеспечивающий передачу питания и высокую пропускную способность по разъему USB-C.

Все решения семейства Turing поддерживают два 8K-дисплея при 60 Гц (требуется по одному кабелю на каждый), такое же разрешение также можно получить при подключении через установленный USB-C. Кроме этого, все Turing поддерживают полноценный HDR в конвейере вывода информации, включая tone mapping для различных мониторов — со стандартным динамическим диапазоном и расширенным.

Все новые GPU также содержат улучшенный кодировщик видеоданных NVEnc, добавляющий поддержку сжатия данных в формате H.265 (HEVC) при разрешении 8K и 30 FPS. Такой блок NVEnc снижает требования к полосе пропускания до 25% при формате HEVC и до 15% при формате H.264. Также был обновлен и декодер видеоданных NVDec, получивший поддержку декодирования данных в формате HEVC YUV444 10-бит/12-бит HDR при 30 FPS, в формате H.264 при 8K-разрешении и в формате VP9 с 10-бит/12-бит данными.

Со всеми остальными возможностями семейства Turing вы можете познакомиться в большом обзоре GeForce RTX 2080 Ti, так как нововведений в новой архитектуре слишком много, чтобы повторять их каждый раз. Чего стоят только ядра для аппаратного ускорения трассировки лучей и тензорные ядра для ускорения алгоритмов искусственного интеллекта, предлагающие пользователям совершенно новые возможности, невиданные ранее.

Особенности видеокарты

Объект исследования: ускоритель трехмерной графики (видеокарта) Asus Strix RTX 2070 8 ГБ OC 256-битной GDDR6 (O8G)

Сведения о производителе: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США.Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) — около 5000 человек.

Характеристики карты
Память

Карта имеет 8 ГБ памяти GDDR6 SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6) рассчитаны на номинальную частоту работы в 3500 (14000) МГц.

Особенности карты и сравнение с предыдущим поколением
Asus Strix RTX 2070 8 ГБ Nvidia GeForce GTX 1070
вид спереди
вид сзади

Как в случае RTX 2080/2080 Ti, PCB у карт двух поколений сильно различаются. Несмотря на то, что обе имеют 256-битную шину обмена с памятью, микросхемы памяти (разных типов) размещены по-разному. Также можно увидеть кардинальное различие в размере ядер: RTX 2070 (TU106) гораздо крупнее, чем GTX 1070 (GP104) даже несмотря на более тонкий техпроцесс.

Схема питания построена на базе 10-фазного цифрового преобразователя iMon DrMOS и управляется цифровым контроллером uP9512P производства uPI. Традиционно для Asus система питания исполнена по технологии Super Alloy Power II, в ней использованы современные твердотельные конденсаторы. Мониторингом состояния управляет контроллер IT8705F/AF производства компании ITE (Integrated Technology Express).

На торце в хвостовой части карты имеются два 4-контактных разъема питания для корпусных вентиляторов. Можно заставить подключенные к ним вентиляторы работать в соответствии с нагревом GPU, увеличивая или уменьшая обороты. На обороте карты есть кнопка включения/выключения подсветки кулера. Также управлять подсветкой можно из специальной утилиты (об этом ниже).

На верхнем торце карты есть переключатель BIOS (карта имеет две копии BIOS). P — режим производительности, частоты повышены; в этом режиме с помощью утилиты можно дополнительно выбрать частотные параметры Gaming mode (по умолчанию) и OC mode (+4,7% относительно референсных значений). Q — режим тихой работы, частоты сброшены до значения референса RTX 2070.

Управление работой карты обеспечивается с помощью фирменной утилиты Asus GPU Tweak II, которую можно скачать с сайта производителя.

А через утилиту EVGA Precision X1 можно не только повысить частоты работы, но и запустить Nvidia Scanner, который поможет определить безопасный максимум работы ядра и памяти, то есть самый быстрый режим работы в 3D. Также имеется версия 4.6.0 популярной утилиты MSI Afterburner, которая поддерживает всю серию RTX 2000.

Карта оснащается новым разъемом USB-C (VirtualLink) специально для работы с устройствами виртуальной реальности следующего поколения. Вообще, набор видеовыходов чуть поменялся: традиционные 3 DisplayPort + 1 HDMI сменились на паритетные 2+2.

Охлаждение и нагрев

За охлаждение GPU отвечают два больших радиатора, соединенные тепловыми трубками с пластиной, прижимаемой к чипу. Разумеется, всё из медных сплавов и покрыто никелем. Поверх радиаторов установлен кожух с тремя вентиляторами Wing-blade (так их называет производитель). Декларируется пылезащищенность и минимальный шум такой системы. Как и во всей серии Strix, вентиляторы не включаются при нагреве GPU до 50-55 градусов. Так что если при включении ПК вентиляторы дернулись, а потом раздумали вращаться, то это нормально.

К микросхемам памяти прижимается тонкая рамка с термоинтерфейсом, не обеспечивающая серьезного рассеивания тепла. Силовые транзисторы через толстый слой термоинтерфейса охлаждаются вторым из двух радиаторов системы охлаждения GPU. На обороте видеокарты установлена толстая пластина, которая обеспечивает жесткость относительно массивной видеокарты (предотвращая изгиб печатной платы). СО оснащена подсветкой, цветом которой можно управлять с помощью вышеупомянутой утилиты Asus GPU Tweak II.

Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder):

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 64 градусов, что является просто прекрасным результатом для видеокарты высокого уровня.

Максимальный нагрев — центральная область с обратной стороны печатной платы.

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума выполняется по методике, описанной здесь:

  • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
  • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
  • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
  • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя в 2D температура составляла 30 °C, вентиляторы не вращались. Шум был равен фоновому — 18,0 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось: температура ядра оставалась прежней, вентиляторы не включались, шум сохранялся на уровне 18,0 дБА.

В режиме максимальной нагрузки в 3D температура достигала 64 °C. Вентиляторы при этом раскручивались до 1840 оборотов в минуту, шум вырастал до 33,0 дБА, так что шум от данной СО невысокий.

Комплект поставки и упаковка

Базовый комплект поставки серийной карты должен включать в себя руководство пользователя, диск с драйверами и утилитами. Перед нами базовый комплект, плюс фирменные стяжки и разветвитель питания в качестве бонуса.

Синтетические тесты

Недавно мы обновили пакет синтетических тестов, он все еще экспериментальный и, скорее всего, будет меняться. Мы бы хотели добавить еще больше примеров с вычислениями (compute shaders), но один из распространенных таких бенчмарков CompuBench пока что не работает на GeForce RTX. В будущем постараемся расширить и улучшить свой набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте почтой.

Из ранее активно использовавшихся тестов RightMark3D 2.0 мы оставили лишь несколько самых тяжелых вариантов. Остальные уже изрядно устарели и на столь мощных GPU упираются в различные ограничители, не загружают работой блоки графического процессора и не показывают истинную его производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы пока что решили оставить в полном составе, так как заменить их попросту нечем, хотя и они уже устарели.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько тестов для измерения производительности трассировки лучей и один временный тест для сравнения производительности сглаживания методами DLSS и TAA. В качестве полусинтетического теста у нас также используется и популярный 3DMark Time Spy, помогающий определить пользу от асинхронных вычислений.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce RTX 2070 со стандартными параметрами (сокращенно RTX 2070)
  • GeForce RTX 2080 со стандартными параметрами (сокращенно RTX 2080)
  • GeForce GTX 1080 Ti со стандартными параметрами (сокращенно GTX 1080 Ti)
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080)
  • GeForce GTX 1070 со стандартными параметрами (сокращенно GTX 1070)
  • Radeon RX Vega 64 со стандартными параметрами (сокращенно RX Vega 64)

Для анализа производительности новой видеокарты GeForce RTX 2070 мы взяли именно эти решения по следующим причинам. GeForce GTX 1070 является прямым предшественником новинки, основанным на аналогичном по позиционированию графическом процессоре из предыдущего поколения Pascal. Модель GeForce GTX 1080 принадлежит к более высокому ценовому диапазону, и должна быть примерно на уровне RTX 2070 по производительности. GTX 1080 Ti нам интересна в нескольких тестах как самый производительный представитель предыдущего семейства, а RTX 2080 представлена как ориентир GPU из текущего поколения, но чуть большей мощности и цены.

Как всегда в последнее время, в соперники для решений GeForce RTX у конкурирующей компании AMD выбрать нечего. Конкурентоспособные продукты, способные выступать на уровне GeForce RTX 2070, вряд ли появятся у AMD достаточно скоро. Поэтому для сравнения остается единственная видеокарта Radeon RX Vega 64, которая хоть и не может быть прямым соперником для GeForce RTX 2070 по цене, но близка к ней по характеристикам и в любом случае является наиболее производительным решением компании AMD.

Мы сильно сократили состав DirectX 10-тестов из RightMark3D, оставив только шесть примеров с наибольшей нагрузкой на GPU. Первая пара тестов измеряет производительность выполнения относительно простых пиксельных шейдеров с циклами при большом количестве текстурных выборок (до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере. Оба примера включают самозатенение и шейдерный суперсэмплинг, увеличивающий нагрузку на видеочипы.

Первый тест пиксельных шейдеров — Fur. При максимальных настройках в нем используется от 160 до 320 текстурных выборок из карты высот и несколько выборок из основной текстуры. Производительность в данном тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ.

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD лидируют со времен выхода первых графических процессоров архитектуры GCN, и совершенно неудивительно, что видеокарты Radeon до сих пор являются лучшими в этих сравнениях, что говорит о большей эффективности выполнения подобных программ. Вывод подтверждается в очередной раз — рассматриваемая нами видеокарта модели GeForce RTX 2070 выступила явно хуже даже не своего конкурента, а просто лучшей из Radeon на сегодня.

Более того, в этом D3D10-тесте очередная плата серии RTX хоть и немного, но уступила модели из предыдущей линейки — GeForce GTX 1080, основанной на чипе семейства Pascal. Кроме этого, сегодня мы выяснили, что этот тест не упирается в ПСП или производительность блоков ROP, так как по этим параметрам RTX 2070 и RTX 2080 близки. Отрыв от аналогичного по позиционированию решения из прошлого поколения в виде GTX 1070 хоть и присутствует, но он не очень большой. В столь простых тестах вся линейка RTX не слишком сильна, новым GPU нужны более сложные шейдеры и условия в целом.

Следующий DX10-тест Steep Parallax Mapping также измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок. При максимальных настройках он использует от 80 до 400 текстурных выборок из карты высот и несколько выборок из базовых текстур. Этот шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, в том числе и такие варианты как steep parallax mapping. Кроме того, в нашем тесте мы включили самозатенение, увеличивающее нагрузку на видеочип в два раза, и суперсэмплинг, также повышающий требования к мощности GPU.

Диаграмма похожа на предыдущую, но в этот раз свежая модель видеокарты GeForce RTX 2070 опередила GTX 1080 из предыдущего поколения, а ее преимущество над GTX 1070 стало уже заметно больше. Упора в ПСП или ROP все так же нет, ведь RTX 2080 оказалась еще быстрее. Если сравнивать новинку с менее дорогой, но лучшей из имеющихся видеокарт компании AMD, то Radeon и тут быстрее, но уже поменьше. Будем надеяться, что в более сложных DirectX 11 и 12 тестах новинка Nvidia сможет раскрыть свой потенциал.

Из пары тестов пиксельных шейдеров с минимальным количеством текстурных выборок и относительно большим количеством арифметических операций, мы выбрали более сложный, так как они уже порядком устарели и уже не измеряют чисто математическую производительность GPU. Да и за последние годы скорость выполнения именно арифметических инструкций в пиксельном шейдере не так важна, большинство вычислений перешли в compute shaders. Итак, тест шейдерных вычислений Fire — текстурная выборка в нем лишь одна, а количество инструкций типа sin и cos равно 130 штукам. Впрочем, для современных GPU это семечки.

В математическом тесте из нашего RigthMark мы почти всегда видим результаты, довольно далекие от теории и сравнений в других аналогичных бенчмарках. Вероятно, столь мощные платы ограничивает что-то, не относящееся к скорости вычислительных блоков, так как GPU при тестировании не бывает загружен работой на 100%. Но и на ПСП и ROP не спишешь эту разницу, ведь RTX 2080 все же быстрее. Рассматриваемая сегодня GeForce RTX 2070 в этом тесте опережает GTX 1070 и отстает от всех остальных видеокарт. Единственный GPU конкурирующей компании оказался значительно быстрее всех GeForce, а новинка отстала от него аж на 40%.

Ну а мы переходим к тесту геометрических шейдеров. В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, но один из них (Hyperlight, демонстрирующий использование техник: instancing, stream output, buffer load, использующий динамическое создание геометрии и stream output, на всех видеокартах компании AMD не работает), поэтому мы решили оставить лишь второй — Galaxy. Техника в этом тесте аналогична point sprites из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Вычисления производятся в геометрическом шейдере.

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек. Задача для мощных современных GPU довольно простая, но разница между разными моделями видеокарт присутствует. Новая GeForce RTX 2070 в этом тесте показала относительно неплохой результат, обогнав условного конкурента в сложных условиях. Даже GTX 1080 оказалась повержена в этот раз, не говоря уже о прямой предшественнице GTX 1070.

Отставание лучшей из имеющихся в продаже Radeon при высокой геометрической сложности получилось чуть ли не полуторакратным. В этом тесте разница между видеокартами на чипах Nvidia и AMD явно в пользу решений калифорнийской компании, это обусловлено отличиями в геометрических конвейерах GPU. В тестах геометрии платы GeForce всегда конкурентоспособнее Radeon, и мощные топовые видеочипы Nvidia, имеющие сравнительно большое количество блоков по обработке геометрии, почти всегда выигрывают с заметным преимуществом.

Последним тестом из Direct3D 10 станет скорость большого количества текстурных выборок из вершинного шейдера. Из пары имеющихся у нас тестов с использованием displacement mapping на основании данных из текстур, мы выбрали тест Waves, имеющий условные переходы в шейдере и поэтому более сложный и современный. Количество билинейных текстурных выборок в данном случае составляет 24 штуки на каждую вершину.

Результаты в тесте вершинного текстурирования Waves в очередной раз обнажили странный упор новой GeForce RTX 2070 во что-то непонятное. Впрочем, в самых сложных условиях производительность новой модели GPU выше, чем у всех решений, кроме более мощной модификации из линейки GeForce RTX. Обе видеокарты предыдущего поколения Pascal остались далеко позади, кроме GTX 1080 — но только в самом легком режиме. А вот если сравнивать новинку с Radeon RX Vega 64, то они идут вровень в сложных условиях, но карта AMD выходит вперед в среднем и легком.

Мы традиционно рассматриваем также и синтетические тесты из пакета 3DMark Vantage, ведь они иногда показывают нам то, что мы упустили в тестах собственного производства. Feature тесты из этого тестового пакета также обладают поддержкой DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новейшей видеокарты GeForce RTX 2070 мы сделаем какие-то полезные выводы, ускользнувшие от нас в тестах пакета RightMark 2.0.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark довольно высока, тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя с GeForce RTX получилось несколько странно. Разница в скорости между GeForce RTX 2070 и GTX 1080 оказалась в пользу старого решения более высокого уровня, хотя должно быть наоборот. А вот GTX 1070 осталась в проигравших, отстав довольно сильно.

Но все это меркнет, если сравнивать скорость текстурирования новой видеоплаты компании Nvidia с лучшей из имеющихся на рынке видеокарт конкурента. Самая слабая из тройки GeForce RTX уступила видеокарте Radeon RX Vega 64 довольно сильно, так как последняя имеет большое количество блоков TMU и с задачей текстурирования справляется весьма неплохо. В итоге, разница между ними почти полуторакратная, как и должно быть по теории.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP. Но тут мы видим нечто странное, что теорией не объяснить. Рассматриваемая сегодня плата GeForce RTX 2070 смогла опередить только свою прямую предшественницу в виде GTX 1070, и то совсем чуть-чуть. Непонятнее всего то, что она сильно отстала от RTX 2080, хотя теоретически имеет почти такую же скорость заполнения. Возможно, как раз тут и сказывается иная организация TU106 по сравнению с TU104 (три GPC вместо шести), и изменившийся баланс между блоками GPU.

Если сравнивать скорость заполнения сцены видеокартой GeForce RTX 2070 с лучшим из вышедших решений компании AMD, то рассматриваемая сегодня плата и в этом тесте показала меньшую скорость заполнения сцены по сравнению с Radeon RX Vega 64. Увы, ни большое количество блоков ROP у новинки, ни эффективные оптимизации сжатия данных не смогли переломить ситуацию.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель GeForce RTX 2070 показала хороший результат, оказавшись на одном уровне с видеокартой более высокого позиционирования из прошлого поколения Pascal, что соответствует теории на этот раз. Также решение Nvidia сильно опередило GTX 1070 и почти догнало Vega 64 — но еще раз повторим, что эта плата компании AMD в реальности ей вовсе не конкурент.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы который раз получаем явно странные результаты в этом тесте, в котором очередная новая видеокарта GeForce показала низкую скорость на уровне и решений предшествующего поколения GeForce GTX и средней из GeForce RTX. C этим тестом точно что-то не так, логического объяснения таким результатам нет.

Понятно, что в таких условиях и сравнение с единственным Radeon для GeForce RTX 2070 ничего хорошего не сулит. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, лучшая плата Radeon в этом тесте по какой-то (программной?) причине работает заметно лучше, в два раза обгоняя все видеокарты GeForce, представленные в сегодняшнем сравнении.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

И во втором геометрическом тесте из 3DMark Vantage новая GeForce RTX 2070 снова явно далека от результата, соответствующего теории. Новинка оказалась чуть ниже уровня представительницы архитектуры Pascal в виде GTX 1080, да и RTX 2080 к ним в этот раз весьма близка, чего по теории просто быть не должно.

Сравнение новинки с единственной представленной в материале видеокартой компании AMD приносит аналогичный вывод — очередная видеокарта семейства Turing показала результат на уровне быстрейшей одночиповой видеокарты конкурента, имеющей заметно меньшую сложность и более низкую цену.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но куда ближе к пиковой производительности видеочипов в предельных задачах. Похоже, что в этом тесте используются в основном операции с плавающей запятой, и новая архитектура Turing просто не может использовать свои уникальные возможности и показать результат заметно выше лучших представителей из семейства Pascal. GeForce RTX 2070 в этом тесте оказалась почти на уровне GTX 1080, с запасом опередив GTX 1070. Средняя из трех представленных RTX еще немного быстрее.

Но видеочипы компании AMD с архитектурой GCN справляются с подобными задачами еще лучше — в тех случаях, когда выполняется интенсивная «математика» в предельных режимах. Radeon RX Vega 64 отстает только от топовой RTX 2080 Ti в этом тесте, легко обойдя рассматриваемую сегодня RTX 2070. А ведь эти GPU очень сильно отличаются по сложности и цене. Далее мы рассмотрим современные тесты, использующих более сложную нагрузку — показатели Turing в них обычно оказываются лучше.

Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64000 штук.

И этот тест тоже не раскрывает новых возможностей архитектуры Turing, так как все видеокарты GeForce показывают близкие результаты. Новинка не опередила топовое решение семейства Pascal, а единственный условный конкурент в виде Radeon RX Vega 64 оказался немного быстрее всех видеокарт Nvidia. Судя по высокой частоте кадров, вычисления в этом примере из SDK не слишком сложны, и мощные GPU просто не могут показать свои способности. Посмотрим еще на показатели чипов более низкого уровня, но дальнейшее использование теста под вопросом — пока что в нем не видно особого смысла.

Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.

Производительность рендеринга в этом тесте зависит от оптимизации драйвера и командного процессора GPU. И с этим у всех решений Nvidia все в порядке, все видеокарты GeForce опередили лучшую из Radeon. Что касается сравнения сегодняшней новинки с лучшей из видеокарт прошлого поколения, то GeForce RTX 2070 пусть и чуть-чуть, но опередила GTX 1080 Ti, хотя RTX 2080 оказалась заметно быстрее них, в свою очередь. Похоже, что новые графические процессоры архитектуры Turing хороши в таких сложных условиях.

Ну и последний D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно интересный. При тестировании мы использовали настройки по умолчанию.

Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Хорошо видно, что по этим параметрам видеокарты Nvidia хоть и выигрывают у Radeon RX Vega 64, но преимущество это совсем не такое уж большое, учитывая цену и сложность уже далеко не нового GPU конкурента.

В этот раз GeForce RTX 2070 не смогла обойти и лучшую представительницу из семейства Pascal, несколько уступив паре GeForce. Впрочем, в этом тесте все соответствует производительности блоков ROP, да и частота кадров слишком высока в любом случае — задача довольно легкая для мощных GPU.

Direct3D11-тесты из SDK компании AMD закончились, переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.

Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графического процессора Turing. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.

Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и мультипроцессоров GPU. Решения Nvidia в тесте явно лучше справляются с этими операциями, а одновременное исполнение INT32- и FP32-инструкций на графическом процессоре TU106 даже позволило рассматриваемой новинке превзойти лучшее игровое решение на основе архитектуры Pascal. В итоге она оказалась между GTX 1080 Ti и RTX 2080 по производительности. А вот условный конкурент в виде Radeon RX Vega 64 работает тут не очень эффективно, отстав более чем вдвое.

Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1048576 штук.

Производительность в этом тесте зависит от драйвера, командного процессора и мультипроцессоров GPU. Все видеокарты компании Nvidia справились с задачей хорошо (с учетом большого количества обрабатываемой геометрии) и примерно одинаково, что говорит скорее об упоре в возможности драйвера. А вот Radeon RX Vega 64 серьезно отстала от них. Вероятно, дело тут в недостаточной программной оптимизации — драйверы компании AMD нуждаются в доработке.

Ну и последний пример с поддержкой D3D12 — уже известный нам nBody Gravity тест, но в другом варианте. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10000 до 128000.

По количеству кадров в секунду даже на довольно мощных видеокартах хорошо видно, что эта вычислительная задача очень сложная, и даже на топовой GeForce RTX 2080 Ti получилось лишь 30 FPS. При этом, самая доступная новинка из серии GeForce RTX, основанная на графическом процессоре TU106, хоть и не обошла топовое решение из предшествующего семейства видеокарт GeForce, но сравнялась с ним, опередив лучшую из видеокарт конкурирующей компании. Неплохой результат для самого слабого GPU новой архитектуры.

В качестве дополнительного синтетического теста с поддержкой Direct3D12 мы взяли известный тест Time Spy из бенчмарка 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Так мы поймем, изменилось ли что-то в поддержке async compute в Turing. Для верности мы протестировали две видеокарты Nvidia в двух разрешениях экрана и двух графических тестах.

По представленным двум диаграммам хорошо видно, что прирост от включения асинхронных вычислений в Time Spy слабо изменился между двумя поколениями GPU. Для Pascal это 3%-7%, а для Turing уже 5%-10% (в зависимости от режима). В новых графических процессорах одновременное исполнение разных типов вычислений было улучшено, на одном и том же шейдерном мультипроцессоре архитектуры Turing могут запускаться и графические и вычислительные шейдеры. Бенчмарк Time Spy использует такие возможности довольно слабо, и вполне возможно, что в будущем мы найдем какой-то другой тест для async compute.

Если рассматривать производительность GeForce RTX 2070 в этой задаче по сравнению с конкурентами, то она весьма неплоха — новинка почти догоняет куда более мощную модель GTX 1080 Ti в двух протестированных разрешениях, особенно при использовании асинхронных вычислений. Что вполне соответствует заявлениям компании об изменениях в вычислительных CUDA-ядрах, связанных с улучшением кэширования и появлением возможности одновременного исполнения целочисленных операций и вычислений с плавающей запятой. И хотя новинка уступает RTX 2080, но совсем не так уж много.

С появлением DXR API в последнем обновлении Microsoft Windows 10 стало возможно как аппаратное ускорение трассировки лучей на специализированных RT-ядрах, имеющихся в чипах архитектуры Turing, так и программное — выполняемое на универсальных CUDA-ядрах. Так как видеокарты семейства Pascal тоже поддерживают DXR API, хотя изначально Nvidia не планировала делать его поддержку на своих решениях ниже архитектуры Volta, мы можем сравнить производительность трассировки на различных семействах GeForce.

Таких тестов и демок пока что немного. Хорошо уже то, что у нас есть демо-программа Reflections компании Epic Games, которая совместно с ILMxLAB и Nvidia сделала свой вариант демонстрации возможностей трассировки лучей в реальном времени — с использованием движка Unreal Engine 4 и технологию Nvidia RTX. Для построения этой 3D-сцены разработчики использовали реальные ресурсы из фильмов серии Star Wars.

Эта технологическая демонстрация отличается качественным динамическим освещением, а также эффектами, полученными при помощи трассировки лучей, включая качественные мягкие тени от площадных источников света (area lights), имитацию глобального затенения Ambient Occlusion и фотореалистичные отражения — все это отрисовывается в реальном времени с очень высоким качеством. Также используется качественное шумоподавление результата трассировки из пакета Nvidia GameWorks, пусть и без использования нейросетей и тензорных ядер. Посмотрим, что получается с производительностью:

Это — одна из самых впечатляющих презентаций возможностей трассировки лучей до сих пор, и весной ее показывали на мощнейшей рабочей станции DGX Station, включающей аж четыре графических процессора архитектуры Volta. Но затем оказалось, что она заработала и на одной GeForce GTX 1080 Ti. Пусть и с явным недостатком производительности, но 6-10 FPS — это точно было лучше наших ожиданий.

А новые видеокарты семейства GeForce RTX могут справиться с трассировкой в реальном времени с неплохой производительностью при условии работы над ней даже единственного GPU. Уже третья модель семейства Turing в этой задаче оказалась заметно быстрее лучшей предшественницы из семейства Pascal — в 3-4 раза, а вот от средней в семействе RTX 2080 она отстала довольно прилично, что нужно учитывать при оценке потенциального использования трассировки лучей в будущих играх. Как показала практика той же Battlefield V, даже возможностей RTX 2080 Ti в играх не сказать, чтобы слишком много, а мощности RTX 2070 вполне может не хватить для того, чтобы скорость рендеринга осталась приемлемой при включении трассировки лучей. Даже в специально оптимизированной демонстрации Star Wars частота кадров снижалась ниже планки минимальной играбельности в 30 FPS.

Еще одним тестом производительности трассировки лучей могла бы стать технологическая демонстрация 3DMark Ray Tracing Tech Demo создателей известных бенчмарков серии 3DMark, но пока что она слишком сырая, и выкладывать ранние результаты запрещено. Демонстрация также работает на всех графических процессорах с поддержкой DXR API, для чего нужно апрельское официальное обновление Windows 10 с включенным в настройках режимом разработчика ну или октябрьское обновление операционной системы.

Эта демонстрация чисто технологическая, она предназначена лишь для показа некоторых возможностей трассировки лучей через DXR API, в ней пока что используется меньшее количество эффектов с трассировкой лучей (отражения) с еще не таким качеством, какое будет в полноценном бенчмарке компании, она в целом еще не оптимизирована и вообще не разрешена для сравнения производительности разных GPU в трассировке лучей, поэтому мы не можем привести конкретные цифры из этой демки.

Мы можем поделиться исключительно личными впечатлениями, без указания точной производительности. Отметим сравнительно неплохой результат даже для GeForce GTX 1080 Ti — по ощущениям, пусть это и был не рендеринг реального времени, но не слайд-шоу даже с учетом неоптимизированного кода. Новый же графический процессор TU106 с аппаратными блоками трассировки лучей, показывает в разы более высокую производительность даже в неоптимизированной технологической демонстрации. Для окончательных выводов мы подождем полноценного теста 3DMark с трассировкой лучей, появление которого ожидается ближе к концу года.

Мы хотели включить в состав нашего пакета синтетических тестов удобный бенчмарк CompuBench, который использует OpenCL и в который входит несколько интересных вычислительных тестов, но он пока что не заработал на GeForce RTX 2080 Ti из-за недоработанных драйверов или ПО. Поэтому нам пришлось искать другие варианты. В частности — довольно старый уже и не слишком оптимизированный тест трассировки лучей, но не аппаратной — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и также использует OpenCL.

Мы сравнили три разных GPU компании Nvidia в этом тесте и так получилось, что новая GeForce RTX 2070 оказалась явно быстрее GTX 1080 Ti из предыдущего семейства. Мощный результат новинки стал следствием значительно улучшенной системы кэширования и большего объема кэш-памяти в большей степени. Но еще удивительнее разница между RTX 2070 и RTX 2080 — ее почти нет! Да, младший GPU в этом тесте хоть и отстал от среднего в линейке, но разница получилась лишь до 5%-10%. Это подтверждает наше предположение в том, что больше всего на результат оказывает влияние размер кэша, который в TU106 и TU104 одинаков.

Рассмотрим также и еще один тест производительности улучшения изображения методом DLSS, который использует возможности специализированных тензорных ядер, ускоряющих задачи глубокого обучения. Натренированная нейросеть использует тензорные ядра, имеющиеся в чипах архитектуры Turing для того, чтобы «дорисовывать» изображение, улучшая его качество даже выше уровня распространенного метода сглаживания TAA. По сути, DLSS можно использовать или для «дешевого» повышения разрешения, или для улучшения качества — аналогично суперсэмплингу.

При тестировании мы использовали раннюю версию бенчмарка Final Fantasy XV Benchmark, который был обновлен для поддержки DLSS-сглаживания. Обновленный тест производительности на базе игрового движка раскрывает явные преимущества DLSS, обеспечивающего качество картинки не хуже, чем с применением TAA при рендеринге в 4K-разрешении, и показывает примерно на треть более высокую производительность при этом:

На этой диаграмме нам больше всего интересно сравнение GeForce RTX 2070 и GTX 1080 Ti. Если при использовании сглаживания методом TAA средняя скорость смены частоты кадров была меньше у рассматриваемой новинки, что близко к теории с учетом преимущества одновременного исполнения FP32 и INT32 на Turing, то при использовании алгоритма DLSS, у новой архитектуры уже появляется явное преимущество, позволяющее опередить лучший GPU из семейства Pascal почти на четверть.

Именно такие тесты и показывают все возможности GPU нового поколения, имеющие специализированные блоки, ускоряющие какие-то конкретные задачи. И все бы хорошо, но в этом конкретном тесте (в его ранней версии, как минимум) при установке в тестовую систему видеокарты модели RTX 2070, минимальная частота кадров по какой-то странной причине оказалась заметно ниже, чем на RTX 2080 — сегодняшняя новинка очень сильно отстает от средней модификации и иногда проваливается ниже минимально допустимых 30 FPS. Увы, логичных объяснений такому поведению мы не нашли. Вероятно, сказалась сырость как бенчмарка, так и видеодрайверов.

Выводы по теоретической части и синтетическим тестам

Судя по теоретическим данным и синтетическим тестам, видеокарта модели GeForce RTX 2070, основанная на графическом процессоре TU106 архитектуры Turing, занимает на рынке игровых видеокарт четкое место под RTX 2080, хотя несколько спорных результатов в бенчмарках мы отметили. Со старыми синтетическими тестами у всех новых GPU линейки RTX дела обстоят не очень хорошо, что сказывается в некоторых из существующих играх, но в целом, влияние архитектурных улучшений в Turing заметно, и новинка точно опережает GTX 1080 из предыдущей линейки, а порой на равных способна поспорить и с топовым решением семейства Pascal в виде GeForce GTX 1080 Ti.

Улучшение производительности кажется некоторым пользователям недостаточным для нового поколения, но мы напоминаем, что в этом семействе GPU компания Nvidia сделала явную ставку на абсолютно новые типы исполнительных блоков, добавив специализированные RT-ядра и тензорные ядра для ускорения трассировки лучей и задач искусственного интеллекта, соответственно. Сделано это в каком-то смысле в ущерб производительности остальным блокам, которых можно было поставить больше, но Nvidia намеренно сыграла на перспективу.

В существующих на сегодняшний день проектах новые технологии почти не применяются (поддержка трассировки лучей появилась пока что лишь в одной игре — Battlefield V, да и то довольно сырая), так что и сиюминутных преимуществ семейству Turing они сейчас не дают, но поддержка трассировки лучей и сглаживание методом DLSS в будущем получат достаточно широкое распространение, и вот в этих условиях сегодняшняя новинка уже будет смотреться совершенно иначе. Правда, конкретно по скорости трассировки лучей нужно быть осторожным — вполне вероятно, что во многих играх производительности RT-блоков в составе TU106 просто не хватит, чтобы включить трассировку лучей и получить достаточно высокую частоту кадров. Все будет зависеть от конкретной реализации и оптимизации.

В общем, по сравнению с условными конкурентами из предыдущего поколения, у GeForce RTX 2070 есть свои сильные и слабые стороны. Даже в существующих игровых приложениях GeForce RTX 2070 должна показать достаточно высокую скорость — несколько выше, чем у GeForce GTX 1080, а иногда доставая даже до GTX 1080 Ti. И в целом это очень неплохой уровень. А что самое приятное — цена новинки радует куда больше стоимости топовой модели семейства Turing, да и потенциал для снижения цены у RTX 2070 остается.

О ценах мы уже не раз говорили, они действительно спорные. Но этому есть несколько объяснений, да и конкретно GeForce RTX 2070 стоит чуть ли не одинаково с самыми мощными GeForce GTX 1080, а получить новые возможности, хоть и пока что слабо раскрытые в играх, за такую цену захочет уже большая доля игроков. Мы продолжаем надеяться и на снижение цен и на более активное внедрение новых возможностей в грядущие игры.

RTX 2070 дает очень неплохую производительность в существующих проектах и предлагает прикоснуться к новым технологиям, которые уже начали появляться в играх. Да, производительности нового GPU при включении трассировки лучей и всех настроек на максимум уже далеко не всегда будет достаточно, но для ознакомления с новыми технологиями этого может хватить. Проверить это можно лишь в играх, к которым мы и переходим.

Игровые тесты

Конфигурация тестового стенда
  • Компьютер на базе процессора AMD Ryzen 7 1800X (Socket AM4):
    • процессор AMD Ryzen 7 1800X (o/c 4 ГГц);
    • СО Antec Kuhler H2O 920;
    • системная плата Asus ROG Crosshair VI Hero на чипсете AMD X370;
    • оперативная память 16 ГБ (2×8 ГБ) DDR4 AMD Radeon R9 UDIMM 3200 МГц (16-18-18-39);
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • блок питания Seasonic Prime 1000 W Titanium (1000 Вт);
    Список инструментов тестирования

    Во всех играх использовалось максимальное качество графики в настройках.

    • Wolfenstein II: The New Colossus (Bethesda Softworks/MachineGames)
    • Tom Clancy’s Ghost Recon Wildlands (Ubisoft/Ubisoft)
    • Assassin’ Creed: Origins (Ubisoft/Ubisoft)
    • BattleField 1 (EA Digital Illusions CE/Electronic Arts)
    • Far Cry 5 (Ubisoft/Ubisoft)
    • Shadow of the Tomb Raider (Eidos Montreal/Square Enix), HDR включен
    • Total War: Warhammer II (Creative Assembly/Sega)
    • Ashes of the Singularity (Oxide Games, Stardock Entertainment/Stardock Entertainment)

    Следует отметить, что в самой новой игре Shadow of the Tomb Raider мы использовали HDR как ключевое расширение функциональности. Исследование показало, что активация HDR оказывает незначительное действие на производительность.

    Разница в производительности, %

    Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
    GeForce RTX 2070 Radeon RX Vega 56 +10,1 +11,5 +18,4
    GeForce RTX 2070 Radeon RX Vega 64 −10,6 −6,1 −6,5
    GeForce RTX 2070 GeForce GTX 1080 +3,4 +9,2 +1,8
    GeForce RTX 2070 GeForce GTX 1070 Ti +15,2 +10,3 +23,4

    Разница в производительности, %

    Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
    GeForce RTX 2070 Radeon RX Vega 56 +15,5 +16,4 +16,7
    GeForce RTX 2070 Radeon RX Vega 64 −3,4 −2,3 −3,9
    GeForce RTX 2070 GeForce GTX 1080 +2,8 +4,9 +6,5
    GeForce RTX 2070 GeForce GTX 1070 Ti +13,1 +14,9 +11,4

    Разница в производительности, %

    Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
    GeForce RTX 2070 Radeon RX Vega 56 +26,1 +21,1 +13,2
    GeForce RTX 2070 Radeon RX Vega 64 +16,0 +6,2 +2,4
    GeForce RTX 2070 GeForce GTX 1080 +3,6 +9,5 +16,2
    GeForce RTX 2070 GeForce GTX 1070 Ti +10,1 +16,9 +22,9

    Разница в производительности, %

    Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
    GeForce RTX 2070 Radeon RX Vega 56 +29,4 +30,8 +35,6
    GeForce RTX 2070 Radeon RX Vega 64 +9,5 +3,3 +3,5
    GeForce RTX 2070 GeForce GTX 1080 +13,7 +9,8 +20,4
    GeForce RTX 2070 GeForce GTX 1070 Ti +24,7 +19,8 +28,3

    Разница в производительности, %

    Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
    GeForce RTX 2070 Radeon RX Vega 56 +6,8 +3,8 +7,3
    GeForce RTX 2070 Radeon RX Vega 64 +1,9 −12,8 −10,2
    GeForce RTX 2070 GeForce GTX 1080 +1,9 +2,5 +7,3
    GeForce RTX 2070 GeForce GTX 1070 Ti +8,9 +10,8 +12,8

    Разница в производительности, %

    Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
    GeForce RTX 2070 Radeon RX Vega 56 +30,0 +20,5 +9,4
    GeForce RTX 2070 Radeon RX Vega 64 +18,2 +2,2 +0,0
    GeForce RTX 2070 GeForce GTX 1080 +4,8 +6,8 +9,4
    GeForce RTX 2070 GeForce GTX 1070 Ti +14,0 +17,5 +25,0

    Разница в производительности, %

    Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
    GeForce RTX 2070 Radeon RX Vega 56 +35,1 +57,1 +76,5
    GeForce RTX 2070 Radeon RX Vega 64 +14,9 +22,2 +36,4
    GeForce RTX 2070 GeForce GTX 1080 +6,9 +12,2 +11,1
    GeForce RTX 2070 GeForce GTX 1070 Ti +20,3 +22,2 +20,0

    Разница в производительности, %

    Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160
    GeForce RTX 2070 Radeon RX Vega 56 +15,7 +19,2 +16,2
    GeForce RTX 2070 Radeon RX Vega 64 +1,0 −3,1 −3,7
    GeForce RTX 2070 GeForce GTX 1080 +1,0 +4,5 +17,9
    GeForce RTX 2070 GeForce GTX 1070 Ti +9,6 +14,8 +25,4

    Рейтинг iXBT.com

    Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и нормирован по самому слабому ускорителю — Radeon R7 240 (то есть сочетание скорости и функций R7 240 приняты за 100%). Рейтинги ведутся по 20 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. Из общего списка выбирается группа карт для анализа, куда входят RTX 2070 и его конкуренты. Для расчета рейтинга полезности использованы розничные цены на середину ноября 2018 года.

    Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
    04 Asus 2070 8 ГБ, 1410—1935/14000 3780 900 42 000
    05 RTX 2070 8 ГБ, 1410—1850/14000 3610 914 39 500
    06 RX Vega 64 8 ГБ, 1250—1630/1890 3360 634 53 000
    07 GTX 1080 8 ГБ, 1607—1885/10000 3200 762 42 000
    08 GTX 1070 Ti 8 ГБ, 1607—1885/8000 2940 852 34 500
    09 RX Vega 56 8 ГБ, 1156—1590/1600 2830 632 44 800

    Мы видим, что в среднем по всем играм и разрешениям RTX 2070 быстрее даже чем GTX 1080 — почти на 13%! Более того, RTX 2070 оказался уже третьим новым ускорителем, который опередил самые быстрые акселераторы AMD на сегодня — Radeon RX Vega 64 (+12,5%) и RX Vega 56 (+33,6%), при том что Vega 56 по цене сравнима с RTX 2070, а Vega 64 сильно дороже. И из всех карт предыдущего поколения лишь GTX 1080 Ti (флагман!) оказался немного быстрее.

    При изучении RTX 2080 мы уверенно говорили, что этот продукт создан для комфортной игры в разрешении 2560×1440, а в ряде игр можно получить отличную производительность и в 4К. Сегодняшние результаты показывают, что и на RTX 2070 можно прекрасно играть в разрешении 2.5К при максимальных настройках качества, лишь в паре игр придется снижать качество графики или разрешение. Ну а в Full HD вообще все шоколадно.

    Рейтинг полезности

    Рейтинг полезности тех же карт получается, если показатели предыдущего рейтинга разделить на цены соответствующих ускорителей.

    Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
    05 RTX 2070 8 ГБ, 1410—1850/14000 914 3610 39 500
    06 Asus 2070 8 ГБ, 1410—1935/14000 900 3780 42 000
    08 GTX 1070 Ti 8 ГБ, 1607—1885/8000 852 2940 34 500
    12 GTX 1080 8 ГБ, 1607—1885/10000 762 3200 42 000
    15 RX Vega 64 8 ГБ, 1250—1630/1890 634 3360 53 000
    16 RX Vega 56 8 ГБ, 1156—1590/1600 632 2830 44 800

    Удивительно, что новинка просто выносит конкурентов с самого начала продаж! Откровенно говоря, мы даже обескуражены таким успехом RTX 2070 при его-то немалой цене. Даже у чуть более дорогих карт партнеров Nvidia на RTX 2070 все равно имеется запас по соотношению возможностей и цены. Из конкурентов только GTX 1070 Ti имеет сравнимую привлекательность.

    Выводы

    Nvidia GeForce RTX 2070 на сегодня третий по скорости ускоритель игрового класса нового поколения. Как и GeForce RTX 2080, он очень хорош для разрешения 2.5К (не говоря уже про Full HD). Кроме того, он, как и RTX 2080/2080 Ti, предлагает ряд новых революционных технологий. Хочется выразить надежду, что новшества типа трассировки лучей и «умных» тензорных ядер реально помогут разработчикам в ближайшем будущем сделать игры более захватывающими в плане графики, несмотря даже на первые негативные впечатления от падения производительности при использовании трассировки лучей в новой игре BattleField V.

    RTX 2070 демонстрирует великолепный прирост производительности в старших разрешениях даже в обычных (без HDR/RT) играх относительно своего формального предка GTX 1070/1070 Ti, а также прилично обходит GTX 1080 (+13%), стоящий по позиционированию на ступень выше. Самый быстрый на сегодня продукт AMD, Radeon RX Vega64, также отстает от RTX 2070 минимум на 12,5%. Как и в случае с RTX 2080/2080 Ti, новый антиалиасинг DLSS продемонстрировал свое преимущество и по скорости, и по качеству. Новый ускоритель предлагает обновленный интерфейс VirtualLink для связи с устройствам виртуальной реальности нового поколения (VR никуда не делся, не умер, просто ожидается очередной скачок технологий).

    Что касается конкретного протестированного нами видеоускорителя Asus Strix RTX 2070 8 ГБ OC (O8G), то все сказанное про RTX 2070 полностью относится и к этой карте, плюс у нее производительность на 4,5% выше референсного RTX 2070. А это значит, что данная карта Asus уже вплотную приближается по скорости к флагману прошлого поколения GTX 1080 Ti. Только представьте себе: новое поколение ускорителей уже почти из среднего сегмента (не хх80, а хх70!), может соперничать с самыми производительными видеокартами на GPU предыдущего поколения! И это мы еще молчим про потенциал разгона, а такого рода ускорители, особенно из серии Strix, очень неплохо разгоняются! Поэтому имеет смысл снова упомянуть мечту оверклокеров средней руки — Nvidia Scanner. Технология простая, как пробка: нажал на кнопку — и жди, оно само покрутит колесики и выдаст вам максимум скорости в разгоне. В частности, данная карта Asus продемонстрировала стабильную работу на частоте 2080/14200 МГц, а это гарантирует обгон [неразогнанного] GTX 1080 Ti! Также стоит упомянуть хорошую систему охлаждения у карты, а любителям моддинга наверняка понравится «умная» подсветка кулера (при желании отключаемая нажатием всего одной кнопки). Есть возможность штатно регулировать работу корпусных вентиляторов в зависимости от нагрева GPU (вентиляторы подключаются непосредственно к видеокарте).

    Итог: GeForce RTX 2070 получился самым успешным из нового семейства по соотношению возможностей и стоимости (даже при весьма высокой цене на старте продаж). Этот ускоритель поддерживает весь набор новых технологий, не так давно привнесенных в копилку индустрии 3D-графики игрового класса компанией Nvidia. То есть потенциал применения всего «новенького» у этого ускорителя также имеется. Какой при этом будет производительность — вопрос. Но этот вопрос мы будем обсуждать по мере выхода игр с поддержкой RT и с внедрением новых возможностей тензорных ядер.

    В номинации «Оригинальный дизайн» карта Asus Strix RTX 2070 8 ГБ OC (O8G) получила награду:

    Благодарим компанию Asus Russia
    и лично Евгения Бычкова
    за предоставленную на тестирование видеокарту

    Для тестового стенда:
    блок питания Seasonic Prime 1000 W Titanium предоставлен компанией Seasonic

    NVIDIA GeForce RTX 2070: технические характеристики и тесты

    NVIDIA начала продажи GeForce RTX 2070 27 августа 2018 по рекомендованной цене 499$. Это десктопная видеокарта на архитектуре Turing и техпроцессе 12 нм, в первую очередь рассчитанная на геймеров. На ней установлено 8 Гб памяти GDDR6 на частоте 14 ГГц, и вкупе с 256-битным интерфейсом это создает пропускную способность 448.0 Гб/с.

    С точки зрения совместимости это двухслотовая карта, подключаемая по интерфейсу PCIe 3.0 x16. Длина референсной версии – 229 мм. Для подключения требуется дополнительный 1x 8-pin кабель питания, а потребляемая мощность – 175 Вт.

    Она обеспечивает хорошую производительность в тестах и играх на уровне 41.60% от лидера, которым является NVIDIA GeForce RTX 4090.

    Общая информация

    Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce RTX 2070, а также о времени начала продаж и стоимости на тот момент.

    Место в рейтинге производительности 71
    Соотношение цена-качество 31.11
    Архитектура Turing (2018−2021)
    Графический процессор Turing TU106
    Тип Десктопная
    Дата выхода 27 августа 2018 (5 лет назад)
    Цена на момент выхода 499$
    Цена сейчас 309$ (0.6x) из 168889 (A100 PCIe 80 GB)

    Отношение производительности к цене. Чем выше, тем лучше.

    Характеристики

    Общие параметры GeForce RTX 2070: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GeForce RTX 2070, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.

    Количество потоковых процессоров 2304 из 20480 (Data Center GPU Max NEXT)
    Частота ядра 1410 МГц из 2610 (Radeon RX 6500 XT)
    Частота в режиме Boost 1620 МГц из 3599 (Radeon RX 7990 XTX)
    Количество транзисторов 10,800 млн из 14400 (GeForce GTX 1080 SLI (мобильная))
    Технологический процесс 12 нм из 4 (GeForce RTX 4080)
    Энергопотребление (TDP) 175 Вт из 2400 (Data Center GPU Max Subsystem)
    Скорость текстурирования 233.3 из 969.9 (H100 SXM5 96 GB)

    Совместимость и размеры

    Параметры, отвечающие за совместимость GeForce RTX 2070 с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания).

    Интерфейс PCIe 3.0 x16
    Длина 229 мм
    Толщина 2 слота
    Дополнительные разъемы питания 1x 8-pin

    Оперативная память

    Параметры установленной на GeForce RTX 2070 памяти — тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая — часть оперативной памяти.

    Тип памяти GDDR6
    Максимальный объём памяти 8 Гб из 128 (Radeon Instinct MI250X)
    Ширина шины памяти 256 бит из 19000 (GeForce RTX 3080 12 GB)
    Частота памяти 14000 МГц из 22400 (GeForce RTX 4080)
    Пропускная способность памяти 448.0 Гб/с из 3276 (Aldebaran)
    Разделяемая память

    Видеовыходы

    Перечисляются имеющиеся на GeForce RTX 2070 видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.

    Видеоразъемы 1x DVI, 1x HDMI, 2x DisplayPort, 1x USB Type-C
    HDMI +
    Поддержка G-SYNC +

    Технологии

    Здесь перечислены поддерживаемые GeForce RTX 2070 технологические решения и API. Такая информация понадобится, если от видеокарты требуется поддержка конкретных технологий.

    VR Ready +

    Поддержка API

    Перечислены поддерживаемые GeForce RTX 2070 API, включая их версии.

    DirectX 12 Ultimate (12_1)
    Шейдерная модель 6.5
    OpenGL 4.6
    OpenCL 1.2
    Vulkan 1.2.131
    CUDA 7.5

    Тесты в бенчмарках

    Это результаты тестов GeForce RTX 2070 на производительность рендеринга в неигровых бенчмарках. Общий балл выставляется от 0 до 100, где 100 соответствует самой быстрой на данный момент видеокарте.

    Общая производительность в тестах

    Это наш суммарный рейтинг производительности. Мы регулярно улучшаем наши алгоритмы, но если вы обнаружите какие-то несоответствия, не стесняйтесь высказываться в разделе комментариев, мы обычно быстро устраняем проблемы.

    Passmark

    Это очень распространенный бенчмарк, входящий в состав пакета Passmark PerformanceTest. Он дает видеокарте тщательную оценку, производя четыре отдельных теста для Direct3D версий 9, 10, 11 и 12 (последний по возможности делается в разрешении 4K), и еще несколько тестов, использующих DirectCompute.

    Охват бенчмарка: 25%

    3DMark Vantage Performance

    3DMark Vantage — это устаревший бенчмарк на базе DirectX 10. Он нагружает видеокарту двумя сценами, одна из которых изображает девушку, убегающую с какой-то военной базы, расположенной в морской пещере, а другая — космический флот, атакующий беззащитную планету. Поддержка 3DMark Vantage была прекращена в апреле 2017 года, и теперь вместо него рекомендуется использовать бенчмарк Time Spy.

    Охват бенчмарка: 17%

    3DMark 11 Performance GPU

    3DMark 11 — это устаревший бенчмарк DirectX 11 от Futuremark. Он использовал четыре теста, основанных на двух сценах: одна из них — это несколько подводных лодок, исследующих затонувший корабль, другая — заброшенный храм в глубине джунглей. Все тесты широко используют объемное освещение и тесселяцию, и, несмотря на то, что выполняются в разрешении 1280×720, являются относительно тяжелыми. Поддержка 3DMark 11 прекращена в январе 2020 года, теперь вместо него предлагается использовать Time Spy.

    Производительность видеокарты NVIDIA GeForce RTX 2070 в играх на высоком разрешении (ультраширокоформатном и 4K)

    Третьей картой GeForce RTX от NVIDIA стала RTX 2070, которую можно назвать наиболее интересной среди видеокарт GeForce Turing. На каком основании? На том простом основании, что это наиболее доступная карта из этой серии, особенно для новичков, которая стоит $499. Она открывает людям относительно дешевый путь в мир RTX-технологий, обеспечивая доступ к специальным возможностям RTX, чего не могут обеспечить другие видеокарты – в том числе карты последнего поколения Pascal.

    Сложно назвать RTX 2070 “заменой” двум другим видеокартам серии, тем более что оценивать ее можно с разных сторон. С точки зрения чистой производительности карта RTX 2070 должна бы в большинстве случаев оказываться позади GTX 1080, но тесты показывают обратное. В конечном итоге RTX 2070 можно поставить позади GTX 1080 Ti, но в некоторых случаях она оказывается не так уж далеко позади.

    Этот обзор будет намного короче, чем мне хотелось бы. Так как я в последнее время усиленно занимался «железом» для рабочих станций, то не мог уделять должного внимания игровому «железу». К счастью, эту кучу удалось немного разгрести, и как только выйдет обновление Windows для RTX, можно будет провести ряд дополнительных тестов.

    1

    Как уже было сказано, с точки зрения чистой производительности технический уровень карты RTX 2070 ниже, чем у GTX 1080, но архитектура Turing несет в себе ряд оптимизаций, которые довольно часто продвигают эту карту вперед.

    В таблице ниже приведены основные характеристики видеокарт NVIDIA текущего и предыдущего поколений.

    Видеокарта Число ядер Базовая тактовая частота, МГц Максимальная вычислительная мощность FP32, TFLOPS Память Пропускная способность памяти, ГБ/с TDP, Вт Цена, USD
    RTX 2080 Ti Turing 4352 1350 13,4 11 ГБ GDDR6 616 250 999
    RTX 2080 Turing 2944 1515 10,0 8 ГБ GDDR6 448 215 699
    RTX 2070 Turing 2304 1410 7,4 8 ГБ GDDR6 448 175 499
    TITAN Xp Pascal 3840 1480 12,1 12 ГБ GDDR5X 548 250 1199
    GTX 1080 Ti Pascal 3584 1480 11,3 11 ГБ GDDR5X 484 250 699
    GTX 1080 Pascal 2560 1607 8,8 8 ГБ GDDR5X 320 180 499
    GTX 1070 Ti Pascal 2432 1607 8,1 8 ГБ GDDR5 256 180 449
    GTX 1070 Pascal 1920 1506 6,4 8 ГБ GDDR5 256 150 379
    GTX 1060 Pascal 1280 1700 4,3 6 ГБ GDDR5 192 120 299
    GTX 1050 Ti Pascal 768 1392 2,1 4 ГБ GDDR5 112 75 139
    GTX 1050 Pascal 640 1455 1,8 2 ГБ GDDR5 112 75 109

    В нашем случае можно сказать, что спецификации – это только половина истории, в которой самое интересное начинается, когда мы доходим до архитектуры Turing. При некоторых нагрузках, а именно – на DirectX 12 (но не только), Turing может продвинуть новые карты GeForce довольно далеко вперед по сравнению с последним поколением, так что карта уровня 2070 почти догоняет 1080 Ti. К сожалению, это редкие случаи, которые к тому же чаще наблюдаются в синтетических тестах, но они позволяют нам надеяться на появление в будущем специальных игровых оптимизаций под данную архитектуру.

    Версия карты RTX 2070 от ASUS серии Republic of Gamers STRIX может похвастаться заводским разгоном, тремя вентиляторами и настраиваемой подсветкой RGB, причем кулер закрывает немного больше, чем два слота. И хорошо, что 2070 не поддерживает SLI.

    Так как эта карта уже предварительно разогнана, пожалуйста, учтите, что результаты тестов будут немного выше, чем у обычных референсных версий.

    Тестовая конфигурация системы и методология тестирования

    Тестовая конфигурация

    Процессор Intel Core i7-8700K (3,7 ГГц, 6 ядер/ 12 потоков)
    Материнская плата EVGA Z370 FTW c BIOS 1.09 (от 20 августа 2018 г.)
    Память G.SKILL TridentZ (F4-3400C16-8GSXW) 2x 8 ГБ DDR4-3400 16-16-16 (1,35 В)
    Графика AMD AMD Radeon RX Vega 64 (8 ГБ; Radeon 18.8.2)
    AMD Radeon RX Vega 56 (8 ГБ; Radeon 18.8.2)
    AMD Radeon RX 580 (8 ГБ; Radeon 18.8.2)
    AMD Radeon RX 570 (4 ГБ; Radeon 18.8.2)
    AMD Radeon RX 550 (2 ГБ; Radeon 18.8.2)
    Графика NVIDIA NVIDIA GeForce RTX 2080 Ti (11 ГБ; GeForce 411.51)
    NVIDIA GeForce RTX 2080 (8 ГБ; GeForce 411.51)
    NVIDIA GeForce RTX 2070 (8 ГБ; GeForce 416.34)
    NVIDIA TITAN Xp (12 ГБ; GeForce 399.07)
    NVIDIA GeForce GTX 1080 Ti (11 ГБ; GeForce 399.07)
    NVIDIA GeForce GTX 1080 (8 ГБ; GeForce 399.07)
    NVIDIA GeForce GTX 1070 Ti (8 ГБ; GeForce 399.07)
    NVIDIA GeForce GTX 1070 (8 ГБ; GeForce 399.07)
    NVIDIA GeForce GTX 1060 (6 ГБ; GeForce 399.07)
    NVIDIA GeForce GTX 1050 Ti (4 ГБ; GeForce 399.07)
    NVIDIA GeForce GTX 1050 (2 ГБ; GeForce 399.07)
    Накопитель Kingston SSDNow V310 960 ГБ (SATA 6 Гбит/с)
    Блок питания Corsair RM650x (650 Вт)
    Корпус NZXT S340 Elite Mid-tower
    Система охлаждения Corsair Hydro H100i V2 AIO Liquid Cooler (240 мм)
    Операционная система Windows 10 Pro (64-разрядная, версия 17134)

    Бенчмарки

    Наша тестовая подборка содержит в общей сложности восемь игр. Некоторые из них уже использовались в этом качестве, тогда как другие представлены здесь впервые: Monster World Hunter, Fortnite и F1 2018. Девятым пунктом я планировал включить сюда PlayerUnknown’s Battlegrounds, но в этой игре разброс результатов получился слишком большим для того, чтобы считать их достоверными (в Fortnite, например, данная проблема не наблюдалась).

    • Battlefield 1
    • Deus Ex: Mankind Divided – AMD partner
    • F1 2018
    • Far Cry 5 – AMD partner
    • Fortnite
    • Monster Hunter World
    • Rise of the Tomb Raider – NVIDIA partner
    • Tom Clancy’s Ghost Recon Wildlands – NVIDIA partner

    Shadow of the Tomb Raider заменит в нашем тестовом арсенале Rise of the Tomb Raider, как только выйдет усиленная RTX-версия этой игры. К тому же воспользоваться преимуществами этих RTX-нововведений можно будет только тогда, когда Microsoft выпустит свой API DXR – как ожидается, вместе с осенним обновлением Redstone 5. В настоящий момент мы вынуждены обойтись традиционным вариантом тестирования. Переходим к бенчмаркам.

    Battlefield 1

    bf11

    bf12

    bf13

    bf14

    Все десять видеокарт, результаты которых здесь представлены, смогут справиться с разрешением 1440p в текущих версиях игр, в том числе Battlefield 1. Обратите внимание, что эти результаты не обязательно абсолютно соответствуют онлайн-геймплею, но показатели видеокарт относительно друг друга должны оставаться теми же. Чем более мощную видеокарту вы бросите в игру, тем выше получите частоту кадров и/ или детализацию. Большинство из этих видеокарт потянут и частоту обновления 144 Гц на разрешении 1080p с настройками Ultra, но с некоторыми придется частично отказаться от этих опций для сохранения приемлемой частоты кадров.

    На разрешении 4K карта RTX 2070 STRIX в среднем достигает 60 FPS, причем особенно приятно видеть это значение при максимальной детализации. И на всех трех разрешениях сразу за NVIDIA RTX 2070 располагается Vega 64.

    Deus Ex: Mankind Divided

    de1

    de2

    de3

    de4

    Mankind Divided – это одна из тех редких игр, которые будут напрягать видеокарты в течение как минимум нескольких лет после своего выхода. Если вы не глядя выставите настройки Medium или выше, то, вероятно, дальше вы сами найдете инструменты для дальнейшей настройки, если ваша система относится к классу high-end (или супер-пупер high-end).

    В то время как в BF1 карта RTX 2070 выдает 60 FPS на разрешении 4K, в Mankind Divided на том же разрешении с отметкой 60 FPS справляется только RTX 2080 Ti. На разрешении 4K, снизив детализацию, с топовыми видеокартами вы можете получить приемлемые значения частоты кадров, но карты более низкого уровня здесь будут испытывать затруднения. На разрешении 3440×1440 все карты обеспечат гладкую производительность, хотя для получения дополнительной прибавки к частоте кадров нижестоящие карты потребуют дополнительной настройки уровней детализации.

    F1 2018

    f11

    f12

    f13

    f14

    В этой игре и на 1440p, и на ультраширокоформатном разрешении RTX 2070 и все остальные представленные здесь видеокарты без проблем сделают свою работу. Тем, кто мечтает о частоте обновления 144 Гц, максимальную детализацию при этом обеспечит только RTX 2080 Ti, хотя и некоторые карты уровнем ниже легко справятся с этим после проведения некоторых дополнительных манипуляций.

    На разрешении 4K карта RTX 2070 берет отметку 60 FPS «с дюймовым запасом» и в результате оказывается сразу за 1080 Ti. Хотя по спецификациям GPU 1080 Ti имеет вычислительную мощность примерно на 4 TFLOPS больше, чем у 2070, на самом деле мы не знаем, как технические различия между этими видеокартами могут проявляться на практике. В целом, карта 2070 предлагает очень хорошую производительность и во всех тестах с легкостью превосходит GTX 1080.

    Far Cry 5

    fc51

    fc52

    fc53

    fc54

    В Far Cry 5 мы наблюдаем ту же историю, что и в других играх. Карта 2070 располагается в конце первой пятерки видеокарт и как всегда – “сразу следом” за 1080 Ti и впереди карты AMD Radeon RX Vega 64.

    На разрешении 4K все карты, располагающиеся выше Vega 64 и RTX 2070 (включая и их), смогут обеспечить частоту кадров 60 FPS, если дополнительно подкрутить некоторые графические настройки. В данном тестировании применялся уровень детализации Ultra, так что в части оптимизации производительности имеется достаточное пространство для маневра. На ультраширокоформатном разрешении и на 1440p любая из этих карт обеспечит отличную игровую практику.

    Fortnite

    fn1

    fn2

    fn3

    fn4

    Fortnite – не самая мощная игра, но, поскольку она де-факто относится к классу eSports, высокая частота кадров является ее визитной карточкой. К счастью, на разрешении 1440p для высокой частоты кадров вам не потребуется слишком крутое «железо»: Vega 56 выдает 72 FPS, а RTX 2070 – без малого 110 FPS. Ультраширокоформатное разрешение также не является слишком большой нагрузкой, и даже карты из нижней части турнирной таблицы показывают результаты, близкие к 60 FPS.

    На разрешении 4K карты из нижней половины турнирной таблицы испытывают затруднения. И даже RTX 2070 не добирается до 60 FPS, но это еще одна игра, которая предлагает достаточно широкие возможности в части графических настроек, так что выйти на 60 FPS можно путем нескольких щелчков мышью. Но когда мы видим, что карта уровня RTX 2080 Ti на разрешении 4K доходит только до 78 FPS, это напоминает нам о том, какая сумасшедшая вещь на самом деле 4K-дисплей с частотой обновления 144 Гц. Если бы только игры чаще поддерживали конфигурации из нескольких видеокарт!

    Monster Hunter World

    mh1

    mh2

    mh3

    Как я недавно выяснил, Monster Hunter World не поддерживает ультраширокоформатные мониторы. Кроме того, это игра, которая не внушает доверия в части оптимизации, но, как показывают по крайней мере наши тесты, она дает измеряемые и воспроизводимые результаты.

    На разрешении 4K с высокими настройками детализации эта игра оказывается действительно сильной нагрузкой. Отметку 60 FPS берет только RTX 2080 Ti, и даже RTX 2070 немного не дотягивает до 45 FPS. Опять же, в этом тестировании не рассматривался сниженный уровень детализации, поэтому после некоторой дополнительной работы с настройками можно будет получить более высокую частоту кадров и с видеокартами классом ниже.

    Rise of the Tomb Raider

    tr1

    tr2

    tr3

    tr4

    У меня не было времени проводить эксперименты или тесты с Shadow of the Tomb Raider, поэтому RotTR будет фигурировать еще как минимум в этой статье. До сих пор я слышал противоречивые отзывы о надежности Shadow, поэтому не вполне в ней уверен. Учитывая одновременно и то, что предполагается скорый выход поддержки RTX, и то, что Microsoft затягивает выпуск обновления Windows 10 с этой поддержкой, мы имеем дело с немного странной ситуацией.

    Тем не менее, на разрешении 1440p все эти видеокарты легко справляются с игрой при максимальной детализации. Ультраширокоформатное разрешение начинает расставлять вещи по своим местам, но даже здесь худшие результаты, показанные картами относительно низкого класса, оказываются очень близко к 60 FPS.

    На разрешении 4K с максимальной детализацией только карты начиная с RTX 2080 и выше берут отметку 60 FPS. Карта RTX 2070 показывает достаточно приличный результат – 51 FPS. Чтобы убить медведя, то есть добиться 60 FPS, вы можете воспользоваться дополнительными возможностями настройки – это позволит с легкостью выйти на нужную частоту кадров, по крайней мере с близких к ней значений.

    Tom Clancy’s Ghost Recon Wildlands

    rw1

    rw2

    rw3

    rw4

    Wildlands показывает нам еще один пример того, как хорошие современные видеокарты справляются с игрой на разрешении 1440p: даже относительно слабая карта GTX 1070 подбирается к значению 60 FPS.

    Игра на разрешении 4K дает существенную нагрузку, с которой лучше всех справляется видеокарта RTX 2080 Ti, возвышаясь над всеми остальными и над отметкой 60 FPS. На ультраширокоформатном разрешении карта RTX 2070 открывает группу карт, превзошедших отметку 60 FPS, хотя опять же, снижение некоторых настроек позволит выйти на эту частоту кадров и с некоторыми картами, занявшими места ниже.

    UL 3DMark

    3dm1

    3dm2

    3dm3

    В тестах Fire Strike с DirectX 11 карта RTX 2070 показывает ожидаемые результаты. Она сохраняет шаговое преимущество перед картой Vega 64 и более существенное – перед GTX 1080. Карты RTX 2080 и GTX 1080 Ti оказываются заметно впереди, что тоже ожидаемо.

    А вот достаточно неожиданный результат в Time Spy с DirectX 12:

    3dm4

    Я не уверен, что предсказывал это в августе во время презентации RTX, но эти новые карты Turing просто в клочья рвут нагрузку с DirectX 12. Разница результатов в Fire Strike была ожидаема, но в Time Spy потенциал архитектуры Turing помог RTX 2070 почти догнать GTX 1080 Ti и в то же время заметно опередить Vega 64

    UL VRMark

    vrm1

    vrm2

    В тесте 3DMark Time Spy с DirectX 12 карта RTX 2070 продемонстрировала отличную производительность, и аналогичные результаты мы видим в тесте VRMark Blue Room. Интересно, что этот тест работает на DirectX 11 (на DX12 – Cyan), так что оптимизации Turing и здесь дают значительную прибавку к производительности. И снова RTX 2070 выступает на одном уровне с GTX 1080 Ti.

    Unigine Superposition

    sp1

    sp2

    sp3

    По результатам теста Extreme с интенсивной нагрузкой на разрешении 1080p карта RTX 2070 оказалась на том месте, где мы примерно и ожидали. В тесте 4K Optimized, где используются не такие высокие графические настройки (чтобы проще было обеспечить разрешение 4K), карты NVIDIA демонстрируют потрясающую силу, а лучшая карта AMD всего лишь замыкает восьмерку сильнейших.

    Энергопотребление

    power

    По энергопотреблению карта RTX 2070 оказывается на одном уровне с Vega 56 и примерно на 10 Вт позади более быстрой RTX 2080. В общем-то, комментировать здесь особенно нечего.

    Заключение

    Выход карт GeForce RTX стал интересным и немного странным событием. Когда на рынок вышли карты RTX 2080 Ti и 2080, все обозреватели были вынуждены априори предупредить о том, что специальные возможности RTX (DLSS, рейтрейсинг) пока недоступны. Но я сомневаюсь, что в тот момент многие могли предположить, что и в ноябре эти специальные возможности все еще будут недоступны.

    Компания NVIDIA была в курсе того, что для полного раскрытия потенциала видеокарт RTX Turing потребуется Октябрьское обновление Windows 10 с API DirectX DXR. Но поскольку в новой версии Windows 10 обнаружились ошибки, компания Microsoft после официального релиза была вынуждена на некоторое время задержать выход обновления. Однако в данный момент уже можно сказать, что мы получим Октябрьское обновление в текущем месяце.

    В конечном счете это означает, что результатов исследований истинных возможностей RTX придется подождать. В последнее время я не слышал много новостей об RTX – вероятно, потому, что в NVIDIA не знали, когда Microsoft решит свою часть этого уравнения. Тем не менее я предполагаю, что RTX – это действительно что-то потрясающее. Просто осталось еще немного подождать.

    2

    Когда я узнал, что NVIDIA не проводила испытаний опытных образцов RTX 2070, доверив это своим партнерам, то очень удивился – как такое могло быть. Я до сих пор не вполне в этом уверен, так как RTX 2070 – это отличная карта, соответствующая запрашиваемой цене. Возможно, в NVIDIA посчитали, что в лабораториях обозревателей слишком много карт Founders Editions, что справедливо в отношении некоторых из нас.

    Вернемся к цене – эта модель ASUS STRIX стоит примерно на $100 дороже по сравнению с рекомендуемой (около $500) ценой RTX 2070. Я терпеть не могу молча соглашаться с такими вещами, если не уверен, что все эти премиум-фишки того стоят, но, как и в большинстве подобных случаев, здесь все зависит от того, во сколько вы оцениваете функционал карты в части оверклокинга и, возможно, в части охлаждения. В модели STRIX применено решение с тремя вентиляторами, которое для моей тестовой системы оказалось довольно габаритным.

    Помимо увеличенных тактовых частот (которые можно самостоятельно получить и на других картах, разогнав их вручную), карта ROG STRIX предлагает настраиваемую RGB-подсветку, двойной BIOS и уже упомянутый трехвентиляторный кулер, который, возможно, будет эффективнее, чем кулер на 2070 FE. Но эта оценка базируется только на том факте, что здесь у нас три вентилятора вместо двух на модели RTX 2070 версии FE. В то же время модель ASUS STRIX – это увесистая карта, закрывающая более двух слотов.

    3

    Как я уже говорил, этот обзор получился гораздо более сжатым, чем мне хотелось бы. Потому что я был занят тестированием «железа» для рабочих станций и не мог уделять должного внимания игровому тестированию – даже эту видеокарту я не смог исследовать достаточно подробно, как я того хотел. Именно поэтому в заголовке этой статьи карта позиционируется как карта NVIDIA, а не ASUS: у меня просто не было возможности детально изучить специфические особенности этой модели ASUS, и выносить в заголовок словосочетание «видеокарта ASUS» было бы не вполне корректно.

    По результатам проведенного тестирования Techgage дает следующий прогноз, касающийся игровой производительности карты RTX 2070:

    Видеокарта 1080p 1440p 3440×1440 4K 144 Гц
    (при разрешении 1080p
    с высокой детализацией)
    RTX 2080 Ti ★★★★★ ★★★★★ ★★★★ ★★★★ ★★★★
    RTX 2080 ★★★★★ ★★★★★ ★★★★ ★★★ ★★★★
    TITAN Xp ★★★★★ ★★★★★ ★★★★ ★★★ ★★★★
    GTX 1080 Ti ★★★★★ ★★★★★ ★★★★ ★★★ ★★★★
    RTX 2070 ★★★★★ ★★★★★ ★★★★ ★★★ ★★★
    GTX 1080 ★★★★★ ★★★★ ★★★ ★★ ★★★
    RX Vega 64 ★★★★★ ★★★★ ★★★ ★★ ★★★
    GTX 1070 Ti ★★★★ ★★★ ★★ ★★
    RX Vega 56 ★★★★ ★★★ ★★ ★★
    GTX 1070 ★★★★ ★★★ ★★
    RX 580 ★★★ ★★
    GTX 1060 ★★★ ★★
    RX 570 ★★★ ★★
    GTX 1050 Ti ★★
    RX 560 ★★
    GTX 1050
    RX 550

    ★★★★★ 60 FPS? Скорее 100 FPS. Игры будущего покажут.

    ★★★★ Легко перекрывает 60 FPS при высоких графических настройках.

    ★★★ Около 60 FPS при высоких графических настройках.

    ★★ В целом удовлетворительно, но для выхода на 60 FPS потребуются дополнительные манипуляции.

    Наша модель ASUS STRIX имеет заводской разгон, что не очень удачно с точки зрения тестирования – в идеале я предпочел бы стандартные тактовые частоты. Иногда заводской разгон просто необходим, но карты серии NVIDIA Turing, к счастью, разгоняются очень легко, так что вы при желании, приложив небольшие усилия по ручной настройке оверклокинга, вполне сможете получить такую же или почти такую же производительность, как у этой карты с заводским разгоном.

    Nvidia сообщила дату начала продаж новой видеокарты RTX 2070

    Nvidia объявила точную дату начала продаж видеокарты GeForce RTX 2070, которая будет стоить 48 000 рублей (Founders Edition). Оказалось, что графический процессор поступит в продажу позже, чем его старшие братья RTX 2080 и RTX 2080Ti.

    Beautiful any way you look at it.

    The GeForce RTX 2070 will be available on October 17th. #GraphicsReinvented

    GeForce RTX 2070 выйдет 17 октября этого года. Видеокарта будет младшей в линейке графических процессоров RTX с поддержкой технологии трассировки лучей в реальном времени.

    GeForce RTX 2070 в версии Founders Edition порадует геймеров тактовой частотой в 1 710 МГц, 8 ГБ видеопамяти и быстродействием памяти в 14 Гб в секунду.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *