Обзор видеоускорителя Nvidia GeForce GTX 1650: Turing спускается в бюджетный сегмент
Как быстро бежит время. Прошло уже более восьми месяцев с анонса линейки видеокарт GeForce, основанной на графических процессорах семейства Turing, и за это время было выпущено много моделей GPU. Nvidia традиционно идет от топовой модели вниз, выпуская все менее дорогие варианты, входящие в состав линеек GeForce RTX и GeForce GTX. В апреле пришло время и для самой дешевой видеокарты на основе текущей архитектуры Turing, которая получила наименование GeForce GTX 1650.
Новое решение заняло ценовую нишу $149 (на североамериканском рынке) и стало бюджетным вариантом Turing без поддержки аппаратной трассировки лучей и ускорения глубокого обучения. Оно предназначено для игры в разрешении Full HD при не самых высоких настройках графики. Напомним, что после выхода четверки мощных видеокарт линейки GeForce RTX 2000, ставших первыми решениями с аппаратным ускорением трассировки лучей, компания Nvidia выпустила и менее дорогие варианты Turing, известные под кодовыми именами TU11x, под торговой маркой GeForce GTX 1600.
Применяемые в этой линейке GPU менее сложны за счет отказа от выделенных специализированных блоков (RT и тензорных ядер) и поэтому дешевле в производстве, что отлично подходит для бюджетной серии. Сначала Nvidia выпустила пару карт GTX 1660: обычную и с приставкой Ti, обе основаны на разных версиях чипа TU116. Теперь младшая серия была расширена при помощи модели GeForce GTX 1650, получившей еще менее сложный графический процессор.
Рассматриваемая сегодня новинка основана на графическом процессоре TU117, также не имеющем RT-ядер и тензорных ядер. Зато этот GPU имеет максимально возможную энергоэффективность в рамках определенного транзисторного бюджета, что важно для современных игр без применения трассировки лучей. Благодаря архитектурным улучшениям, по производительности и энергоэффективности видеокарты семейства Turing превосходят аналогичные GPU из предыдущих семейств компании Nvidia.
Модель GeForce GTX 1650 выглядит довольно интересным решением для обновления видеоподсистемы тех игроков, кто еще не сделал апгрейд на решения линейки GeForce GTX 10 и до сих пор использует видеокарты уровня GeForce GTX 950 или ниже. Новинка предлагает таким пользователям уровень производительности примерно вдвое выше, что особенно важно для требовательных современных игр, но и в самых популярных многопользовательских проектах новый GPU способен дать приличный прирост скорости рендеринга.
Так как рассматриваемая модель видеокарты компании Nvidia основана на графическом процессоре архитектуры Turing, имеющей много общего с предыдущими архитектурами Pascal и Volta, перед прочтением материала мы советуем ознакомиться и с другими нашими статьями:
- [14.03.19] Nvidia GeForce GTX 1660 — Turing уже в массовом сегменте
- [12.03.19] Nvidia GeForce GTX 1660 Ti — новая «промежуточная» линейка на Turing, но без технологий GeForce RTX
- [19.09.18] Nvidia GeForce RTX 2080 Ti — обзор флагмана 3D-графики 2018 года
- [14.09.18] Игровые видеокарты Nvidia GeForce RTX — первые мысли и впечатления
- [06.06.17] Nvidia Volta — новая вычислительная архитектура
Наименование видеокарты отличается от старшей модели GTX 1660 численным значением, что выглядит логично и соответствует принятой системе наименования видеокарт Nvidia. Как и другие бюджетные модели, видеокарта GTX 1650 не имеет референсного варианта, и производители видеокарт сделали собственные платы на основе внутреннего эталонного дизайна. В продажу сразу же поступило множество вариантов с различными характеристиками и системами охлаждения.
GeForce GTX 1650 заменяет в линейке модель предыдущего поколения GTX 1050, которая также была урезана аналогичным образом, но цены на Turing повысились по сравнению с Pascal и в этом случае, как и во всей новой линейке. Если GTX 1050 имел рекомендованную цену в $109, то GTX 1650 продается по цене от $149, так что он ближе к GTX 1050 Ti, который имел рекомендованную цену в $139. Впрочем, в этом поколении все цены выросли — каждая из видеокарт семейства Turing продается дороже аналогичной по позиционированию карты на чипе Pascal.
Что касается конкурента, то у AMD есть многочисленные варианты из линейки Radeon RX 500, и они имеют очень хорошее сочетание цены и производительности. Вероятно, правильнее всего будет сравнивать новинку с двумя вариантами Radeon RX 570: с 8 ГБ и 4 ГБ памяти. Младшая модель Radeon RX 570 будет выглядеть привлекательнее за счет меньшей цены, а старшая — за счет большего объема видеопамяти. Впрочем, у Turing (пусть и в урезанном виде) также есть свои преимущества.
В GeForce GTX 1650 используется проверенное сочетание 128-битной шины памяти и GDDR5-памяти. Возможные варианты объема видеопамяти понятны: 2 ГБ, 4 ГБ или 8 ГБ, и минимальный объем видеопамяти для GTX 1650 повысили до 4 ГБ, моделей с 2 ГБ быть не должно, в отличие от имеющихся подобных вариантов GTX 1050. Меньшего объема VRAM уже откровенно мало, а больший вряд ли будет полезен для этой ценовой категории, поэтому и была выбрана золотая середина — 4 ГБ.
Неудивительно, что младшая модель Turing также потребляет энергии меньше остальных видеокарт семейства. Все предыдущие решения этого позиционирования у Nvidia имели энергопотребление до 75 Вт, и GTX 1650 не выбилась из этого ограничения. Так что при референсных частотах этот GPU не требует дополнительного питания и ему хватит 75 Вт, получаемых по шине. Впрочем, партнеры компании могут решить этот вопрос альтернативным методом, установив разъем питания для большего разгона (фабричного или пользовательского) и лучшей стабильности.
Количество и тип разъемов вывода информации на дисплеи зависит исключительно от конкретной карты — кто-то из производителей ставит больше разъемов, кто-то меньше, и кто-то решит выделиться необычным набором из серой массы стандартных решений. Сам же по себе новый GPU поддерживает все те же разъемы и стандарты DVI, HDMI, DisplayPort и VirtualLink, что и более мощные решения семейства.
Архитектурные особенности
Как мы уже отмечали в обзоре GeForce GTX 1660 Ti, главное отличие TU11x от TU10x — отсутствие аппаратных блоков для ускорения трассировки лучей и тензорных ядер. Это сделано для того, чтобы недорогие графические процессоры были менее сложными и эффективнее справлялись с традиционным рендерингом. В результате, графический процессор TU117, как и TU116, получился значительно проще по количеству транзисторов и площади по сравнению с самым слабым из «полноценных» чипов семейства Turing.
По сути, это упрощенная версия TU116 с меньшим количеством исполнительных блоков, но теми же поддерживаемыми технологиями. Из TU116 как будто были удалены: треть CUDA-ядер, треть каналов памяти и блоков ROP, и все это для того, чтобы получить сравнительно простой GPU для бюджетного решения. Впрочем, эта простота относительна — с его то 200 мм² площадью и 4,7 млрд транзисторов, получился практически такой же по размеру чип, как GP106, известный нам по GeForce GTX 1060 — и он явно более высокого класса.
Для наглядности разницы между различными моделями графических процессоров предлагаем рассмотреть характеристики нескольких видеокарт Nvidia из последних поколений, близких друг к другу по цене:
GTX 1650 | GTX 1660 | GTX 1050 Ti | GTX 1050 | |
---|---|---|---|---|
Кодовое имя GPU | TU117 | TU116 | GP107 | GP107 |
Кол-во транзисторов, млрд | 4,7 | 6,6 | 3,3 | 3,3 |
Площадь кристалла, мм² | 200 | 284 | 132 | 132 |
Базовая частота, МГц | 1485 | 1530 | 1290 | 1354 |
Турбо-частота, МГц | 1665 | 1785 | 1392 | 1455 |
CUDA-ядра, шт | 896 | 1408 | 768 | 640 |
Производительность FP32, TFLOPS | 3,0 | 5,0 | 2,1 | 1,9 |
Блоки ROP, шт | 32 | 48 | 32 | 32 |
Блоки TMU, шт | 56 | 88 | 120 | 80 |
Объем видеопамяти, ГБ | 4 | 6 | 4 | 2 |
Шина памяти, бит | 128 | 192 | 128 | 128 |
Тип памяти | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Частота памяти, ГГц | 8 | 8 | 7 | 7 |
ПСП памяти, ГБ/с | 128 | 192 | 112 | 112 |
Энергопотребление TDP, Вт | 75 | 120 | 75 | 75 |
Рекомендованная цена, $ | 149 | 219 | 139 | 109 |
Модификация TU117 в составе GeForce GTX 1650 имеет два кластера GPC, содержащие 896 CUDA-ядер, что совсем немногим больше, чем у GeForce GTX 1050, но из-за архитектурных улучшений в Turing, производительность новинки должна быть выше даже при прочих равных. Новый чип имеет в своем составе 32 блока ROP и 128-битную шину памяти, обеспечивающую работу GDDR5-памяти на эффективной частоте в 8 ГГц. Итоговая пропускная способность памяти получается 128 ГБ/с, что лишь немногим выше аналогичного показателя для GTX 1050.
Интересно, что CUDA-ядра работают на несколько меньшей тактовой частоте, по сравнению с другими решениями семейства Turing — графический процессор GTX 1650 работает на турбо-частоте в 1665 МГц. Чисто теоретически, GTX 1650 должен обеспечить примерно две трети производительности от старшей модели в линейке Nvidia — GeForce GTX 1660, но на практике может быть даже чуть ближе к ней.
Вполне возможно, что в дальнейшем на основе TU117 будут выпущены и еще какие-то решения, но пока что речь идет исключительно о GeForce GTX 1650, модели с приставкой Ti не было выпущено. Что тем более интересно, так как в GTX 1650 применяется не полная версия чипа TU117. У этой версии выключен один кластер TPC, состоящий из пары мультипроцессоров SM по 64 CUDA-ядер. Так что у Nvidia есть еще небольшой задел для маневра — к примеру, ускоренного по тактовой частоте полноценного TU117 с большим количеством ядер в виде GTX 1650 Ti.
Если сравнивать по пиковым показателям, то GTX 1650 должна обеспечить около 60%-70% производительности GTX 1660, а по сравнению с GTX 1050 новая видеокарта быстрее решения архитектуры Pascal вообще по всем показателям, и даже GTX 1050 Ti уступает новинке. Но главное преимущество Turing заключается в архитектурных улучшениях и максимальной эффективности. В обзоре GeForce GTX 1660 Ti мы подробно писали об изменениях в TU116 и основных его возможностях, это же относится и к TU117. Эти чипы по своей функциональности соответствует старшим графическим процессорам семейства TU10x, за исключением поддержки аппаратной трассировки лучей и ускорения задач глубокого обучения при помощи тензорных ядер.
В архитектуре Turing инженеры компании Nvidia внедрили множество других улучшений по сравнению с предыдущей архитектурой: одновременное исполнение операций с плавающей запятой FP32 и целочисленных INT32, значительно улучшенная система кэширования данных и несколько новых технологий рендеринга: программируемый конвейер обработки геометрии, переменная частота затенения, затенение в текстурном пространстве, улучшенная поддержка технологий DirectX 12, относящихся к уровню возможностей Feature Level 12_1.
Архитектурой Turing поддерживаются новые технологии для увеличения производительности в играх: Variable Rate Shading (VRS) — переменная частота затенения, Texture-Space Shading — затенение в текстурном пространстве, Multi-View Rendering — отрисовка с нескольких позиций, Mesh Shading — полностью программируемый конвейер обработки геометрии. Также в графических процессорах Turing были улучшены последние слабые места архитектуры Pascal относительно конкурирующей архитектуры GCN у AMD, которые могли приводить к снижению производительности в ПК-играх на Pascal, так как их код был оптимизирован для GCN. Часть улучшений в Turing пришла из Volta, а часть — абсолютно новые архитектурные новинки, которые есть только в новейшем поколении.
В целом, младший графический процессор TU117 обеспечивает неплохой баланс производительности и энергопотребления, поддерживая почти все возможности старших чипов семейства Turing, нацеленные на повышение производительности и энергоэффективности, включая поддержку одновременного выполнения целочисленных операций и операций с плавающей точкой, унифицированную архитектуру памяти с увеличенным объемом L1-кэша.
По данным Nvidia, в Full HD-разрешении модель GeForce GTX 1650 оказалась примерно вдвое быстрее, чем GTX 950, и до 70% быстрее аналогичной модели прошлого поколения — GTX 1050. А так как новинка не требует подключения дополнительного питания, то она стала доступным и простым вариантом для модернизации графической подсистемы для владельцев подобных GPU. Кроме этого, GeForce GTX 1650 будет неплохим выбором и для новых игровых ПК начального уровня.
Такая видеокарта, не требующая дополнительного питания, отлично подойдет и для тех систем, которые ограничены по потреблению энергии, вроде домашних кинотеатров. Хотя дискретные GPU не очень часто используются в таких системах, но более мощный графический процессор с современными возможностями станет отличной заменой для решений серии GTX 1050. Единственный нюанс — хотя можно было бы предположить, что TU117 по своим видеовозможностям не будет отличаться от TU116, это не так.
Если в GTX 1660 применяется новый блок NVEnc последнего поколения (Turing), то GTX 1650 отличается блоком предыдущей версии (Volta). Применяемая в новом GPU версия примерно аналогична той, что была в Pascal и обеспечивает то же качество закодированного видео, что и GTX 1050, например. А блок NVEnc семейства Turing работает на 15% эффективнее и имеет дополнительные улучшения для снижения количества артефактов. Впрочем, возможностей NVEnc поколения Volta достаточно для бюджетных ПК, и в целом GTX 1650 является отличной картой и для HTPC, не требующей подключения дополнительного питания.
Более подробно со всеми возможностями семейства Turing вы можете ознакомиться в большом обзоре GeForce RTX 2080 Ti.
Особенности видеокарты
Объект исследования: ускоритель трехмерной графики (видеокарта) MSI GeForce GTX 1650 Gaming X 4G 4 ГБ 128-битной GDDR5
Сведения о производителе: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США. Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) — около 5000 человек.
Характеристики карты
MSI GeForce GTX 1650 Gaming X 4G 4 ГБ 128-битной GDDR5 | |
---|---|
GPU | GeForce GTX 1650 (TU117) |
Интерфейс | PCI Express x16 |
Частота работы GPU (ROPs), МГц | Референс: 1485—1665(Boost)—1825(Max) MSI : 1485—1860(Boost)—1935(Max) |
Частота работы памяти (физическая (эффективная)), МГц | 2000 (8000) |
Ширина шины обмена с памятью, бит | 128 |
Число вычислительных блоков в GPU | 14 |
Число операций (ALU) в блоке | 64 |
Суммарное количество блоков ALU (CUDA) | 896 |
Число блоков текстурирования (BLF/TLF/ANIS) | 56 |
Число блоков растеризации (ROP) | 32 |
Число блоков RayTracing | нет |
Число тензорных блоков | нет |
Размеры, мм | 245×110×36 |
Количество слотов в системном блоке, занимаемые видеокартой | 2 |
Цвет текстолита | черный |
Энергопотребление пиковое в 3D, Вт | 74 |
Энергопотребление в режиме 2D, Вт | 15 |
Энергопотребление в режиме «сна», Вт | 10 |
Уровень шума в 3D (максимальная нагрузка), дБА | 21,6 |
Уровень шума в 2D (просмотр видео), дБА | 18,0 |
Уровень шума в 2D (в простое), дБА | 18,0 |
Видеовыходы | 1×HDMI 2.0b 2×DisplayPort 1.4 |
Поддержка многопроцессорной работы | нет |
Максимальное количество приемников/мониторов для одновременного вывода изображения | 3 |
Питание: 8-контактные разъемы | 0 |
Питание: 6-контактные разъемы | 1 |
Максимальное разрешение/частота, Display Port | 3840×2160@160 Гц (7680×4320@30 Гц) |
Максимальное разрешение/частота, HDMI | 3840×2160@60 Гц |
Максимальное разрешение/частота, Dual-Link DVI | 2560×1600@60 Гц (1920×1200@120 Гц) |
Максимальное разрешение/частота, Single-Link DVI | 1920×1200@60 Гц (1280×1024@85 Гц) |
Средняя цена | 12 500 руб на середину мая 2019 г. |
Особенности карты и сравнение с GTX 1060
MSI GeForce GTX 1650 Gaming X 4G | Nvidia GeForce GTX 1060 |
---|---|
вид спереди | |
![]() |
![]() |
вид сзади | |
![]() |
![]() |
В отличие от случая с GTX 1660, мы сравниваем новинку с GTX 1060, потому что, во-первых, у нас нет фотографий референсной карты GTX 1050 Ti (Nvidia в свое время не рассылала такие карты СМИ), а во-вторых, по производительности GTX 1650 в основном попадает в промежуток между GTX 1060 3 ГБ и GTX 1060 6 ГБ, так что сравнение в принципе логичное, хотя шины обмена с памятью у этих карт разные: у GTX 1060 — 192 бит, а в данном случае — 128 бит.
Схема питания примитивная, трехфазная (карта явно не рассчитана на ручной разгон). Подвод питания осуществляется через один 6-контактный разъем.
На момент написания материала фирменная утилита MSI Dragon Center не предлагала для данной карты вообще ничего. Частота работы GPU по умолчанию повышена на 5,8% относительно референсных значений.
Подсветка у этой карты очень скромная, не регулируется и представляет собой лишь логотип компании на торце карты.
Карта имеет урезанный набор видеовыходов: 2 DP и 1 HDMI (вместо обычных четырех).
Память
Карта имеет 4 ГБ памяти GDDR5 SDRAM, размещенной в 4 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR5) рассчитаны на номинальную частоту работы в 2000 (8000) МГц
Охлаждение и нагрев
Главной частью системы охлаждения TwinFrozr 7 является довольно большой никелированный радиатор, пронизанный двумя тепловыми трубками. Поверх установлен кожух с двумя вентиляторами Torx 3.0, работающими на одинаковой частоте вращения. Вентиляторы останавливаются в простое и просто при малой нагрузке (при температуре GPU ниже 50-52 градусов). Микросхемы памяти охлаждаются основным радиатором через толстые термопрокладки, а силовых элементов тут кот наплакал, и они вообще не охлаждаются. С оборотной стороны карта ничем не прикрыта.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder):
После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 64 градусов, что является отличным результатом для видеокарты такого уровня.
Максимальный нагрев — центральная часть карты.
Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.
- Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
- Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
- Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark
Оценка градаций уровня шума выполняется по методике, описанной здесь:
- 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
- от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
- от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
- 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.
В режиме простоя в 2D температура составляла 38 °C, вентиляторы не работали. Шум был равен фоновому (18,0 дБА).
При просмотре фильма с аппаратным декодированием ничего не менялось: температура ядра оставалась прежней, вентиляторы также не работали, шум сохранялся на уровне 18,0 дБА.
В режиме максимальной нагрузки в 3D температура достигала 64 °C. Вентиляторы при этом раскручивались до 1190 оборотов в минуту, шум вырастал лишь до 21,6 дБА, так что шума от данной СО практически нет.
Комплект поставки и упаковка
Базовый комплект поставки серийной карты должен включать в себя руководство пользователя, диск с драйверами и утилитами. Мы видим базовый комплект.
Синтетические тесты
Обновленный пакет синтетических тестов все еще экспериментальный и продолжает изменяться. Мы бы хотели добавить еще больше примеров с вычислениями (compute shaders), но с этим есть определенные сложности. В будущем мы постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — пишите их в комментариях к статье или отправьте авторам почтой.
Из ранее активно использовавшихся нами тестов RightMark3D мы оставили лишь несколько самых тяжелых вариантов. Остальные уже изрядно устарели и на столь мощных GPU упираются в различные ограничители, не загружают работой блоки графического процессора и не показывают истинную его производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы пока что решили оставить в полном составе, так как заменить их попросту нечем, хотя и они уже устарели.
Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько тестов для измерения производительности трассировки лучей. В качестве полусинтетического теста у нас также используется и популярный 3DMark Time Spy, помогающий определить прирост от асинхронных вычислений.
Синтетические тесты проводились на следующих видеокартах:
- GeForce GTX 1650 со стандартными параметрами (GTX 1650)
- GeForce GTX 1660 со стандартными параметрами (GTX 1660)
- GeForce GTX 1660 Ti со стандартными параметрами (GTX 1660 Ti)
- GeForce GTX 1060 со стандартными параметрами (GTX 1060)
- Radeon RX 590 со стандартными параметрами (RX 590)
- Radeon RX 580 со стандартными параметрами (RX 580)
Для анализа производительности новой видеокарты GeForce GTX 1650 мы использовали эти решения по разным причинам. В первую очередь, мы сравнили недавно анонсированную модель с GTX 1660 (или Ti-вариантом в случае некоторых тестов), как старшей видеокартой из того же подсемейства Turing. Также мы взяли для сравнения и одного из предшественников новинки в виде GeForce GTX 1060 — чтобы понять, насколько самый дешевый Turing медленнее самого популярного GPU из семейства Pascal.
От компании AMD в качестве соперников для GeForce GTX 1650 в нашем сравнении выступают видеокарты моделей Radeon RX 590 и RX 580, хоть и продающиеся дороже, но все же близкие по характеристикам к прямому конкуренту для новинки — RX 570. Решения архитектуры Polaris имеют отличающиеся параметры и мы далее оценим, насколько все эти видеокарты соответствуют друг другу по производительности.
Мы сильно сократили состав DirectX 10-тестов из RightMark3D, оставив только несколько примеров с наибольшей нагрузкой на GPU. Первая пара тестов измеряет производительность выполнения относительно простых пиксельных шейдеров с циклами при большом количестве текстурных выборок (до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере. Оба примера включают самозатенение и шейдерный суперсэмплинг, увеличивающий нагрузку на видеочипы.
Первый тест пиксельных шейдеров — Fur. При максимальных настройках в нем используется от 160 до 320 текстурных выборок из карты высот и несколько выборок из основной текстуры. Производительность в данном тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ.
В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD в лидерах еще со времен выхода первых графических процессоров архитектуры GCN. Совершенно неудивительно, что видеокарты архитектуры Polaris до сих пор сильно выглядят в очередном сравнении, что говорит о большей эффективности выполнения ими подобных программ.
Рассматриваемая сегодня видеокарта модели GeForce GTX 1650 выступила ожидаемо и соответственно теории, показав результат на уровне 70% от GTX 1660. Отставание от GTX 1060 почти такое же. Если сравнивать новинку с конкурентами, то она показала результат заметно хуже Radeon RX 580, да и прямой конкурент RX 570 наверняка обгонит новинку. В таких тестах семейство Turing не может показать свою силу, новым GPU нужны более сложные шейдеры и условия.
Следующий DX10-тест Steep Parallax Mapping также измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок. При максимальных настройках он использует от 80 до 400 текстурных выборок из карты высот и несколько выборок из базовых текстур. Этот шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, в том числе и такие варианты как steep parallax mapping. Кроме того, в нашем тесте мы включили самозатенение, увеличивающее нагрузку на видеочип в два раза, и суперсэмплинг, также повышающий требования к мощности GPU.
Диаграмма похожа на предыдущую, разве что в этот раз видеокарты GeForce выглядят получше на фоне соперника. Новинка чуть отдалилась от GTX 1660, хотя отставание полностью соответствует теории. Урезанный новый чип TU117 показывает 66% от скорости старшей модели, а конкурент компании AMD явно быстрее. Отставание от GTX 1060 из предыдущего поколения уменьшилось, новый GPU чуть эффективнее справляется с этой задачей, но этого не хватает. В более сложных DirectX 11 и 12 тестах GTX 1650 должна лучше раскрыть свои возможности.
Из пары тестов пиксельных шейдеров с минимальным количеством текстурных выборок и относительно большим количеством арифметических операций, мы выбрали более сложный, так как они уже порядком устарели и уже не измеряют чисто математическую производительность GPU. Да и за последние годы скорость выполнения именно арифметических инструкций в пиксельном шейдере не так важна, большинство вычислений перешли в compute shaders. Итак, тест шейдерных вычислений Fire — текстурная выборка в нем лишь одна, а количество инструкций типа sin и cos равно 130 штукам. Впрочем, для современных GPU это семечки.
В математическом тесте из нашего RightMark мы часто получаем результаты, довольно далекие от теории и сравнений в других аналогичных бенчмарках. Вероятно, столь мощные платы ограничивает что-то, не относящееся к скорости вычислительных блоков, так как GPU при тестировании чаще всего не загружены работой на 100%. Рассматриваемая сегодня GeForce GTX 1650 в этом тесте отстала от всех, и это полностью соответствует теории — ее производительность оказалась на уровне 70% от GTX 1660.
Более мощный GPU конкурирующей компании где-то между GTX 1660 и GTX 1650, так что RX 570 должен быть куда ближе к рассматриваемой сегодня видеокарте из семейства Turing. Скорее всего, преимущество у Radeon останется, но оно (в удобном для AMD тесте) будет довольно небольшим.
Переходим к тесту геометрических шейдеров. В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, но один из них (Hyperlight, демонстрирующий использование техник: instancing, stream output, buffer load, использующий динамическое создание геометрии и stream output), на всех видеокартах компании AMD не работает, поэтому мы решили оставить лишь второй — Galaxy. Техника в этом тесте аналогична point sprites из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Вычисления производятся в геометрическом шейдере.
Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек. Задача для мощных современных GPU довольно простая, но разница между разными моделями видеокарт есть. Новая GeForce GTX 1650 в этом тесте показала результат почти на уровне Radeon RX 580, чуть проиграв в легких условиях. Разница между ней и GTX 1660 снова соответствует теории — 30%-32%.
В этом тесте разница между видеокартами на чипах Nvidia и AMD явно в пользу решений калифорнийской компании, что обусловлено отличиями в геометрических конвейерах GPU. В тестах геометрии платы GeForce всегда конкурентоспособнее Radeon, но не топовые видеочипы Nvidia имеют не так уж много блоков по обработке геометрии, и пусть Radeon RX 570 будет медленнее новинки, разница между ними окажется невеликой.
Последним тестом из Direct3D 10 станет скорость большого количества текстурных выборок из вершинного шейдера. Из пары имеющихся у нас тестов с использованием displacement mapping на основании данных из текстур, мы выбрали тест Waves, имеющий условные переходы в шейдере и поэтому более сложный и современный. Количество билинейных текстурных выборок в данном случае составляет 24 штуки на каждую вершину.
В тесте вершинного текстурирования Waves результаты привычно довольно странные. Новая GeForce GTX 1650 снова показывает скорость хуже всех, отставая от GTX 1660 ровно на теоретически 30%. Производительность новой модели GPU соответствует ожидаемому уровню, но Radeon RX 580 оказалась чуть быстрее. Впрочем, отставание в сложных условиях говорит о том, что младшая модель на чипе Polaris, с которой конкурирует рассматриваемая видеокарта Nvidia, вполне может немного уступить ей.
Мы традиционно рассматриваем также и синтетические тесты из пакета 3DMark Vantage, ведь они иногда показывают нам то, что мы упустили в тестах собственного производства. Feature тесты из этого тестового пакета также обладают поддержкой DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новой видеокарты GeForce мы сделаем какие-то полезные выводы, ускользнувшие от нас в тестах пакета RightMark 2.0.
Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя у семейства Turing они получаются несколько заниженными, что мы отмечали ранее. Сегодняшняя новинка отстает от GTX 1660 примерно столько, сколько и должна проигрывать по теории — около 35%. По сравнению с GTX 1060 самый слабый из графических процессоров Turing показывает также ожидаемый результат. Карта семейства Pascal расположилась между парой Turing.
Сравнение скорости текстурирования рассматриваемой сегодня видеоплаты компании Nvidia с конкурирующими видеокартами AMD показало, что модель GeForce GTX 1650 прилично уступает видеокарте Radeon RX 580 по скорости текстурирования, так как все Radeon имеют большое количество блоков TMU и с этой задачей они справляются явно лучше.
Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.
Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP. Новинка снова показала соответствующий теории результат на уровне 70% от GTX 1660. Тут все ожидаемо, в том числе и близость по скорости к GTX 1060.
Конкурирующие видеокарты по скорости заполнения сцены обычно не так хороши, но Radeon RX 580 в этом тесте оказалась явно быстрее сегодняшней новинки. Похоже, что и Radeon RX 570 будет близка к ней и покажет большую скорость рендеринга, по сравнению с представленной в апреле видеокартой Nvidia.
Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно важный тест, так как результаты в нем неплохо коррелируют с тем, что получается в игровых тестах.
Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель GeForce GTX 1650 снова показала 100% ожидаемый результат, проиграв всем соперникам. Графические процессоры AMD в этом тесте всегда были сильны, и новинка явно слабее Radeon RX 580 (да и RX 570 наверняка). GTX 1650 показала 2/3 от скорости GTX 1660, да и GTX 1060 где-то далеко впереди. Скорее всего, примерно это же мы увидим и в играх.
Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы в который раз получаем явно некорректные результаты в этом тесте. Очередная новая видеокарта GeForce показала очень низкую скорость хуже уровня решений предшествующего поколения. Да и вообще — все карты Nvidia тут очень близки, чего быть не должно.
В таких условиях и сравнение с Radeon для GeForce GTX 1650 не имеет смысла. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, платы Radeon в этом тесте по какой-то причине работают заметно лучше, и модель RX 580 чуть ли не вдвое обгоняет пару видеокарт GeForce из семейства Turing, представленных в сегодняшнем сравнении. Результаты явно некорректные.
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
И во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты. Но они хотя бы выше, чем в прошлом подтесте этого же бенчмарка. Новинка Nvidia оказалась медленнее всех, уступив и более высокому по позиционированию представителю архитектуры Pascal в виде GTX 1060, и старшей модели Turing (тут разница меньше теоретической — около 25%). Сравнение новой модели GeForce с представленной в материале видеокартой компании AMD также показало отставание — пусть и от средней модели на чипе Polaris, но ведь и Radeon RX 570 тоже будет впереди.
Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она явно ближе к пиковой производительности видеочипов в предельных задачах. В этом тесте используются операции с плавающей запятой, и новая архитектура Turing не может использовать свои уникальные возможности и показать результат заметно выше аналогичных представителей из семейства Pascal. GeForce GTX 1650 в этом тесте оказалась слабейшей, как и должно быть, и отставание от GTX 1660 близко к теории — 35%.
Видеочипы компании AMD с архитектурой GCN справляются с подобными задачами чуть лучше — они всегда хороши в тех случаях, когда выполняется интенсивная «математика» в предельных режимах. Radeon RX 580 в этом тесте стала явным победителем, и уже тем более обошла GTX 1650. Нет никаких сомнений в том, что и RX 570 будет гораздо сильнее в этом тесте. Что-то пока не очень хорошо для GTX 1650 получается в целом. Но далее мы рассмотрим более современные тесты, использующие повышенную нагрузку на GPU, и показатели Turing в них должны быть лучше.
Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.
Первый Direct3D11-тест не раскрывает новых возможностей архитектуры Turing, все видеокарты GeForce проиграли единственному конкуренту в виде Radeon RX 590, который оказался быстрее всех. Сегодняшняя новинка сильно отстает и от аналогичного решения из семейства Pascal и от старшей GTX 1660 и это уже не соответствует теории. Впрочем, судя по очень высокой частоте кадров, вычисления в этом примере из SDK слишком простые, и мощные GPU не могут показать свои способности.
Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.
Производительность рендеринга в этом тесте зависит от оптимизации драйвера и командного процессора GPU. И с этим у всех решений Nvidia все в порядке, как мы знаем по опыту предыдущих сравнений. Поэтому все видеокарты GeForce опередили единственную представленную плату компании AMD. Если сравнить рассматриваемую сегодня плату с GTX 1060 из прошлого поколения, то в этот раз GTX 1650 оказалась близка к ней, а вот GTX 1660 далеко впереди.
Ну и третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно интересный. При тестировании мы использовали настройки по умолчанию.
Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Новая видеокарта GeForce GTX 1650 сильно отстала ото всех (нужно помнить, что все остальные карты в сравнении — более высокого уровня и цены), показав чуть меньше производительности, чем от нее ожидалось, исходя из теоретической разницы между картами семейства Turing. Впрочем, частота кадров тут снова слишком высокая в любом случае и задача слишком проста даже для бюджетных GPU.
Переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.
Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Turing. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.
Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU. Решения Nvidia неплохо справляются с этими операциями, но с результатом TU117 явно что-то не так — преимущество старшей платы GTX 1660 значительно больше теоретической разницы по производительности всех исполнительных блоков. Новая плата тут оказалась медленнее всех, включая (весьма условного) конкурента в виде Radeon RX 590.
Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1 048 576 штук.
Производительность в этом тесте зависит от драйвера, командного процессора и мультипроцессоров GPU. Все видеокарты компании Nvidia справились с задачей отлично (с учетом большого количества обрабатываемой геометрии) и примерно одинаково, что говорит скорее об упоре в возможности именно программной части (оптимизации драйвера), поэтому и сравнивать GeForce друг с другом бессмысленно. А вот Radeon RX 590 очень сильно отстала от них, как и все остальные Radeon в наших предыдущих тестах. И дело тут в недостатке программной оптимизации — драйверы компании AMD справляются с работой неидеально.
И последний пример с поддержкой D3D12 — уже известный нам nBody Gravity тест, но в другом варианте. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10 000 до 64 000.
По количеству кадров в секунду видно, что эта вычислительная задача довольно сложна. Сегодняшняя новинка GeForce GTX 1650, основанная на младшем графическом процессоре архитектуры Turing, снова проиграла, но это объяснимо более высоким уровнем остальных GPU. Она отстала от старшей сестры GTX 1660 примерно так, как и должно быть из теоретической разницы в производительности основных исполнительных блоков GPU. Единственная видеокарта конкурирующей компании, представленная в нашем сравнении, быстрее, но RX 570 уже вряд ли будет впереди.
В качестве дополнительного синтетического теста с поддержкой Direct3D12 мы взяли известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Так мы поймем, изменилось ли что-то в поддержке async compute в Turing. Для верности мы протестировали видеокарты Nvidia в двух разрешениях экрана и двух графических тестах.
По представленным диаграммам видно, что прирост от включения асинхронных вычислений в Time Spy не слишком сильно изменился между двумя поколениями GPU компании Nvidia. Для Pascal это 3%-7%, а для Turing уже 5%-10% (в зависимости от режима). В новых графических процессорах одновременное исполнение разных типов вычислений было улучшено, на одном и том же шейдерном мультипроцессоре архитектуры Turing теперь могут запускаться и графические и вычислительные шейдеры. Но бенчмарк Time Spy использует такие возможности слабо, поэтому и разница невелика.
Если рассматривать производительность GeForce GTX 1650 в этой задаче по сравнению со старшей моделью Nvidia на основе урезанной версии TU116, то получается, что новинка отстает от GTX 1660 соответственно разнице в теоретических показателях. Анонсированная недавно модель на урезанном чипе TU117 показала неплохой результат даже на фоне видеокарты Radeon RX 590, которая сильнее ее прямого конкурента, что настраивает на сдержанный оптимизм перед игровыми тестами, так как результаты в Time Spy обычно неплохо коррелируют с игровыми.
Мы все еще ищем бенчмарки, использующие OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается уже довольно старый и не слишком хорошо оптимизированный тест трассировки лучей, но не аппаратной — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.
Новая модель GeForce GTX 1650 оказалась медленнее GTX 1660 той же графической архитектуры примерно на ту разницу, что и должна быть в теории. А вот если сравнить новинку с GTX 1060 из предыдущего семейства Pascal, то она заметно ближе к GPU прошлого поколения благодаря изменениям в системе кэширования в чипах семейства Turing. Кэши стали больше и быстрее, и во многом благодаря этому GTX 1650 смотрится неплохо. Впрочем, условный конкурент в виде Radeon RX 590 еще быстрее, но решения AMD всегда сильных в подобных задачах.
Еще одним тестом вычислительной производительности графических процессоров является V-Ray Benchmark — тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества архитектуры Turing. В прошлых тестах мы использовали версию, которая выдает результат в виде времени, затраченного на рендеринг, а теперь он сменился на количество миллионов просчитанных путей за секунду.
Прямого сравнения с конкурентом и GTX 1660 мы не сделаем, так как были протестированы другие видеокарты. Зато сравним скорость с GTX 1660 Ti на полном TU116 и полноценным Turing-решением в виде RTX 2060. Мы отмечали, что архитектура Turing не получила преимуществ от своих архитектурных оптимизаций в тесте V-Ray, но в этот раз у нас все GPU этого семейства. Единственное, что хорошо видно — результаты GeForce RTX заметно выше, и это при том, что технология RTX пока что не используется в этом тесте.
К слову, по прошлым тестам мы уже знаем, что этот рендерер лучше оптимизирован именно под видеокарты калифорнийской компании, и все Radeon от них отстают. Новая GeForce GTX 1650 отстает от GTX 1660 Ti примерно соответственно теории, а что касается сравнения с GeForce RTX 2060, то эта модель оказалась еще быстрее, и весьма прилично.
Последним тестом нашего материала стал еще один бенчмарк, измеряющий производительность рендеринга при трассировке лучей — OctaneBench 2019. Его отличие и преимущество в том, что он уже умеет использовать технологию аппаратного ускорения трассировки лучей Nvidia RTX, хоть и доступен пока только в виде бета-версии. Посмотрим, что дает эта поддержка:
Сразу же бросается в глаза очень сильный результат GeForce RTX 2060. Если при отключенной технологии RTX эта видеокарта хоть и быстрее GTX 1660 Ti, но явно не в разы, то аппаратное ускорение трассировки лучей меняет все — скорость рендеринга возрастает сразу в несколько раз. Наглядно разницу можно оценить по тому факту, что рассматриваемая сегодня новинка GTX 1650 оказалась чуть ли не вдесятеро медленнее RTX 2060 в этом бенчмарке.
При сравнении младших графических процессоров Turing: TU117 и TU116, у которых нет поддержки аппаратного ускорения трассировки лучей, отметим некоторое несоответствие результатов теоретической разнице между GTX 1650 и GTX 1660 Ti. Более мощная модель в этом тесте выступила быстрее младшей более чем вдвое. Похоже, что слабые GPU очень сильно теряют производительность в таких сложных задачах.
Выводы по теоретической части и синтетическим тестам
Видеокарта модели GeForce GTX 1650, основанная на урезанной версии графического процессора TU117 архитектуры Turing, занимает на рынке игровых видеокарт свое место под GeForce GTX 1660. Увы, в наших синтетических тестах попадались и не самые приятные результаты, особенно в старых приложениях, где у всех новых GPU дела обстоят зачастую не очень хорошо. В более новых тестах влияние архитектурных улучшений в Turing заметно чаще, и новинка в играх должна быть явно быстрее GTX 1050 и 1050 Ti из предыдущего семейства Pascal, а вот бороться с конкурентом будет не так просто.
Nvidia говорит о новой модели как о хорошем варианте для апгрейда с решений уровня GeForce GTX 950 или аналогичных по мощности GPU конкурента. По данным компании, GTX 1650 дает более чем вдвое большую производительность, по сравнению с GTX 950 — аналогичной по позиционированию видеокартой, вышедшей два поколения назад. Немаловажным преимуществом новинки станет наличие 4 ГБ видеопамяти, по сравнению с 2 ГБ у GTX 950 и GTX 1050, чего сейчас уже откровенно мало. Конечно, все это не позволит выставить высокие и максимальные настройки даже в Full HD-разрешении во всех играх, но некоторые нетребовательные проекты вполне дадут такую возможность — вроде Dota 2 и аналогичных игр. Более же требовательные и современные игры вынудят снизить настройки даже в 1920×1080, чтобы получить приемлемую плавность.
Судя по всему, Nvidia держит в рукаве еще одну потенциально возможную видеокарту на основе чипа TU117. Часто они запускали сразу два варианта бюджетных решений (как GTX 1050 и GTX 1050 Ti), на основе полного GPU и урезанного, но в этот раз более мощной видеокарты пока нет. Так что вполне можно ожидать Ti-варианта на полном TU117, если в компании посчитают это нужным. Но так как в GTX 1650 урезано малое количество исполнительных блоков, то, скорее всего, теоретический более мощный вариант будет работать на большей частоте и может быть даже будет иметь GDDR6-память, так как из имеющейся 128-битной шины особо ничего уже не выжмешь. Естественно, при цене GTX 1650 в $149, старший вариант будут продавать ближе к $200, заполнив еще одно пространство в линейке.
Хотя урезанные по возможностям чипы Turing в виде TU116 и TU117 весьма эффективны именно в текущих играх без использования трассировки лучей, младший чип слишком сильно урезан, чтобы всегда успешно конкурировать с Radeon RX 570, имеющем близкую цену. Многочисленные варианты на основе Polaris из линейки Radeon RX 500 действительно очень сильны. Соперники стараются выставить против GTX 1650 старший вариант Radeon RX 570 с 8 ГБ памяти, и против новинки он выглядит весьма сильно, не говоря уже о наличии вдвое большего объема видеопамяти. А если сравнивать 4-гигабайтные варианты, то RX 570 все равно может выглядеть привлекательнее за счет цены.
Nvidia смогла повысить производительность новых GPU при том же энергопотреблении, и TU117 намного эффективнее справляется с современными играми по сравнению с аналогичными чипами архитектуры Pascal и уж тем более любыми из Radeon. Решения AMD просто не могут конкурировать с новинками семейства Turing по энергоэффективности, и RX 570 потребляет чуть ли не вдвое больше энергии при близкой производительности, но они сейчас привлекательнее по цене при том, что по скорости близки. Так что, если рассматривать сравнение исключительно по соотношению цены и производительности, то Radeon RX 570 является сильным соперником для GTX 1650, с учетом несколько завышенной цены последней. Все решат игровые тесты, к которым мы и переходим.
Игровые тесты
Конфигурация тестового стенда
- Компьютер на базе процессора Intel Core i9-9900K (Socket LGA1151v2):
- процессор Intel Core i9-9900K (разгон 5,0 ГГц по всем ядрам);
- СО NZXT Kurhen C720;
- системная плата Gigabyte Z390 Aorus Xtreme на чипсете Intel Z390;
- оперативная память 16 ГБ (2×8 ГБ) DDR4 Gigabyte UDIMM 3200 МГц (AR32C16S8K2SU416R);
- SSD Intel 760p NVMe 1 ТБ PCI-E;
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
- блок питания Corsair AX1600i (1600 Вт);
- корпус Thermaltake Versa J24;
Список инструментов тестирования
Во всех играх использовалось максимальное качество графики в настройках.
- Wolfenstein II: The New Colossus (Bethesda Softworks/MachineGames)
- Tom Clancy’s The Division 2 (Massive Entertainment/Ubisoft)
- Devil May Cry 5 (Capcom/Capcom)
- Battlefield V (EA Digital Illusions CE/Electronic Arts)
- Far Cry 5 (Ubisoft/Ubisoft)
- Shadow of the Tomb Raider (Eidos Montreal/Square Enix) — HDR включен
- Metro Exodus (4A Games/Deep Silver/Epic Games)
- Strange Brigade (Rebellion Developments/Rebellion Developments)
Разница в производительности, %
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce GTX 1650 GeForce GTX 1060 6 ГБ −7,9 −5,9 −23,8 GeForce GTX 1650 GeForce GTX 1060 3 ГБ +7,7 +9,1 +60,0 GeForce GTX 1650 GeForce GTX 1050 Ti +133,3 +182,4 +100,0 GeForce GTX 1650 Radeon RX 570 4 ГБ −24,7 −12,7 +14,3 Разница в производительности, %
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce GTX 1650 GeForce GTX 1060 6 ГБ −7,4 −8,6 −11,8 GeForce GTX 1650 GeForce GTX 1060 3 ГБ +6,4 +6,7 +7,1 GeForce GTX 1650 GeForce GTX 1050 Ti +31,6 +39,1 +66,7 GeForce GTX 1650 Radeon RX 570 4 ГБ −5,7 −8,6 −16,7 Разница в производительности, %
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce GTX 1650 GeForce GTX 1060 6 ГБ −6,6 −5,8 −14,3 GeForce GTX 1650 GeForce GTX 1060 3 ГБ +4,4 +4,3 +14,3 GeForce GTX 1650 GeForce GTX 1050 Ti +91,9 +133,3 +71,4 GeForce GTX 1650 Radeon RX 570 4 ГБ −6,6 −9,3 −7,7 Разница в производительности, %
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce GTX 1650 GeForce GTX 1060 6 ГБ −21,5 −21,4 −13,0 GeForce GTX 1650 GeForce GTX 1060 3 ГБ −5,6 +26,9 +33,3 GeForce GTX 1650 GeForce GTX 1050 Ti +54,5 +153,8 +150,0 GeForce GTX 1650 Radeon RX 570 4 ГБ −20,3 −26,7 −13,0 Разница в производительности, %
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce GTX 1650 GeForce GTX 1060 6 ГБ −5,7 −10,4 −11,8 GeForce GTX 1650 GeForce GTX 1060 3 ГБ +3,1 +4,9 +7,1 GeForce GTX 1650 GeForce GTX 1050 Ti +53,5 +43,3 +50,0 GeForce GTX 1650 Radeon RX 570 4 ГБ +4,8 0,0 +36,4 Разница в производительности, %
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce GTX 1650 GeForce GTX 1060 6 ГБ −11,4 −13,3 −21,1 GeForce GTX 1650 GeForce GTX 1060 3 ГБ −4,9 +4,0 +15,4 GeForce GTX 1650 GeForce GTX 1050 Ti +39,3 +44,4 +114,3 GeForce GTX 1650 Radeon RX 570 4 ГБ +14,7 +13,0 +15,4 Разница в производительности, %
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce GTX 1650 GeForce GTX 1060 6 ГБ −32,4 −32,0 −47,1 GeForce GTX 1650 GeForce GTX 1060 3 ГБ −11,5 −10,5 −10,0 GeForce GTX 1650 GeForce GTX 1050 Ti +35,3 +112,5 +80,0 GeForce GTX 1650 Radeon RX 570 4 ГБ −4,2 +21,4 +12,5 Разница в производительности, %
Исследуемая карта в сравнении с 1920×1200 2560×1440 3840×2160 GeForce GTX 1650 GeForce GTX 1060 6 ГБ −13,9 −15,7 −10,7 GeForce GTX 1650 GeForce GTX 1060 3 ГБ 0,0 +4,9 +8,7 GeForce GTX 1650 GeForce GTX 1050 Ti +47,6 +43,3 +56,3 GeForce GTX 1650 Radeon RX 570 4 ГБ −17,3 −15,7 −7,4 Рейтинг iXBT.com
Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и нормирован по самому слабому ускорителю — Radeon RX 550 (то есть сочетание скорости и функций Radeon RX 550 приняты за 100%). Рейтинги ведутся по 23 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. Из общего списка выбирается группа карт для анализа, куда входят GeForce GTX 1650 и его конкуренты.
Для расчета рейтинга полезности использованы розничные цены на начало мая 2019 года.
№ Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб. 15 GTX 1060 6 ГБ, 1507—1860/8000 350 219 16 000 16 RX 570 4 ГБ, 1168—1244/7000 310 292 10 600 17 MSI GTX 1650 Gaming X, 1485—1935/8000 310 246 12 600 18 GTX 1650 4 ГБ, 1485—1825/8000 300 240 12 500 19 GTX 1060 3 ГБ, 1507—1860/8000 280 215 13 000 Новый ускоритель GTX 1650 опередил конкурента в лице GTX 1060 3 ГБ (поэтому сравнивать его с GTX 1050 Ti нет никакого смысла), однако отстал от своего прямого соперника Radeon RX 570 4 ГБ. При этом повышенные частоты карты MSI как раз помогают ей догнать RX 570.
Если ранее при изучении GTX 1660 мы вели разговор о нацеленности этого ускорителя на самое популярное на сегодня разрешение в мире игр — Full HD, при высоких настройках графики в играх, то GTX 1650 такие условия уже не потянет. Придется выбирать: или оставлять Full HD, но понижать настройки графики до среднего уровня (а иногда и до низкого), или понижать разрешение до 1680×1050 или еще ниже, оставляя настройки графики высокими.
Рейтинг полезности
Рейтинг полезности тех же карт получается, если показатели предыдущего рейтинга разделить на цены соответствующих ускорителей.
№ Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб. 04 RX 570 4 ГБ, 1168—1244/7000 292 310 10 600 08 MSI GTX 1650 Gaming X, 1485—1935/8000 246 310 12 600 10 GTX 1650 4 ГБ, 1485—1825/8000 240 300 12 500 14 GTX 1060 6 ГБ, 1507—1860/8000 219 350 16 000 15 GTX 1060 3 ГБ, 1507—1860/8000 215 280 13 000 На момент подготовки материала карты на GTX 1650 уже появились в продаже со средней ценой в 12 500 рублей, которая и была взята для определения рейтинга. При таком раскладе Radeon RX 570 смотрится выигрышнее, однако будем следить за реальными ценами, картина может поменяться. Очевидно, что оба варианта GTX 1060 в таком сравнении проигрывают, им пора уходить на пенсию.
Выводы
Nvidia GeForce GTX 1650 продолжил (и, возможно, завершил) выведение архитектуры Turing в более низкий сегмент рынка игровых видеоускорителей. Будучи заметно быстрее, чем GeForce GTX 1060 3 ГБ, и выигрывая у GeForce GTX 1060 6 ГБ по соотношению цены и возможностей, GeForce GTX 1650 призван заменить GeForce GTX 1060 в сегменте игровых видеокарт с ценой 10—13 тысяч рублей. Однако в этом сегменте на сегодня лучшим по соотношению цены и производительности является Radeon RX 570 4 ГБ, который дешевле, а скорость у него чуть выше. Мы надеемся, что вскоре GeForce GTX 1650 также подешевеет, и тогда конкуренция усилится, что на руку потребителю. Все предпосылки к этому есть: GeForce GTX 1650 «простой как валенок» в плане себестоимости производства, его нынешняя цена явно чрезмерно завышена.
У конкретного протестированного нами видеоускорителя MSI GeForce GTX 1650 Gaming X 4G (4 ГБ) следует выделить отличную систему охлаждения, которая без проблем справляется с рассеиванием тепла от GPU и при этом работает практически бесшумно. Также надо отметить относительно компактные размеры карты, ее двухслотовую ширину. Наличие всего 3 видеовыходов (вместо стандартных четырех), на наш взгляд, минусом не является: сейчас непросто найти пользователя, имеющего одновременно хотя бы три монитора на столе, а про четыре мы вообще молчим.
Итог: GeForce GTX 1650 не поддерживает такие новые технологии, как трассировка лучей и «умный» DLSS на основе тензорных ядер, однако улучшенная архитектура Turing и в этом случае показала себя прекрасно. Еще раз напомним, что Turing отличается не только трассировкой лучей и тензорными ядрами — в этой архитектуре есть и другие улучшения по сравнению с предыдущим семейством Pascal. В ней были серьезно переработаны мультипроцессоры для повышения количества операций, выполняемых за такт, что дало возможность повысить общую эффективность новых GPU. Важным изменением стало появление выделенных блоков для исполнения целочисленных инструкций — INT32-операции теперь выполняются параллельно с FP32, что повысило эффективность исполнения сложных программ, все чаще использующих целочисленные операции. Также в Turing появилась и новая возможность выполнения операций с плавающей запятой пониженной точности FP16 с удвоенным темпом относительно FP32.
Ждем снижения цен до адекватного уровня — тогда GeForce GTX 1650 наряду со своими старшими собратьями GTX 1660/1660 Ti наверняка смогут претендовать даже на лидерство в Рейтинге полезности, как это удавалось в свое время их предшественникам.
За прекрасную систему охлаждения карта MSI GeForce GTX 1650 Gaming X 4G (4 ГБ) получила награду «Оригинальный дизайн»:
Благодарим компанию MSI Russia
и лично Валерию Корнееву
за предоставленную на тестирование видеокартуДля тестового стенда:
материнская плата Z390 Aorus Xtreme и комплект RGB-памяти предоставлены компанией Gigabyte
блок питания Corsair AX1600i (1600W) предоставлен компанией CorsairВидеокарта Palit NVIDIA GeForce GTX 1650 PA-GTX1650 GP 4G D6 4ГБ GDDR6, Ret [ne6165001bg1-1175a]
Производитель оставляет за собой право изменять характеристики товара, его внешний вид и комплектность без предварительного уведомления продавца.
Предложение по продаже товара действительно в течение срока наличия этого товара на складе.
NVIDIA GeForce GTX 1650: технические характеристики и тесты
NVIDIA начала продажи GeForce GTX 1650 23 апреля 2019 по рекомендованной цене 149$. Это десктопная видеокарта на архитектуре Turing и техпроцессе 12 нм, в первую очередь рассчитанная на геймеров. На ней установлено 4 Гб памяти GDDR5 на частоте 8 ГГц, и вкупе с 128-битным интерфейсом это создает пропускную способность 128.0 Гб/с.
С точки зрения совместимости это двухслотовая карта, подключаемая по интерфейсу PCIe 3.0 x16. Длина референсной версии – 229 мм. Для подключения не требуется дополнительный кабель питания, а потребляемая мощность – 75 Вт.
Она обеспечивает слабую производительность в тестах и играх на уровне 20.22% от лидера, которым является NVIDIA GeForce RTX 4090.
Общая информация
Сведения о типе (для десктопов или ноутбуков) и архитектуре GeForce GTX 1650, а также о времени начала продаж и стоимости на тот момент.
Место в рейтинге производительности 235 Место по популярности 2 Соотношение цена-качество 19.30 Архитектура Turing (2018−2021) Графический процессор TU117 Тип Десктопная Дата выхода 23 апреля 2019 (4 года назад) Цена на момент выхода 149$ Цена сейчас 185$ (1.2x) из 168889 (A100 PCIe 80 GB) Отношение производительности к цене. Чем выше, тем лучше.
Характеристики
Общие параметры GeForce GTX 1650: количество шейдеров, частота видеоядра, техпроцесс, скорость текстурирования и вычислений. Они косвенным образом говорят о производительности GeForce GTX 1650, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов.
Количество потоковых процессоров 896 из 20480 (Data Center GPU Max NEXT) Частота ядра 1485 МГц из 2610 (Radeon RX 6500 XT) Частота в режиме Boost 1665 МГц из 3599 (Radeon RX 7990 XTX) Количество транзисторов 4,700 млн из 14400 (GeForce GTX 1080 SLI (мобильная)) Технологический процесс 12 нм из 4 (GeForce RTX 4080) Энергопотребление (TDP) 75 Вт из 2400 (Data Center GPU Max Subsystem) Скорость текстурирования 93.24 из 969.9 (H100 SXM5 96 GB) Совместимость и размеры
Параметры, отвечающие за совместимость GeForce GTX 1650 с остальными компонентами компьютера. Пригодятся например при выборе конфигурации будущего компьютера или для апгрейда существующего. Для десктопных видеокарт это интерфейс и шина подключения (совместимость с материнской платой), физические размеры видеокарты (совместимость с материнской платой и корпусом), дополнительные разъемы питания (совместимость с блоком питания).
Интерфейс PCIe 3.0 x16 Длина 229 мм Толщина 2 слота Дополнительные разъемы питания нет Оперативная память
Параметры установленной на GeForce GTX 1650 памяти — тип, объем, шина, частота и пропускная способность. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая — часть оперативной памяти.
Тип памяти GDDR5 Максимальный объём памяти 4 Гб из 128 (Radeon Instinct MI250X) Ширина шины памяти 128 бит из 19000 (GeForce RTX 3080 12 GB) Частота памяти 8000 МГц из 22400 (GeForce RTX 4080) Пропускная способность памяти 128.0 Гб/с из 3276 (Aldebaran) Разделяемая память — Видеовыходы
Перечисляются имеющиеся на GeForce GTX 1650 видеоразъемы. Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука.
Обзор видеокарты Gigabyte GeForce GTX 1650 OC с GDDR6: помогает ли более быстрая память?
Что касается цены, то версия G6 у большинства онлайн-продавцов стоит в районе $160, то есть примерно столько же, сколько и исходная версия GTX 1650, которую, судя по всему, новая карта скоро вытеснит с рынка. Производители памяти не испытывают недостатка в чипах GDDR6 и постепенно сокращают выпуск GDDR5.
Переход на GDDR6, по-видимому, также связан с намерением NVIDIA укрепить свои позиции в сегменте до $200 и ниже GTX 1650 Super. Карты AMD Navi серии RX 5000 уже не используют память GDDR5 (по крайней мере, в розничной продаже таких карт нет), и на фоне четырехгигабайтной RX 5500 XT за $170 исходная версия GTX 1650 уже выглядит морально устаревшей. Хотя переход на GDDR6 имеет и свои издержки. NVIDIA пришлось немного снизить тактовые частоты GPU – до 1410 МГц (базовая) и 1590 МГц (Boost) относительно исходных частот GTX 1650 (1485 и 1665 МГц соответственно). Вероятно, это было сделано с целью сохранить показатели энергопотребления видеокарты на том же уровне, не требующем подключения дополнительных коннекторов питания PCIe.
Карта GeForce GTX 1650 GDDR6 работает на 896 ядрах CUDA «Turing» и содержит 56 блоков TMU и 32 блока ROP – как и исходная версия GTX 1650, относительно которой изменился только тип памяти и тактовые частоты. Объем памяти остался тем же – 4 ГБ. По заявлениям NVIDIA, эти спецификации ориентированы на гейминг с разрешением 1080p и настройками от средних до высоких, включая спортивный гейминг (eSports) с частотой обновления экрана 60 Гц, и рассчитаны на такие игры, как PUBG.
Наша карта GIGABYTE на сегодняшний день является самой дешевой моделью от этой компании, без дополнительных коннекторов питания, но с небольшим заводским разгоном. Она оснащена простым воздушным кулером (вентилятор + радиатор), который мало чем отличается от заводских кулеров Intel. Эту свою карту GIGABYTE оценивает в $175, что, в общем, близко к базовым расценкам GTX 1650 G6.
Популярные видеокарты уровня Gigabyte GeForce GTX 1650 OC GDDR6
Модель Цена, $ Число шейдеров Число ROP Базовая частота ядра, МГц Boost-частота, МГц Частота памяти, МГц GPU Число транзисторов, млн Память GTX 1050 135 640 32 1354 1455 1752 GP107 3300 2 ГБ, GDDR5, 128-bit GTX 1050 Ti 150 768 32 1290 1392 1752 GP107 3300 4 ГБ, GDDR5, 128-bit GTX 1650 150 896 32 1485 1665 2000 TU117 4700 4 ГБ, GDDR5, 128-bit GTX 1650 GDDR6 N/A 896 32 1410 1590 1500 TU117 4700 4 ГБ, GDDR6, 128-bit Gigabyte GTX 1650 OC GDDR6 175 896 32 1410 1635 1500 TU117 4700 4 ГБ, GDDR6, 128-bit RX 570 120 2048 32 1168 1244 1750 Ellesmere 5700 4 ГБ, GDDR5, 256-bit RX 5500 XT 170 1408 32 1717 1845 1750 Navi 14 6400 4 ГБ, GDDR6, 128-bit GTX 1650 Super 160 1280 32 1530 1725 1500 TU116 6600 4 ГБ, GDDR6, 128-bit RX 580 160 2304 32 1257 1340 2000 Ellesmere 5700 8 ГБ, GDDR5, 256-bit GTX 1060 3 ГБ 170 1152 48 1506 1708 2002 GP106 4400 3 ГБ, GDDR5, 192-bit GTX 1060 210 1280 48 1506 1708 2002 GP106 4400 6 ГБ, GDDR5, 192-bit RX 590 200 2304 32 1469 1545 2000 Polaris 30 5700 8 ГБ, GDDR5, 256-bit GTX 1660 200 1408 48 1530 1785 2000 TU116 6600 6 ГБ, GDDR5, 192-bit GTX 1070 300 1920 64 1506 1683 2002 GP104 7200 8 ГБ, GDDR5, 256-bit RX Vega 56 260 3584 64 1156 1471 800 Vega 10 12500 8 ГБ, HBM2, 2048-bit GTX 1660 Super 230 1408 48 1530 1785 1750 TU116 6600 6 ГБ, GDDR6, 192-bit Упаковка
Карта
Видеокарта Gigabyte GTX 1650 OC GDDR6 имеет простую одновентиляторную конструкцию с радиатором; основной цвет оформления – черный, к которому добавлены серые вставки. Подложка в комплект не входит.
Габаритные размеры карты – 15 x 13 см.
Карта занимает два слота.
В набор опций подключения дисплея входит один порт DisplayPort 1.4a, один порт DVI и один HDMI 2.0b.
Плата не предполагает использование дополнительных коннекторов питания. Это типовая конфигурация, рассчитанная на энергопотребление до 75 Вт. GeForce GTX 1650 не поддерживает SLI.
Кулер
Конструкция кулера Gigabyte действительно очень простая. Тепловые трубки здесь не используются, радиатор по сути представляет собой большой кусок металла. Тем не менее, приятно видеть, что он охлаждает заодно и чипы памяти.
Печатная плата
Графический процессор обслуживается двухфазным VRM, который работает под управлением контроллера uPI uP9509S.
VRM памяти – однофазный, с контроллером 7212.
Память GDDR6 – производства Micron, номер модели чипа D9WCW расшифровывается как MT61K256M32JE-14:A. Эти чипы имеют номинальную частоту 1750 МГц (эффективная частота памяти GDDR6 14 Гбит/с).
Графический процессор NVIDIA TU117 – это самый маленький чип с архитектурой Turing. Он имеет размер 200 мм², изготавливается на базе 12-нм техпроцесса в TSMC (Тайвань) и содержит 4.70 млрд транзисторов.
Тестовая конфигурация системы
Состав тестовой конфигурации Процессор Intel Core i9-9900K 5.0 ГГц (Coffee Lake, кэш 16 МБ) Материнская плата EVGA Z390 DARK (чипсет Intel Z390) Память 16 ГБ DDR4 3867 МГц 18-19-19-39 Накопитель два SSD 960 ГБ Блок питания Seasonic Prime Ultra Titanium 850 Вт Кулер Cryorig R1 Universal (два вентилятора 140 мм) Операционная система Windows 10 Professional 64-разрядная,
версия 1903 (май 2019)Драйвера RX 5600 XT: Radeon 20.1.1 Jan13 RC5
RX 5500, RX 5700, RX 5700 XT: Radeon 20.1.1 Beta
GTX 1650 Super: 441.20 WHQL
Остальные карты AMD: Radeon 19.10.1 WHQL
Остальные карты NVIDIA: 436.48 WHQLДисплей Acer CB240HYKbmjdpr 24″ 3840×2160 Сравнение аналогичных результатов бенчмарков с результатами, приведенными в данном обзоре, корректно только при условии полного совпадения тестовых системных конфигураций.
- Все игры и все видеокарты тестировались с драйверами, указанными в таблице выше; состав тестовой конфигурации не изменялся.
- В ходе тестирования для всех видеокарт использовалась одна и та же версия каждой игры.
- Во всех играх, если не указано иное, были установлены максимальные настройки качества изображения.
- Настройки антиалиайзинга (AA) и анизотропной фильтрации (AF) устанавливались через меню игры, а не через панель управления драйвера.
- Снятие показаний в каждом тесте производилось после перехода видеокарты в равновесный температурный режим, во избежание фиксирования завышенных результатов первых нескольких секунд (до нагрева карты).
- 1920×1080 – разрешение большинства популярных мониторов;
- 2560×1440 – средний вариант между Full HD и 4K, предъявляет достаточно высокие требования к производительности.
- 3840×2160: разрешение 4K Ultra HD, доступно на последних моделях мониторов класса high-end.
Anno 1800
Год выпуска – 2019; API – DirectX 12; движок – Anno Engine
Популярнейший хит Ubisoft – градообразующая RT-стратегия Anno – выходил в различных исторических антуражах, включая античный и средневековый, и даже заглядывал пару раз в будущее. Теперь действие разворачивается в прекрасную эпоху промышленной революции, которая началась с приходом 19 века. Геймплей по-прежнему включает в себя градостроительство и морские сражения, в дополнение к которым наметились и новые аспекты – промышленное загрязнение окружающей среды и туризм.
Игра базируется на собственном, разработанном в Ubisoft движке Anno и использует все преимущества DirectX 12; навороченная детализация может существенно нагрузить вашу систему, особенно на высоком разрешении.
Assassin’s Creed: Odyssey
Год выпуска – 2018; API – DirectX 11; движок – AnvilNext 2.0
Assassin’s Creed: Odyssey предлагает вам совершить красивое путешествие в древнюю Грецию (5 в. до н.э.) на современном игровом «железе». Действие «одиссеи» разворачивается за 400 лет до событий Assassin’s Creed: Origins. По времени вы попадаете в самый разгар Пелопонесской войны между греческими городами-государствами: вам предстоит собрать вместе семью вашего персонажа, которая оказалась разрозненной в результате трагедии. В игре представлена богатая коллекция исторических и мифологических персонажей, популярных в Греции того времени.
Assassin’s Creed: Odyssey базируется на том же самом движке, что и «Origins» и «Wildlands» – AnvilNext 2.0 от Ubisoft; «Odyssey» использует все преимущества DirectX 11 и тоже изрядно нагружает систему. Более быстрое «железо» закономерно дает лучшую картинку.
Battlefield V
Год выпуска – 2018; API – DirectX 11; движок – Frostbite
Battlefield V – это новейшая глава в истории суперпопулярного многопользовательского онлайн-шутера от EA. Начав с событий дебютного выпуска «1942», серия прошла по временному кругу и снова остановилась на событиях Второй мировой войны. Однопользовательская кампания, как и в Battlefield 1, разбивается на несколько небольших эпизодов под общим названием War Stories, в каждом из которых свой протагонист выполняет свою миссию на своем фронте. Многопользовательская версия строится на базе главных сил франшизы, с новыми игровыми режимами, к которым в перспективе планируется добавить режим королевской битвы.
Battlefield V работает на движке Frostbite 3 от EA-DICE и поддерживает оба API – DirectX 11 и DirectX 12, а также такую продвинутую технологию, как DirectX Raytracing. Данный конкретный тест мы проводили с DirectX 11, поскольку этим API пользуется большинство геймеров.
Far Cry 5
Год выпуска – 2018; API – DirectX 11; движок – Dunia
Far Cry 5 переносит вас в округ Хоуп (Hope County) штата Монтана (Montana) – один из беднейших регионов Америки, откуда в панике разбежались все стражи общественного правопорядка и где законопослушные граждане лицом к лицу встретились с суровым будущим. Вы вступаете в борьбу с сектой участников так называемого «райского проекта» (Project at Eden’s Gate), которую возглавляет самопровозглашенный посланец Бога; секта состоит из трех «братств», каждое из которых контролирует одну из трех зон округа и специализируется соответственно на оружии, наркотиках или религиозной пропаганде. Этот шутер от первого лица в открытом мире во многих местах перекликается с современным американским политическим дискурсом.
Игра базируется на последней версии движка Dunia, использует преимущества DirectX 11 и в процессе реалистичного воспроизведения великолепных американских пейзажей сильно нагружает машину.
Metro: Exodus
Год выпуска – 2019; API – DirectX 12; движок – 4A Engine
В последнем выпуске культовой игры на выживание в жанре FPS от 4A Games – Metro: Exodus – наш герой Артём (Artyom) отправляется в путешествие по бескрайним российским просторам, на поиски действующего паровоза, на котором он должен возглавить массовый исход оставшихся в живых людей из московского метро; они поедут по Транссибирской магистрали на восток – на поиски других уцелевших после апокалипсиса. Эта игра – не просто шедевр класса AAA, но еще и наглядный пример реализации амбициозных технологий NVIDIA – RTX (рейтрейсинг в реальном времени) и DLSS (суперсэмплинг на основе глубокого обучения). Игра поддерживает DirectX 12 и DXR, но в этом тесте мы отключили опцию DXR/RTX, чтобы можно было корректно сравнивать результаты всех видеокарт.
The Witcher 3: Wild Hunt
Год выпуска – 2015; API – DirectX 11; движок – REDengine 3
The Witcher 3: Wild Hunt – одна из самых ярких игр 2015 года в жанре RPG-экшн. Вы – Геральт (Geralt), ведьмак, который занимается поисками своей пропавшей соратницы Цири (Ciri); в ходе этого квеста вам предстоит исследовать огромный внутриигровой мир. Игра насыщена дополнительными сюжетными линиями, которые, несмотря на обманчивое впечатление, никак не связаны с основными поисками, хотя какие-то неожиданные вещи действительно могут произойти с вами в том мире, частью которого являетесь и вы в образе Геральта.
The Witcher 3 представляет игровой движок REDengine 3, который был разработан специально для жанра RPG в открытом мире. В игре используется интерфейс DirectX 11 с тесселяцией и некоторыми эффектами постобработки. Из соображений сохранения нейтральных условий тестирования в этой игре мы отключили опцию HairWorks.
Wolfenstein II
Год выпуска – 2017; API – Vulkan; движок – id Tech 5
Wolfenstein II: The New Colossus продолжает классическую серию альтернативноисторических сюжетов, где во Второй мировой войне победили фашисты. Действие разворачивается спустя десятилетия после войны, когда наш протагонист BJ Blazkowicz вступает в ячейку Сопротивления, ведущую борьбу с фашистами в оккупированных Соединенных Штатах. Это оригинальная идея, которая прежде не встречалась в альтернативной истории Второй мировой войны. В будущем у фашистов тоже появятся усовершенствованные технологии, вносящие в эту игру ретрофутуристический и киберпанковский колорит.
Wolfenstein II базируется на движке id Tech 5 и, возможно, является первой игрой в классе AAA, которая не поддерживает никакие другие API, кроме Vulkan (и никаких возвратов к GL). Игра основательно нагружает машину, но зато вы получаете множество фишек, которые Vulkan добавляет в пользовательскую графику, – например, мегатекстуры (Megatextures).
Суммарная производительность
На рисунках ниже показаны суммарные показатели производительности видеокарт на разных разрешениях, полученные по результатам всех тестов. На каждой диаграмме за 100% принят суммарный результат тестируемой карты, относительно которого указана производительность остальных видеокарт.
Соотношение производительности и цены
Если вы ищете самый выгодный вариант, то эти результаты будут вам интересны. Для расчета мы брали текущую цену каждой карты на Newegg и ее суммарный показатель производительности. Для карт, которых нет в продаже, мы брали последнюю актуальную цену.
Энергопотребление
Энергопотребление в неигровых режимах по сравнению с исходной версией 1650 немного выросло, вероятно, из-за перехода на GDDR6. Хотя на диаграмме эта разница может показаться существенной, с точки зрения абсолютных значений она минимальна – всего 2 Вт, что не отражается в сколько-нибудь значительной мере ни на нагреве карты, ни на счете за электричество. В режиме включения медиапроигрывателя энергопотребление карты 1650 GDDR6 – одно из самых низких, всего 8 Вт, что актуально для пользователей компактных (SFF) компьютеров, заинтересованных в минимизации нагрева.
Поскольку карта не имеет дополнительных входных разъемов питания, потребляемая ею мощность ограничивается значением 75 Вт – в противном случае возникает перегрузка цепей питания слота PCIe. Поэтому плата видеокарты имеет установленный лимит мощности – 75 Вт, который соблюдается практически всегда: хотя мы зарегистрировали несколько пиков более 75 Вт, они были очень кратковременными и превышали значение 75 Вт не намного, так что все в порядке.
Рекомендуемая мощность блока питания: 300 Вт.
Термические и акустические характеристики
Видеокарта Простой Гейминг Температура GPU, °C Уровень шума, дБА Температура GPU, °C Уровень шума, дБА ASUS GTX 1650 STRIX 44 Fan Stop 64 28 EVGA GTX 1650 SC Ultra Black 33 Fan Stop 66 36 Gigabyte GTX 1650 OC GDDR6 33 30 74 34 MSI GTX 1650 Gaming X 48 Fan Stop 63 29 Palit GTX 1650 KalmX 38 N/A 83 N/A Palit GTX 1650 StormX 35 28 68 34 К сожалению, выключение вентилятора в режиме простоя и слабой нагрузки (Fan Stop) у карты Gigabyte GTX 1650 OC GDDR6 не предусмотрено, что делает ее практически непригодной для использования в бесшумных компьютерных медиасистемах. В режиме простоя вентилятор работает сравнительно тихо, но его определенно слышно. Здесь немного поможет небольшое снижение скорости вращения вентилятора, которое не будет заметно отражаться на температуре видеокарты.
Уровень шума в игровом режиме в целом приемлемый: хорошо слышно, как карта работает под полной нагрузкой, но, поскольку температура GPU при этом составляет около 75°C, можно понять, почему в Gigabyte выбрали такие настройки вентилятора. Просто радиатор кулера слабоват для графического чипа TU117.
Оверклокинг
Ручной оверклокинг позволил получить на нашем образце следующие максимальные результаты: увеличить до 1885 МГц частоту памяти (плюс 26% за счет разгона) и прибавить 205 МГц к базовой частоте GPU, что в среднем позволило увеличить частоту GPU с 1837 до 1877 МГц (плюс 2% за счет разгона).
Характеристики оверклокинга
Видеокарта Средняя частота GPU, МГц Максимальная частота памяти, МГц Производительность, FPS ASUS GTX 1650 STRIX 2029 2380 54.2 EVGA GTX 1650 SC Ultra Black 2094 2430 55.1 Gigabyte GTX 1650 OC GDDR6 1877 1885 56.1 MSI GTX 1650 Gaming X 2117 2460 55.5 Palit GTX 1650 KalmX 1947 2330 51.1 Palit GTX 1650 StormX 1988 2415 53.1 Для оценки прибавки к производительности, которую дает разгон видеокарты, мы провели быстрый тест Unigine Heaven при указанных выше частотах GPU и памяти.
Фактическая прибавка к частоте кадров, которую дает оверклокинг карты GTX 1650 OC GDDR6 в 3D-приложениях, составляет 8.9%.
Основные рабочие характеристики
В этом тесте мы сначала привели карту в состояние термического равновесия в режиме простоя. Затем мы запустили равномерную игровую нагрузку и под этой нагрузкой измерили основные рабочие параметры видеокарты. Приведенные ниже графики показывают, как изменялись тактовая частота, напряжение и температура GPU под нагрузкой и как раскручивались вентиляторы с повышением температуры. Как только температура под нагрузкой стабилизировалась (не повышалась в течение двух минут), мы выключили игровую нагрузку и зарегистрировали изменения всех параметров в процессе остывания карты.
Анализ частот и напряжений
Напряжение и частота видеокарты автоматически настраиваются на нужные значения в зависимости от нагрузки, температуры и других факторов.
На графике ниже маркированными точками обозначены все комбинации напряжения GPU и соответствующей ему тактовой частоты, которые имели место в наших тестах на разрешении 1920×1080. Маркеры точек – прозрачные, что позволяет оценить, насколько часто встречается та или иная комбинация тактовой частоты и напряжения: чем чаще, тем больше маркеров накладывается друг на друга и тем гуще получается цвет.
Профили частот
Современные видеокарты имеют несколько профилей частот, которые выбираются из соображений баланса между потребляемой мощностью и требуемой производительностью.
В таблице ниже приведены значения тактовых частот, устанавливаемые для типовых сценариев, и соответствующие значения напряжения GPU.
Нагрузка Частота GPU, МГц Частота памяти, МГц Напряжение GPU, В Обычная конфигурация 300 101 0.650 Многомониторная конфигурация 300 101 0.650 Проигрывание медиаконтента 300 101 0.650 3D-приложения От 1575 до 1950 1500 От 0.775 до 1.050 Лимиты мощности
Все видеокарты NVIDIA имеют установленные лимиты мощности (энергопотребления), которые задаются в BIOS и определяются диапазоном соответствующих настроек Boost-частот. Второй лимит соответствует максимальному значению TDP, которое пользователь может задать в настройках оверклокинга, то есть максимально возможному перемещению ползунка мощности. На второй диаграмме значение в скобках показывает, на сколько процентов верхняя граница диапазона этой настройки у той или иной карты превышает установленный по умолчанию лимит мощности основной тестируемой карты (Gigabyte GTX 1650 OC GDDR6).
Заключение
Видеокарта Gigabyte GTX 1650 OC GDDR6 продается в среднем за $175.
- память GDDR6 обеспечивает более высокую производительность;
- предлагается заводской разгон;
- отличный потенциал для разгона памяти;
- высокая энергетическая эффективность;
- компактный дизайн;
- не требуется дополнительный коннектор питания.
- во многих играх общей производительности карты не хватает для выхода на 60 FPS на разрешении 1080p (Full HD);
- эта карта существенно медленнее GTX 1650 Super и RX 5500 XT;
- вентилятор шумноват;
- нет режима Fan Stop;
- лимит мощности не выше референсного значения;
- нет подложки;
- нет опций пользовательской настройки лимита мощности.
Компания NVIDIA анонсировала версию GTX 1650 с памятью GDDR6 примерно месяц назад. В этот раз они решили не выставлять против конкурентов очередную карту «SUPER», а пошли по пути эффективной модернизации существующих моделей. Поскольку память GDDR6 уже становится фактическим стандартом для видеокарт и производители памяти в массовом порядке переключаются с GDDR5 на GDDR6, использовать GDDR5 в качестве «сырья» становится все менее выгодно. Значительная часть этой продукции идет на производство игровых консолей Xbox и PlayStation, на смену которым, однако, в конце этого года также должны прийти модели следующего поколения. Поэтому NVIDIA выпустила эту новую видеокарту – как подтверждение того, что они и дальше смогут выпускать карты GTX 1650 (с новой памятью).
Кроме типа памяти в концепции видеокарты ничего не изменилось. Графический процессор TU117 изначально поддерживает и GDDR5, и GDDR6, поэтому новый GPU не требуется. Все основные спецификации остались теми же: объем VRAM, количество блоков ROP, TMU и шейдеров. Единственное отличие здесь – слегка сниженные тактовые частоты GPU. Референсная карта GTX 1650 с GDDR5 имеет базовую частоту 1485 МГц и Boost-частоту 1665 МГц, а новая модель с GDDR6 – базовую частоту 1410 МГц и Boost-частоту 1590 МГц, что примерно на 5% меньше. Это не злодейский план NVIDIA, наоборот – это позволило карте вписаться в тот же лимит потребляемой мощности – 75 Вт – и безопасно работать от одного слота. Также удачным решением является заводской разгон от Gigabyte до 1635 МГц (Boost), хотя это все-таки на 30 МГц меньше референсной Boost-частоты карты с GDDR5.
Средние результаты по всем бенчмаркам на разрешении 1080p показывают, что карта Gigabyte GTX 1650 OC GDDR6 на 7% быстрее карты GTX 1650 GDDR5. Новые чипы GDDR6 обеспечивают в полтора раза большую пропускную способность памяти, и это действительно положительно сказывается на производительности. Наша карта примерно соответствует уровню производительности GTX 1060 3 ГБ и на 4% медленнее устаревающей Radeon RX 570. RX 580 – на 21% быстрее, GTX 1650 Super – на 25%. Недавно выпущенная карта AMD Radeon RX 5500 XT – на 23% быстрее. Таким образом, среди карт текущего поколения GTX 1650 GDDR6 все-таки является самой медленной, что, однако, не означает, что она вообще слишком медленная для гейминга. Мы видим, что примерно в половине игр с максимальными (Ultra) настройками карта 1650 GDDR6 обеспечивает частоту кадров 60 FPS или даже выше. В самых требовательных играх, если вы частично пожертвуете детализацией, то также сможете получить с этой картой гладкий геймплей с частотой кадров 60 FPS на разрешении Full HD. Проблема здесь в том, что другие модели, представленные на рынке, часто быстрее и при этом стоят примерно столько же или даже дешевле. И в дальнейшем эта проблема только усугубится.
Кулер у этой карты Gigabyte – самый простой: один вентилятор и радиатор без тепловых трубок. Конечно, это сказывается на температурных показателях не лучшим образом. Однако максимальная температура GPU составила всего 74°C – это хороший результат, обратной стороной которого является сравнительно высокий уровень шума от вентилятора: 34 дБА. Эта карта шумит сильнее, чем более продвинутые модели (к примеру, Gigabyte предлагает также двухвентиляторную модель WindForce). Шумовые показатели, в том числе и в режиме простоя, далеки от «неслышных» значений, но все-таки достаточно приемлемы. Очень жаль, что у этой карты не предусмотрен переход в режим Fan Stop при низкой нагрузке: сегодня это уже почти стандарт, потому что людям приятнее работать с документами или просматривать веб-страницы, когда их не отвлекает шум вентилятора. В режиме простоя вентилятор слышно; если бы в Gigabyte для этого режима установили просто меньшую скорость вращения вентилятора, он работал бы тише и температура GPU при этом существенно не повысилась бы. Карта AMD Radeon RX 5500 XT стоит примерно столько же, и большинство протестированных здесь карт не только поддерживают Fan Stop, но и под игровой нагрузкой работают значительно тише – почти бесшумно.
Мне очень понравился компактный дизайн карты Gigabyte, которая гарантированно впишется в любой корпус, включая формат SFF. Поскольку этой карте не требуется дополнительный коннектор питания, вам не придется путаться в проводах в тесном корпусе с блоком питания небольшой мощности. Однако это подразумевает и ограничение мощности карты до 75 Вт, и, следовательно, некоторое ограничение производительности. Когда анонсировали память GDDR6, нам обещали снижение энергопотребления, и это, действительно, так, если говорить о сравнении энергетических показателей при одинаковом быстродействии (Гбит/с, а не МГц). Если сравнивать энергетическую эффективность GTX 1650 с GDDR5 (8 Гбит/с) и с GDDR6 (12 Гбит/с), то следует отметить небольшое увеличение энергопотребления памяти и, конечно, рост производительности. Сравнивая относительные показатели – отношение производительности (частоты кадров) к потребляемой мощности, мы видим, что модель с GDDR6 в части энергетической эффективности немного уступает модели с GDDR5, хотя разница составляет всего несколько процентов. И данная конкретная модель имеет очень удачный с точки зрения энергетической эффективности дизайн – лучше, чем у карт Turing более высокого класса и тем более карт AMD.
Несмотря на то, что ручной оверклокинг несколько осложняется ограничениями по мощности, из-за которых вы не можете установить более высокую частоту, мы получили отличные результаты в части разгона памяти GDDR6: с 1500 до 1885 МГц, то есть плюс 26%! Разгон GPU упирается в лимит мощности, но мы все-таки получили 2%-ную прибавку к тактовой частоте, которая вылилась в 9%-ный прирост производительности в реальных приложениях. В Gigabyte заблокировали критические настройки своих BIOS’ов, поэтому увеличить лимит мощности вручную невозможно.
Объем видеопамяти – 4 ГБ: на первый взгляд, маловато, но нужно учесть ценовой сегмент. Больший объем памяти увеличил бы стоимость этой карты без существенного увеличения производительности на разрешении 1080p Full HD. Как показывают результаты тестов, на разрешении 4K преимущество карт с большим объемом памяти возрастает, но ничто не указывает на то, что на разрешении 1080p объем памяти является ограничивающим фактором. Мы использовали настройки с максимальным уровнем детализации, в том числе пакеты текстур HD (при наличии их в игре), то есть игры предлагают достаточно возможностей для снижения требований к памяти, если ее не хватает. Я скорее куплю видеокарту, более доступную по цене на сегодняшний день, чем буду тратить деньги на карту «с заделом на будущее» – по крайней мере, в этом сегменте.
Основная проблема карты GTX 1650 – и с GDDR5, и с GDDR6 – это цена. За те $175, которые Gigabyte запрашивает за модель GTX 1650 OC GDDR6, можно найти несколько хороших альтернативных вариантов. Если вы готовы потратить чуть-чуть больше, то очевидно лучшим решением станет GTX 1650 Super, которая предлагает на 25% большую производительность. Еще одна отличная альтернатива – Radeon RX 5500 XT, которая стоит от $180 и предлагает близкую по величине прибавку к производительности, а также гораздо более тихий кулер (особенно у Sapphire Pulse). Если вы решили приобрести подержанную видеокарту, то стоит обратить внимание на Radeon RX 570 или RX 580, которые можно купить по выгодной договорной цене. Конечно, эти карты не оснащены новейшими технологиями и имеют меньшую энергетическую эффективность, но они совместимы со всеми новыми играми и помогут вам скоротать время до того момента, когда подешевеют карты следующего поколения.