DLSS 2.0 протестирован: почему вы должны наконец включить апскейлинг Nvidia на базе искусственного интеллекта

DLSS 2.0 протестирован: почему вы должны наконец включить апскейлинг Nvidia на базе искусственного интеллекта

Nvidia официально выпустила второе поколение суперсэмплинга Deep Learning, также известное как DLSS 2.0. Он обещает превосходное качество изображения с новым и улучшенным ботом изображений AI, а также жизненно важные обновления для простой интеграции, чтобы ускорить добавление поддержки игры. Все это похоже на то, что DLSS требует, чтобы действительно сделать себе имя.

Для этого ему необходимо обеспечить более высокую частоту кадров — за счет возможностей масштабирования AI — с минимальным влиянием на визуальную точность. Это, в конце концов, то, что было обещано с DLSS еще при запуске серии RTX 20 в августе 2018 года. Первоначальный алгоритм сверхвысокого разрешения на основе ИИ действительно обеспечил значительное увеличение частоты кадров, но сильно потерял четкость изображения. В результате функция повышения производительности, которая часто была ключом к приемлемой частоте кадров при включенных эффектах трассировки лучей, была оставлена ​​в стороне.

Итак, что нового в DLSS 2.0, и почему вам стоит еще раз взглянуть на технологию Nvidia? Возможно, самое большое улучшение нейронной сети Nvidia — это новые методы временной обратной связи, которые, по ее словам, могут обеспечить более четкие детали изображения и улучшенную стабильность от кадра к кадру. То, что он утверждает, должно успокоить множество жалоб пользователей.

Но DLSS также требует поддержки, чтобы получить известность. Чтобы уменьшить нагрузку на собственную команду, которая уже вложила «кровь, пот и слезы» в DLSS, Nvidia удалила требование обучать сеть ИИ для каждой игры. Систему по-прежнему нужно будет обучить и добавить поддержку для игры индивидуально, но это можно сделать с информацией, не относящейся к игре. Таким образом обеспечивается крайне важная гибкость, необходимая для любой молодой игровой технологии, которая позволяет успешно работать в отрасли.

Однако для DLSS по-прежнему требуется видеокарта RTX 20-й серии, что для некоторых будет держать технологию на расстоянии вытянутой руки. DLSS требует наличия у этих карт тензорных ядер, ускоряющих ИИ, которые архитектура Nvidia Turing интегрирует в кристалл для рабочих нагрузок ИИ. К сожалению, без них далеко не уедешь.

Но на самом деле важнее всего то, как DLSS 2.0 формируется в игре. Чтобы ответить на этот вопрос, я протестировал его в двух из четырех поддерживаемых в настоящее время игр: Control и Wolfenstein: Youngblood. Одна игра предлагает лучшую реализацию RTX, доступную на сегодняшний день, а другая — современный движок, максимально использующий отражения с трассировкой лучей. Плюс реализация DLSS от Wolfenstein по сравнению с ней проста в использовании, что в наши дни является относительной находкой.

Никогда не скромничайте, я выбрал Nvidia GeForce RTX 2080 в тестовом стенде, укомплектованный 2944 ядрами CUDA и 368 тензорными ядрами. Это в паре с Intel Core i7 9700K на стандартной скорости, 16 ГБ памяти DDR4-2400 и приятно быстрым SSD WD Black NVMe.

Тем не менее, даже RTX 2080 может начать потеть с RTX на макс при 1440p, особенно когда вы после частоты обновления 144 Гц. Это подводит нас к двум основным принципам DLSS: производительность и качество. Как всегда, вы всегда будете искать баланс между ними.

В DLSS 2.0 Nvidia интегрировала это мышление в меню параметров. Это явно обозначено, например, в Wolfenstein: Youngblood. После включения DLSS открывается три уровня: производительность, сбалансированность и качество.

В Control вывески DLSS не так ярко светятся. Три уровня все еще существуют, их всего лишь три разрешения рендеринга, что далеко не интуитивно. С выходным разрешением 1440p (это будет зависеть от разрешения вашего монитора) мы можем выбрать одну из трех предустановок: 1280×720, 1484×835 и 1706×960. Затем они масштабируются до вашего выходного разрешения с помощью магии AI и DLSS. Каждое значение фактически представляет один из уровней: 1280×720 соответствует производительности, 1484×835 — сбалансированному, а 1706×960 — качеству. Чем ниже разрешение, тем хуже точность конечного изображения, но также меньше нагрузка на графический процессор, следовательно, выше производительность.

Если ваше выходное разрешение установлено на 1080p или 4K, три доступных на выбор разрешения будут отличаться от перечисленных выше. Не волнуйтесь, просто выберите самое низкое разрешение для лучшей производительности и самое высокое разрешение для наилучшего качества.

Nvidia рекламирует 4-кратное масштабирование с помощью DLSS 2.0. Это означает, что если вы установите разрешение рендеринга на 1080p и разрешение вывода на 4K, три из каждых четырех пикселей на экране будут генерироваться нейронной сетью. Жутко, правда?

Начнем с Control. Как я уже сказал, я искренне верю, что это один из лучших примеров трассировки лучей в современных играх. Давайте посмотрим, будет ли это по-прежнему в силе, когда Minecraft с RTX появится в конце этого года, но пока давайте придерживаться того, что мы знаем.

С последним пакетом драйверов Nvidia, 445.75, который также оптимизирован для DLSS 2.0, наш тест Control, проходящий через самый старый дом, ныряя и ныряя в бой с несколькими избранными врагами во взрывоопасной среде, оказался сложной задачей для нашего RTX 2080. с предустановкой «high» для графики он выдавал всего 57 кадров в секунду в среднем за время прогона, с минимумом 47 кадров в секунду (99-й процентиль. Это тоже с отключенной трассировкой лучей.

Среднее (кадров в секунду)Мин. (Кадр / с / 99-й процентиль)
Родной (445,75)5747
DLSS 2.0
Производительность (1280×720)12499
Сбалансированный (1484×835)10778
Качество (1706×960)9174

Контрольные тесты проводились с разрешением 1440p, высокой предустановкой, с отключенным RTX.

Сравните это с DLSS 2.0 в режиме производительности при средней частоте 124 кадра в секунду и минимум 99 кадрах в секунду, и становится очевидным преимущество того, что нейронная сеть Nvidia выполняет всю тяжелую работу. Но в этом нет ничего нового. DLSS 1.0, несомненно, увеличил частоту кадров, но он не смог этого сделать, не уменьшив ваше кристально чистое изображение до тени от его прежнего себя. То же самое во многих отношениях справедливо и для режима Performance DLSS 2.0. Предпочитая частоту кадров точности, он по-прежнему размывает сцену слишком сильно, на мой вкус, и я бы не решился оставить ее включенной на протяжении более 10 часов — в основном из-за боязни упустить возможность испытать лучшее из мир, на создание которого разработчики потратили так много времени.

Вот где приходит на помощь режим качества DLSS 2.0. Обработка каждого кадра занимает немного больше времени, но при этом сеть искусственного интеллекта Nvidia способна провести через сцену тонкую гребенку. Он использует это время, чтобы тщательно выбрать здесь многоугольник или полосу волос и масштабировать их с максимальной точностью.

Результаты DLSS 2.0 в режиме качества довольно впечатляющие в Control. Сильные детали проявляются даже на заднем плане сцены, например, линии оттяжек в задней части кадра или трещины на кожаной куртке Джесси, которые добавляют ее одежде еще несколько месяцев износа. Однако волосы по-прежнему остаются камнем преткновения, и наличие псевдонимов там, где ИИ изо всех сил пытается повысить масштаб исходного материала, показывает, что в будущем есть возможности для предоставления большего количества компьютерных умов на пиксель.

Тем не менее, с увеличением производительности в диапазоне 60% между качеством DLSS 2.0 и рендерингом Native 1440p некоторые недостатки можно игнорировать. В этом разница между частотой менее 60 кадров в секунду и потрясающе плавным игровым процессом даже в худшем случае: исходное разрешение 1440p при средней скорости 57 кадров в секунду и минимум 47 кадрах в секунду; Качество DLSS 2.0 при среднем 91 кадре в секунду и минимум 74 кадрах в секунду.

Control также предлагает нам возможность из первых рук увидеть разницу между сценой DLSS, масштабированной с 720p (режим производительности) до исходного изображения 720p. Если вы сравните изображения ниже, весьма примечательно, как нейронная сеть способна реплицировать информацию, необходимую для заполнения промежутков между исходным кадром 720p и изображением 720p, увеличенным до 1440p с помощью DLSS 2.0.

Давайте переключим наше внимание на Wolfenstein: Youngblood, где устрашающий вес надвигающейся точки перегиба суперинтеллекта искусственного интеллекта оборачивается почти головокружительным эффектом. По крайней мере, таков мой опыт. И мнение, разделяемое многими коллегами, которых я просил, правильно идентифицировать сцену, отрендеренную в собственном формате, от масштабированной DLSS до смешанных результатов. 

Склонность ИИ к воссозданию мозаики из миллиона частей с помощью лишь нескольких доступных частей и с почти идеальной точностью почти поразительна.

Как и в случае с Control, режим производительности Wolfenstein (который четко обозначен как таковой в меню настроек) обеспечивает замечательный прирост производительности по сравнению с исходным разрешением 1440p и ультра-предустановленным рендерингом. Мы тестируем эту игру с включенным RTX в тестах Riverside и Lab X и усредняем результаты. В то время как нативный рендеринг обеспечивает стабильное среднее значение 79 кадров в секунду и минимум 56 кадров в секунду — почти тот минимум, который мы хотели бы достичь, — при включенной производительности DLSS 2.0 наши средние значения достигли 106 и 79 кадров в секунду. Если бы только получившееся изображение не было таким расплывчатым, иначе мы бы оставили его там.

Сбалансированный режим предлагает умеренные улучшения общего качества изображения, но снова оставляет намек на нежелательную близорукость в сцене — и мне этого уже достаточно, спасибо. Вместо этого вам стоит присмотреться к качественному режиму: именно здесь механизмы Wolfenstein: Youngblood и DLSS 2.0 идеально синхронизируются.

По сравнению с исходным средним значением 57 кадров в секунду, настройка качества обеспечивает повышение производительности на 60% до 91 кадра в секунду. Точно так же вы увидите падение только до 74 кадров в секунду, а не до 47 кадров в секунду. Одно это было бы не слишком убедительно, если бы эта близорукость все еще окутывала фон. Однако он превращается в слишком правдивый образ для чего-то, придуманного какой-то нейронной сетью. 

Среднее (кадров в секунду)Мин (кадр / с)
Родной (445,75)7956
DLSS 2.0
Производительность12785
Сбалансированный11785
Качество10679

Wolfenstein: тесты Youngblood проводились с разрешением 1440p, предустановкой Ultra и включенными отражениями с трассировкой лучей.

Между качеством DLSS 2.0 и нативным рендерингом осталось несколько явных признаков апскейлинга. Решетки, перфорированные объекты и другая сложная повторяющаяся геометрия — это почти безукоризненно воспроизведенные копии самих себя. Модели персонажей четко отличимы от их окружения, и даже объекты на расстоянии замечательно детализированы, что может быть только результатом предположения ИИ.

Что действительно удивительно, так это то, что, в некотором смысле верное слову Nvidia, сцена DLSS 2.0 часто немного более четко определена, чем ее собственный аналог. Я знаю, кто это ожидал? Из-за интенсивного, деспотичного временного сглаживания суперсэмплинга (TSSAA), установленного в качестве стандартного в предустановке Wolfenstein Ultra, некоторые текстуры при просмотре под определенным углом на расстоянии теряют четкость деталей. Например, линии, разделяющие плитку на полу перед рядом компьютерных экранов вдалеке. Или облицовка над первой лестницей справа от сцены.

Вы можете возразить, что в некоторых отношениях собственное разрешение соответствует источнику того, что планировали разработчики, и, следовательно, является правильным. Потому что это так. И ты прав. Но в некоторых местах нативная сцена сбивается с толку из-за необходимости применить к сцене дополнительное сглаживание. На скриншотах ниже показано различие между тремя методами AA в игре: TSSAA 8TX, SMAA 1TX и FXAA 1TX. Последние два имеют тенденцию размывать общую сцену, передний план и фон в большей степени, чем TSSAA, тогда как он имеет тенденцию только терять четкость по мере того, как вы исследуете задний план.

Честно говоря, все это доказывает только одно: я непостоянен, и я думаю, что многие из вас тоже могут быть такими, когда дело касается визуального оформления вашей игры. Я не согласен на меньшее, чем установленный для моего оборудования предел, какими бы достойными ни были цифры на бумаге. И они должны быть достаточно убедительными. Просто посмотрите на эти улучшения производительности: 61% в Wolfenstein: Youngblood, 118% в Control. Несмотря на мои интересы, когда дело доходит до высокой частоты обновления моего монитора, я хочу в полной мере насладиться этим игровым миром со всеми его нюансами и тонко проработанными деталями, не прибегая к появлению нового искусственного интеллекта и его беспорядку.

Похоже, что немногие из нас готовы пойти на эту визуальную жертву, о чем свидетельствует DLSS первого поколения и прохладная реакция, которую получил его ограниченный выпуск первой волны. Таким образом, DLSS, ориентированная исключительно на производительность, не могла завоевать популярность в отрасли. И, что наиболее важно, мы, геймеры, в целом. 

Склонность ИИ к воссозданию мозаики из миллиона частей с помощью лишь нескольких доступных частей и с почти идеальной точностью почти поразительна.

Скорее, это повышение производительности, при минимальных затратах или бесплатно, обеспечиваемое предустановкой качества DLSS 2.0, которая может, и я бы хотел думать, получит импульс. Они говорят, что не существует такой вещи, как бесплатная производительность, но я думаю, что DLSS 2.0 и его преемники будут настолько близки, насколько это возможно, когда необходимая микросхема будет распространена во всей линейке графических процессоров. И прародителем всего этого является Wolfenstein: Youngblood.

Что заставляет задуматься, чего еще можно добиться в играх с помощью ИИ и машинного обучения? И как долго AMD сможет избегать такой технологии, если темпы улучшения масштабирования нейронных сетей из года в год так стремительны? Ожидающей отрасли отрасли достаточно эффективно внедрить DLSS в большинстве будущих игр, чтобы Nvidia могла эффективно добиться повышения производительности примерно на 60%, даже не касаясь своего кристалла.

Я не сомневаюсь, что AMD ответит тем же, представив соответствующий продукт Radeon — возможно, через инициативу GPUOpen. Это уже работает в FidelityFX Content Adaptive Sharpening (CAS).

У Nvidia также есть некоторые препятствия, прежде чем что-либо вроде DLSS станет повсеместным. Скорее всего реализация. Нам нужно будет следить за каждым нюансом использования технологии, чтобы увидеть, смогут ли они скользить под планкой, установленной Wolfenstein, и вместо этого не выбивать пятки и не рушиться нечеткой кучей. Также существует проблема, как убедить пользователей, независимо от результатов, в первую очередь включить DLSS. Мы не можем включить его по умолчанию, в конце концов, на рынке не доминируют карты RTX 20-й серии, способные работать с ним. Что делать гиганту GPU? 

Это подводит нас к еще одному серьезному препятствию, и это, конечно, проблема внедрения кремния, способного к DLSS, в игровые ПК игроков. Решение Nvidia о выпуске графических карт нового поколения должно быть ниже, чем сегодня с RTX 2060 за 299 долларов.

Тем не менее, безусловно, есть что сказать о DLSS 2.0 и команде, ответственной за него в Nvidia. После ограниченного первоначального запуска с DLSS я подумал, что эту функцию, безусловно, нужно отметить как опробованную и протестированную, а затем оставить на корню. Вместо этого DLSS 2.0 — это эффективный и незамедлительный путь к бесплатному увеличению производительности с минимальным визуальным воздействием или без него. И его растущая доступность для ряда видеокарт и игр может сигнализировать о том, что приложения AI в играх еще не наступили.