DLSS 4 может быть потрясающим, и Nvidia нуждается в этом
Не буду врать: Nvidia хорошо поработала над Deep Learning Super Sampling (DLSS) 3 , и почти невозможно, чтобы этот успех не способствовал продажам. DLSS 3, с его способностью превращать графический процессор среднего уровня в нечто гораздо более мощное, является довольно новаторским, и это сильный аргумент в пользу продажи, если он когда-либо существовал.
Но что будет дальше? Серия RTX 40 почти подошла к концу, и вскоре у Nvidia появятся новые графические процессоры, которые они смогут попробовать и продать — возможно, без дополнительного стимула в виде эксклюзивной технологии масштабирования. За DLSS 3 будет сложно следить, и если слухи о будущих видеокартах окажутся правдой, Nvidia, возможно, действительно понадобится DLSS 4, чтобы стать хитом.
Когда графический процессор не имеет значения
Поскольку мы находимся на пороге нового поколения графических процессоров, можно с уверенностью оглянуться на серию RTX 40 и оценить ее такой, какая она была: не без недостатков, но все же огромна.
Следуя по стопам серии RTX 30, Nvidia не пришлось много делать, чтобы продавать новые графические процессоры. В конце концов, рынок только что испытал огромный дефицит. Планка была установлена довольно низкой — потребители хотели, чтобы графические процессоры были доступными по цене, выполняли свою работу и были доступны без особых хлопот. Если предположить, что это был критерий для многих геймеров, Nvidia сумела выполнить два из трех. Серию RTX 40 легко найти, и некоторые графические процессоры этого поколения действительно впечатляют. Однако этот недостающий момент — вот здесь все становится сложнее.
Nvidia выпустила серию RTX 40 с двумя графическими процессорами стоимостью 1600 и 1200 долларов соответственно, и, как ни странно, более дорогая карта предлагала лучшее соотношение цены и качества. Последующие графические процессоры не были фантастическими: коэффициент производительности на доллар не соответствовал тому, что вы ожидаете увидеть в новом поколении. Некоторые карты, такие как RTX 4060 Ti , в конечном итоге предлагали почти ту же производительность, что и их аналоги последнего поколения. Это не то, что вы хотите видеть в продукте следующего поколения.
Но в этом поколении у Nvidia было главное преимущество, независимо от конкретной карты: DLSS 3.
У нас есть множество примеров того, насколько преобразующим может быть DLSS 3 для видеокарт начального и среднего уровня. В играх, которые его поддерживают, DLSS 3 обеспечивает производительность, намного превышающую ту, которую вы ожидаете от некоторых карт.
Возьмем , к примеру, RTX 4070 Super . Когда мы попытались запустить Cyberpunk 2077 в разрешении 4K с включенной трассировкой лучей, графический процессор справедливо боролся, выдавая жалкие 19 кадров в секунду (fps). Включите DLSS 3, и он внезапно начнет работать со скоростью 77 кадров в секунду. Чтобы комфортно запустить эту игру в разрешении 4K без DLSS, вам понадобится гораздо более дорогой графический процессор. В два раза дороже.
У Nvidia есть хорошая технология DLSS, и она поступила умно. Он заблокировал его за платным доступом, чтобы положить конец всем платным доступам, сделав его доступным только на одном поколении графических процессоров. Хотя предыдущая версия DLSS доступна всем владельцам карт RTX, DLSS 3 является эксклюзивной для серии RTX 40. Как это для стимула к обновлению?
Учитывая, что он далек от DLSS 2, DLSS 3 ни в коем случае не может побудить некоторых покупателей выбрать карту последнего поколения или вообще перейти на Nvidia. Лично, когда я взвешивал различия между RTX 4080 и AMD RX 7900 XTX, DLSS 3 сыграл важную роль в моем решении остановиться на Nvidia.
Некоторые карты RTX 40-й серии превосходны. Некоторые из них — всего лишь сосуды для DLSS 3, и благодаря возможностям поколения кадров Nvidia их до сих пор продают. DLSS 3 сделал так, что сама видеокарта имеет гораздо меньшее значение, и Nvidia, возможно, придется повторить это для RTX 50-й серии .
Мрачные предположения
Несмотря на то, что, по слухам, серия RTX 50 будет выпущена позднее в этом году, мы до сих пор мало что знаем о ней, кроме спекуляций. На самом деле, помимо того факта, что это поколение называется Blackwell, я не уверен, что Nvidia когда-либо что-либо подтверждала. Итак, мы обращаемся к информаторам, чтобы они предоставили нам информацию, которая может быть правдивой, а может и нет, и это не так уж хорошо.
Самые желанные утечки относительно серии RTX 50 связаны с техническими характеристиками, поскольку пока еще слишком рано надеяться увидеть цены. В связи с этим самая последняя утечка произошла от kopite7kimi, а «Закон Мура мертв» выдвинул некоторые собственные предположения.
Источник информации раскрыл предполагаемое количество потоковых мультипроцессоров (SM) для каждого графического процессора, от высокопроизводительного GB202 до GB207 начального уровня, показав количество кластеров обработки графики (GPC), умноженных на кластеры обработки текстур (TPC). Удвоение этого числа дает нам общее количество SM. Это, в свою очередь, говорит нам, сколько ядер CUDA имеет каждый графический процессор, и это хороший показатель того, как он будет сравниваться со своими предшественниками.
Если оставить в стороне расчеты, то, что мы потенциально видим в серии RTX 50, похоже на повторение серии RTX 40. Топовый графический процессор GB202 должен обеспечить значительный прирост по всем направлениям: заявлено 192 SM (по сравнению со 142 SM в AD102), или улучшение SM на 33%. Переходя к GB203, который, как сообщается, был значительно урезан и может появиться в RTX 5080, улучшение составило всего 5%.
Графический процессор GB205 — вот где все становится по-настоящему рискованно. Дело не только в том, что нет увеличения SM — на самом деле существует понижение на 17% по сравнению с AD104 (в этом поколении нет GB204) с 60 SM до 50. Далее говорится, что GB206 имеет точно такое же количество SM, а GB207 вновь отмечается снижение количества SM на 17%: с 24 до 20.
Если это подтвердится, мы увидим небольшие улучшения по всем направлениям, кроме RTX 5090. Даже в этом случае неясно, какую часть чипа на самом деле будет использовать видеокарта; RTX 4090 не использовала всю мощность чипа AD102, поэтому окончательное количество SM в готовом продукте может быть меньше.
GB202 12*8 512-битная память GDDR7
GB203 7*6 256-битная память GDDR7
GB205 5*5 192-битная GDDR7
GB206 3*6 128-битная память GDDR7
GB207 2*5 128-битная память GDDR6— kopite7kimi (@kopite7kimi) 11 июня 2024 г.
Конечно, у нового поколения есть больше преимуществ, чем просто увеличение вычислительной мощности. «Закон Мура мертв» предполагает, что чип GB203 (RTX 5080) должен обеспечить увеличение тактовой частоты до 10%, улучшение количества инструкций на блокировку (IPC) и значительное увеличение пропускной способности. Последнее связано с тем, что Nvidia, как говорят, переходит на более быструю память GDDR7, так что уже одно это должно очень помочь.
Эти прогнозы более оптимистичны. YouTuber оценивает прирост в 15–30 % на каждом уровне ниже RTX 5090, а для флагмана мы можем увидеть рост на целых 60 %. Однако это все равно меньше, чем между RTX 3090 и RTX 4090, и прироста на 15% может быть недостаточно, чтобы привлечь новых покупателей. Это зависит от цены, и хотя Nvidia, похоже, усвоила урок с картами RTX 40 Super , я не ожидаю, что серия RTX 50 будет дешевой.
Если прогнозы оправдаются и мы получим новые графические процессоры с не столь значительным улучшением игровой производительности, но с повышением цен, Nvidia понадобится еще один аргумент в пользу продажи. Ему понадобится DLSS 4, и он должен быть выдающимся.
Чего мы можем ожидать от DLSS 4?
Как и RTX 50-й серии, следующее поколение технологии масштабирования искусственного интеллекта от Nvidia окутано загадкой. Мы знаем, что это, скорее всего, произойдет, но произойдет ли это в этом году? Что это принесет? Нам снова приходится прибегать к спекуляциям, но на этот раз их подогревает сам Дженсен Хуанг, генеральный директор Nvidia.
В пост-Computex вопросах и ответах (поделился More Than Moore ) Хуанг рассказал об использовании ИИ в играх. Мы все знаем, что Nvidia любит искусственный интеллект, и с появлением на горизонте таких вещей, как G-Assist , в будущем мы увидим только больше искусственного интеллекта в играх.
«В будущем мы даже будем создавать текстуры и объекты, причем объекты могут быть более низкого качества, но мы сможем улучшить их внешний вид. Мы также будем создавать персонажей в играх — представьте себе группу из шести человек, двое могут быть реальными, а остальные могут быть искусственными интеллектами длительного использования», — сказал Хуанг.
Подавляющее использование ИИ продолжалось на протяжении всего его ответа. Он добавил: «Игры будут создаваться с использованием ИИ, в них будет ИИ, и даже компьютер станет ИИ с помощью G-Assist. Вы можете использовать ПК в качестве помощника искусственного интеллекта, который поможет вам в игре».
В ответе Хуанга не упоминается DLSS, но он стал ответом на вопрос как о DLSS, так и о Nvidia ACE. Но попадут ли эти функции в DLSS 4? Будут ли они полностью реализованы только к DLSS 5? Станут ли они чем-то совершенно другим? Пока слишком рано говорить об этом, но ясно, что Nvidia надеется сделать искусственный интеллект основой вашего игрового процесса.
Создание внутриигровых ресурсов вместо просто кадров может показаться не чем-то, что могло бы повысить производительность, но вполне может. Это перенесет часть работы с ядер CUDA на тензорные ядра, которые предназначены для обработки рабочих нагрузок искусственного интеллекта и машинного обучения. В результате у графического процессора должно быть больше ресурсов, чтобы просто сосредоточиться на производительности, в то время как тензорные ядра обрабатывают часть задач искусственного интеллекта.
Генерация ресурсов — это еще один шаг вперед по сравнению с генерацией кадров, которую мы знаем из DLSS 3. Nvidia надеется создать не только внутриигровые ресурсы, но и неигровых персонажей, предположительно созданных с помощью Nvidia ACE, чтобы воплотить их в жизнь. Если хотя бы половина из этих вещей доберётся до DLSS 4, у Nvidia может оказаться настоящая жемчужина, и она уже приближается к этому. DLSS 3 теперь фактически является DLSS 3.7 ; Версия 3.5 принесла нам реконструкцию лучей , а версия 3.7 предлагала более мелкие обновления.
Обратная совместимость? Возможно нет
Предположим, что DLSS 4 выйдет в ближайшее время — в течение года (и это только исходя из предположения, что он будет выпущен вместе с серией RTX 50, так что не цитируйте меня по этому поводу). Предположим также, что он будет выдающимся. Будет ли DLSS 4 обратно совместим с серией RTX 40? Это натяжка, на которую я не готов делать ставку. Если отбросить все соображения по поводу аппаратного обеспечения, мне трудно поверить, что Nvidia может упустить возможность использовать весь потенциал DLSS 4, как только он выйдет на рынок.
У AMD другой подход к Nvidia. Его технология масштабирования доступна на графических процессорах всех производителей, хотя внедрение FSR 3.0 происходит очень медленно. Между тем, DLSS 3 медленно, но верно проникает во все больше и больше игр. DLSS 4 может сбросить счетчик и начать с чистого листа, появляясь в избранных заголовках, прежде чем получить более широкое распространение.
Так или иначе, чтобы произвести впечатление на массы, Nvidia, возможно, понадобится смелый шаг на этом этапе — повышение уровня производительности в играх на 15% не поможет, когда есть другие доступные варианты. У него должна быть довольно жесткая конкуренция со стороны AMD RDNA 4 в среднем диапазоне, поэтому такие карты, как RTX 5070, могли бы использовать дополнительную помощь, чтобы оправдать свои цены.
Если DLSS 4 появится вовремя, я не удивлюсь, если он станет эксклюзивом для RTX 50, и мы будем усердно работать за кулисами, чтобы превратить «ну» графические процессоры во что-то весьма блестящее. Нам придется подождать и посмотреть.