May 16, 2025

Deep Learning Super Sampling (DLSS) и его эволюция: от AI Upscaling до ускорения рендеринга в реальном времени

1. Введение

В постоянно развивающемся мире компьютерной графики и рендеринга в реальном времени технология Deep Learning Super Sampling (DLSS) от NVIDIA стала по-настоящему революционной. Впервые представленная в 2018 году, DLSS использует глубокое обучение и продвинутую реконструкцию изображений для масштабирования кадров низкого разрешения, улучшая визуальное качество и снижая нагрузку на GPU. Благодаря способности генерировать кадры высокого разрешения из низкого, DLSS обеспечивает плавный игровой процесс без потери качества. Эта технология особенно важна для игр, виртуальной реальности и рейтрейсинга в реальном времени, но не предназначена для задач общего AI-вычисления.

2. Эволюция и поколения DLSS

DLSS прошёл через несколько ключевых этапов развития:

  • DLSS 1.0 (2018): Представлен вместе с серией RTX 20 (архитектура Turing). Использовал универсальную нейросеть, обученную на конкретных играх. Качество изображения было непостоянным из-за необходимости обучения под каждую игру.
  • DLSS 2.0 (2020): Существенное улучшение. Отказ от обучения на каждую игру в пользу универсальной временной модели глубокого обучения. Использует векторы движения и историю кадров для получения стабильного изображения.
  • DLSS 3.0 (2022): Представлен с серией RTX 40 (Ada Lovelace). Внедрена технология Frame Generation на базе Optical Flow Accelerators, позволяющая интерполировать новые кадры и удваивать частоту кадров.
  • DLSS 4.0 (2025): Вышел с серией RTX 50 (предположительно архитектура Blackwell). Улучшена временная согласованность, снижена задержка, добавлены AI-денойзеры, расширена совместимость с рендеринговыми пайплайнами. Улучшена мультикадровая интерференция, уменьшено мерцание и "призрачность", повышена отзывчивость генерации кадров.

3. DLSS и суперразрешение в компьютерном зрении

3.1 Концептуальная связь

DLSS использует похожие принципы с методами super-resolution в компьютерном зрении (CV). Оба подхода восстанавливают изображения высокого разрешения из низкого с помощью нейросетей. Работы вроде SRCNN [Dong et al., 2014] и EDSR [Lim et al., 2017] стали основой для нейронного апскейлинга.

Однако DLSS адаптирован под реалтайм:

  • В CV акцент на фотореалистичность и метрики качества (PSNR, SSIM).
  • В DLSS упор на производительность, снижение артефактов и интеграцию в игровые движки.

3.2 Технические различия

Уникальность DLSS — в гибридном подходе: сочетание CV, оценки движения и графических пайплайнов.

4. Производительность и визуальное качество: примеры с RTX 50XX

DLSS тесно интегрирован в линейку GPU NVIDIA GeForce RTX, оптимизированную под рендеринг. GPU для AI-вычислений (например, A100, H100) не поддерживают DLSS, так как предназначены для параллельных вычислений, а не графики в реальном времени.

На примере RTX 5090 в игре Cyberpunk 2077: Phantom Liberty при нативном 4K Ultra с полным path tracing:

  • Без DLSS: ~38 FPS
  • DLSS 3.5 Performance Mode: ~85 FPS
  • DLSS 4.0 Quality Mode: ~75 FPS — меньше "призраков", стабильнее изображение

Для сравнения, RTX 4080 с DLSS 3.5 выдает ~58 FPS в том же тесте. DLSS 4.0 на RTX 5090 использует новое оборудование для Optical Flow и лучше интегрирован с AI-денойзерами.

DLSS 4.0 также снижает задержку благодаря технологии Reflex и улучшенному планированию кадров. Это особенно важно для киберспортивных игр вроде Valorant и Fortnite, где достигается системная задержка <10 мс.

5. Архитектурные особенности

DLSS реализован с помощью комбинации программного обеспечения и специализированного железа. Используются Tensor Cores (начиная с архитектуры Turing) для матричных операций в нейросети. DLSS 2/3/4 применяет временной энкодер-декодер с входами:

  • Текущий кадр низкого разрешения
  • Предыдущий кадр высокого разрешения
  • Векторы движения и буферы глубины
  • Смещения, сгенерированные движком

DLSS 3 и 4 дополнительно используют Optical Flow Accelerators (OFA) — аппаратные блоки для оценки движения между кадрами и генерации промежуточных кадров без полного рендеринга.

DLSS 4.0 улучшает этот процесс с помощью механизмов внимания и выравнивания. Эти технологии доступны только на RTX GPU и отсутствуют на датацентровых GPU (A100, H100).

6. Применение за пределами игр

Хотя DLSS создан для игр, его базовые технологии имеют более широкое применение:

  • AR/VR: Апскейлинг в реальном времени на устройствах с ограниченными ресурсами
  • Удалённый рендеринг / облачный гейминг: Передача кадров низкого разрешения с восстановлением на клиенте
  • Профессиональная визуализация: Ускорение рендера в приложениях типа Omniverse, Blender

7. Будущее

С развитием AI-рендеринга и сближением CV и графики, подходы вроде DLSS могут стать аппаратно-независимыми. Гибридная модель — сочетание нейронного рендеринга с рейтрейсингом или растеризацией — станет основой будущих графических систем.


Источники:

  • Dong, C., et al. (2014). Learning a Deep Convolutional Network for Image Super-Resolution. ECCV 2014
  • Lim, B., et al. (2017). Enhanced Deep Residual Networks for Single Image Super-Resolution. CVPR Workshops
  • NVIDIA (2025). DLSS 4.0 Whitepaper. https://developer.nvidia.com/dlss
  • TechPowerUp (2025). RTX 5090 Benchmarks. https://www.techpowerup.com
  • Digital Foundry (2025). DLSS 4 Analysis – Cyberpunk 2077 in Path Tracing

P.S. Этот материал предоставлен BuySellRam.com, признанным экспертом в области AI-оборудования. Если вы обновили GPU до новой модели RTX, вы можете Sell Graphics Card через их платформу. Также доступны услуги Sell CPU, Sell SSD, Sell Test Equipment, и продажа других IT-компонентов.