Содержание
Microsoft показала, что технология Shader Execution Reordering (SER) в DirectX 12 может резко ускорить рейтрейсинг: в демо прирост достиг 90% на Intel Arc B-Series и около 80% на видеокартах NVIDIA архитектуры Blackwell.
Речь про обновление Agility SDK v1.619, которое добавило DirectX Shader Model 6.9 и ряд улучшений для DirectX 12. В центре внимания — SER. Эта штука помогает эффективнее исполнять шейдеры при трассировке лучей. Если проще: GPU получает возможность «перетасовать» лучи так, чтобы они лучше укладывались в параллельную работу блоков. Меньше простаивания, выше фреймрейт.
SER в демо: 90% на Arc B-Series и 40% на RTX 4090
В своей демонстрации Microsoft прогнала SER на нескольких GPU. Самый громкий результат — до 90% прироста FPS на Intel Arc B-Series. Сюда входят дискретные видеокарты Intel поколения «Battlemage», а также интегрированная графика на базе Xe3 в будущих мобильных платформах «Panther Lake».
Отдельно Microsoft проверила SER на NVIDIA GeForce RTX 4090. Там прирост составил 40% относительно «дефолтной» сортировки лучей в прежней модели исполнения. Это заметно, но уже без двукратных скачков.
Независимый прогон демо: RTX 5080 Blackwell прибавила около 80%
Помимо цифр Microsoft, в сети появились замеры демо на видеокартах Blackwell. По результатам, которыми поделился Освальдо Пинали Дёдерляйн, GeForce RTX 5080 в этой же демонстрации получила около 80% прироста с включённым SER. Ссылка на замер: Osvaldo Pinali Doederlein on X.
Здесь полезно держать в голове контекст. Microsoft собрала демо D3D12RaytracingHelloShaderExecutionReordering как минимальную, «чистую» иллюстрацию технологии. Это не игра и не бенчмарк уровня Cyberpunk 2077. Но демо можно запустить и посмотреть разницу на своём железе.
Почему прирост такой большой именно в рейтрейсинге
Трассировка лучей часто упирается не в «сырой TFLOPS», а в то, как хорошо GPU загружен работой. Лучи расходятся по сцене неравномерно. Одни попадают в простые участки, другие — в сложные. Из-за этого часть вычислительных блоков простаивает, пока другие добивают тяжёлые ветки.
SER как раз пытается исправить этот перекос. Он динамически группирует похожие задачи и выравнивает загрузку. В демо это даёт взрывной эффект, особенно на архитектурах, где такая переупаковка лучей раньше работала менее эффективно.
А что с играми: прирост будет, но меньше
Microsoft подчёркивает ограничение: это технологическая демонстрация, а не тест в реальных играх. В играх SER тоже должен ускорять рейтрейсинг, но итоговый выигрыш может оказаться заметно ниже. Движки сложные, RT-пайплайны разные, а узких мест хватает и без сортировки лучей.
И ещё момент. Чтобы SER появился в играх, разработчикам нужно внедрить обновления через Agility SDK v1.619 и прогнать полноценную отладку. На это обычно уходят месяцы, а не недели. Так что быстрых патчей «завтра во всех ААА» ждать не стоит.
Подробнее про SER и обновления DirectX 12 Microsoft рассказала в своём блоге: Microsoft DirectX: Shader Execution Reordering.
Источники: Microsoft, Osvaldo Pinali Doederlein