마이크로소프트는 새로운 빔 처리 순서를 통해 DirectX 12에서 레이 트레이싱 속도를 90 %까지 높입니다

마이크로소프트는 새로운 빔 처리 순서를 통해 DirectX 12에서 레이 트레이싱 속도를 90 %까지 높입니다

8 software

Microsoft는 DirectX의 새로운 기능인 Shader Execution Reordering(SER)을 발표했습니다.

최근 Game Developers Conference 2025에서 회사는 DXR 1.2 버전 출시를 발표했으며, 이 버전에서는 처음으로 SER 메커니즘이 도입되었습니다. 이는 현대 게임에서 사실적인 조명, 반사 및 그림자를 담당하는 레이 트레이싱 작업의 실행을 최적화할 수 있는 기술입니다.

변경 사항
현재 레이 트레이싱은 “혼돈스럽게” 수행됩니다 – 각 레이가 독립적으로 처리됩니다. 개발자는 셰이더에서 계산 유사성을 지정하면 GPU가 스스로 실행 순서를 정렬합니다.
일반 모드에서는 GPU가 다양한 복잡도의 작업에 직면합니다: 일부 레이는 객체를 빠르게 찾고, 다른 레이는 깊게 침투하여 많은 시간이 소요됩니다. 이는 한 스트림에서 “무거운” 연산과 “가벼운” 연산이 섞여 병렬 처리 효율을 떨어뜨립니다.

SER을 사용하면 개발자는 셰이더 코드(HLSL)에서 스레드 실행 순서를 지정할 수 있습니다. GPU는 이후 유사한 작업을 연속적으로 수행하도록 재구성하여 전체 성능을 향상시킵니다.

기술 세부 사항
* 새로운 제어 – 이전에는 드라이버만 부하를 분산했지만, 이제 개발자가 이 과정을 영향을 줄 수 있습니다.
* HLSL 프리미티브 – 언어에 스레드 처리 순서를 요청하는 새로운 구문이 추가되었습니다.
* Shader Model 6.9 표준 – SER 지원은 필수이며, 모든 최신 드라이버는 해당 코드를 올바르게 처리해야 합니다. 효율성은 특정 하드웨어에 따라 달라집니다.

실제 결과
Microsoft는 게임 *Alan Wake 2*에서 SER의 효과를 보여주었으며, 이는 Opacity Micromaps(OMM) 투명도 마이크로맵 기술과 함께 사용되었습니다. 그 결과:

* 레이 트레이싱 성능 증가 ≈ 30 %
→ 플레이어에게는 더 높은 프레임 속도
→ 개발자에게는 추가 그래픽 효과를 구현할 수 있는 기회

Nvidia GeForce RTX 4090에서 테스트한 경우 약 40 % 향상되었으며, 일부 Intel Arc B 시리즈 모델에서는 최대 90 %까지 증가했습니다.

작동 방식
전통적인 레이 트레이싱 알고리즘은 두 단계로 구성되었습니다:

1. 실제 레이 트레이싱 수행
2. 셰이더가 충돌 정보를 수집하고 이후 처리

SER을 사용하면 개발자는 먼저 전체 장면에 대해 첫 번째 단계를 실행하고, 유사한 충돌 결과를 수집하여 그룹화한 뒤, 패키지로 나누어 후속 처리를 시작합니다. 이는 시스템 리소스 소비를 줄이고 GPU 효율성을 높입니다.

결론:
Microsoft는 DirectX를 확장하여 DXR 1.2에 레이 트레이싱 작업 실행 순서를 제어할 수 있는 기능을 추가했습니다. 이는 성능 최적화의 새로운 길을 열고, 현대 그래픽 효과를 개발자와 플레이어 모두에게 더 접근 가능하게 만듭니다.

댓글 (0)

의견을 남겨 주세요. 예의를 지키고 주제에서 벗어나지 말아 주세요.

아직 댓글이 없습니다. 댓글을 남기고 의견을 공유해 주세요!

댓글을 남기려면 로그인해 주세요.

댓글을 남기려면 로그인