참조: https://lolmovies.tistory.com/12

- GPU 바운드가 발생하는 사진
렌더링에서 CPU와 GPU 모두는 프레임을 렌더링하기 위해 각자 맡은 작업을 완료해야한다. 이러한 작업 중 하나라도 완료에 오랜시간이 걸리게 되면, 프레임 렌더링에 지연이 발생할 수 있다.
원인으로 첫번째로, 비효율적인 파이프라인에 의해 발생한다
렌더링 파이프라인 중 하나 이상의 단계가 완료되는데 오랜 시간이 걸리면서 원활한 데이터 흐름을 방해하는데 이것을 병목 현상이라고 한다.
두번째로, 너무 많은 데이터를 넣으려고 할 때 발생한다
CPU가 렌더링하는데 오래 걸리는 문제가 발생하면 CPU바운드(CPU bound, CPU에 묶여있는 상태)
GPU가 렌더링하는데 오래걸리는 문제가 발생하면 GPU 바운드(GPU bound, GPU가 묶여있는 상태)
CPU 바운드와 GPU 바운드는 컴퓨터 시스템에서 발생하는 성능 병목 현상을 나타내는 용어.
1. CPU 바운드 (CPU Bound):
- 원인: CPU 바운드는 주로 CPU가 다른 작업에 비해 처리 능력이 제한적일 때 발생합니다. 이는 CPU가 계산 집약적인 작업을 수행하거나, 스레드를 많이 생성하거나, 메모리와의 데이터 교환 작업이 빈번하게 발생할 때 발생할 수 있습니다.
- 예시: 복잡한 계산을 필요로 하는 알고리즘, 실시간 데이터 처리, 게임 엔진의 물리 시뮬레이션 등에서 CPU 바운드가 발생할 수 있습니다.
2. GPU 바운드 (GPU Bound):
- 원인: GPU 바운드는 주로 GPU가 다른 구성 요소에 비해 처리 능력이 제한적일 때 발생합니다. 이는 GPU가 그래픽 처리나 병렬 연산을 수행하는 데 한계가 있는 경우 발생할 수 있습니다.
- 예시: 고해상도 그래픽 처리, 3D 렌더링, 딥 러닝 모델 학습 및 추론, 비디오 인코딩 및 디코딩 등에서 GPU 바운드가 발생할 수 있습니다.
또한, 바운드 상황은 시스템의 다른 구성 요소와의 상호 작용에 따라 변할 수 있습니다. 예를 들어, 메모리 대역폭이 부족한 경우 CPU 또는 GPU가 메모리 바운드가 될 수 있습니다. 따라서 바운드 상황을 해결하려면 해당 구성 요소의 성능을 개선하거나 작업을 최적화하여 병목 현상을 완화해야 합니다.
CPU bound의 원인
GPU에 명령을 보낼 때, 가장 시간이 오래 걸리는 작업이 SetPass Call이다.
GPU에 명령을 보내는 과정때문에 게임이 CPU바운드인 경우, SetPass Call의 수를 줄이는 것이 성능 향상에 가장 좋은 방법이다.
- 렌더링할 오브젝트 수를 줄이면 Batch 및 SetPass Call 모두 감소
- 오브젝트를 렌더링하는 횟수를 줄이면 일반적으로 SetPass Call 감소
- 렌더링할 오브젝트 데이터를 더 적은 수의 Batch로 합치면 Batch 감소
해결방법 - CPU bound의 경우
1. 렌더링되는 오브젝트 수를 줄이기
- 씬에 보이는 오브젝트 수를 줄인다
- 카메라의 Far Flip Plane을 이용해 카메라가 화면을 그리는 거리를 줄인다.
2. 오브젝트 렌더링 횟수 줄이기
- 동적 라이팅말고 Baked라이팅을 사용한다.
- 실시간 그림자를 사용하는 경우, Quality Settings에서 그림자를 세팅한다.
- Refelction Probes는 사실적인 반사효과를 주지만, 배치 측면에서 매우 비싼 기능이므로 사용을 최소화한다.
3. 더 적은 배치로 오브젝트 합치기
- 정적 배칭을 사용하되, 메모리 사용량이 증가할 수 있어 이 비용을 염두한다.
- 동적 배치는 CPU 사용량에 영향을 줄 수 있어 신중히 적용한다.
- 동일한 재질과 텍스쳐를 사용하는 메쉬는 CombineMesh를 고려한다.
4. 컬링, 정렬 그리고 배칭
- 배칭은 GPU에 명령 전달 속도를 크게 향상시키지만, 때론 오버헤드를 발생시키기도 한다.
해결방법 - GPU bound의 경우
1. Fill Rate
- GPU가 매 초마다 화면에 렌더링할 수 있는 픽셀 수를 나타낸다.
FIll Rate에 의해 게임이 GPU바운드인지 확인하는 법
1) 게임을 프로파일링해 GPU시간 확인
2) Player Settings에서 화면 해상도 Display Resolution을 낮춘다.
3) 게임을 다시 프로파일링
4) 성능 향상했다면 Fill Rate가 문제일 가능성 높다.
2. Overdraw
- 동일한 픽셀이 여러번 그려지는 경우
- Geometry 큐는 오버드로우를 최소화하기 위해 앞에서 뒤로 정렬
- Transparent 큐는 오버드로우를 최소화하기 위해 뒤에서 앞으로 정렬
3. 메모리 대역폭
- GPU에서 메모리에 읽고 쓰는 속도를 나타낸다.
메모리 대역폭이 문제인지 확인하는 법
1) 게임 프로파일링 GPU시간 체크
2) Quality Settings에서 현재 플랫폼의 Texture Quality와 Quality Target을 낮춘다.
3) 다시 프로파일링후 GPU시간 체크
4) 성능 향상했다면 메모리 대역폭이 문제일 가능성 높다.
4. 정점 프로세싱
- GPU에서 메쉬의 각 정점을 렌더링하기 위해 처리해야하는 작업을 나타낸다.
게임이 GPU바운드인데 필레이트와 메모리 대역폭 문제가 아닌경우 정점 프로세싱 문제일 가능성 높다
1 불필요한 메쉬를 줄인다.
2 노멀 매핑을 사용한다. (GPU 오버헤드가 다소 발생하나 대부분 성능 이득)
3 메쉬가 노멀 매핑을 사용안하는 경우, 메쉬 임포트 설정에서 정점 탄젠트 사용 비활성해준다. GPU에 전달되는 각 정점 데이터양 줄어든다.
4 LOD로 알려진 Level Of Detail은 카메라에서 멀리 떨어진 메쉬 복잡도를 낮춰 최적화하는 기술
LOD는 비주얼 퀄리티에 영향을 주지 않고, GPU에서 렌더링하는 정점 수 낮춘다.
정점 쉐이더의 복잡도를 낮추는 것이 정점 프로세싱 문제에 도움이 될 수 있다.
'컴퓨터 지식' 카테고리의 다른 글
| 마이크로 서비스 (0) | 2024.06.04 |
|---|---|
| lazy initialize(지연 초기화, 게으른 초기화) (0) | 2024.05.01 |
| 메모리 단편화 (0) | 2023.10.01 |
| Caching(캐싱) (0) | 2023.10.01 |
| SIMD(Single Instruction Multi Data) (0) | 2023.09.28 |