- 상위항목: AMD
목차
1 개요
AMD가 개발한 TeraScale 마이크로아키텍처의 후속 GPU 마이크로아키텍처이다.
참고로 AMD는 공식적으로 "x 세대" 혹은 "x.0"으로 표기하고 있다. 1.x와 같은 표기는 비공식적인 표기임을 유의할 것.
2 특징
width=100% TeraScale과 2세대 GCN 비교
TeraScale 기존의 VLIW(Very long instruction word) SIMD를 RISC SIMD로 교체했다.
VLIWA SIMD에서는 1개의 SIMD가 다수의 작업을 연달아서 수행하는 방식이었다면, 1세대 GCN에서는 4개의 SIMD가 작업을 분담해서 수행한다. 따라서 레지스터 포트의 충돌도 없어졌으며, 컴파일러 스케줄링과 최적화를 표준화하고 어셈블리 간소화 툴체인 개발 지원 간소화, 예측 성능 향상 등의 변화가 이뤄졌다.
그 구조가 NVIDIA의 SM(Streaming Multiprocessor)나 불도저와 비슷하다고 한다. 출처
2.1 1세대 GCN
- RICS 사용으로 더 많은 트랜지스터가 필요해졌지만 GPGPU 컴퓨트 성능도 크게 증가했다.
- CPU, GPU가 동일한 64비트 주소를 지원한다.
- DirectX나 OpenGL로 가상 메모리가 가능한 PRT(Partially Resident Textures) 지원.
- AMD PowerTune[1] 지원.
- 맨틀 API 지원.
- ZeroCore Power 지원. [2]
- PCI-E 3.0 지원.[3]
1CU(Compute Unit)에는 64SP, 4TMUs, 1ROP가 들어있다. 그리고 CU는 ACE(Asynchronous Compute Engines)에서 제어한다.
2.1.1 통합 가상 메모리
Unified Virtual Memory.
전통적인 GPU에서는 CPU와 GPU가 PCI-E 버스에 연결되고 각자의 메모리를 가져[4] 동작했지만 GCN부터는 시스템 메모리 버스, 즉 DRAM을 공유해 동작하는 것이 가능해졌다. 이는 HSA중 hUMA와 거의 동일하다.
2.1.2 HSA
HSA 지원을 위한 특정 블록을 추가함으로써 하드웨어적으로 HSA를 지원하게 되었다.
자세한 내용은 항목 참조.
2.1.3 사용 제품 일람
- Oland
- Cape Verde
- Pitcairn
- Tahiti
2.2 2세대 GCN
- ACE(비동기 연산) 강화
- TrueAudio 지원
- FreeSync 지원
- DirectX 12.0 FL 12_0 지원
2.2.1 사용 제품 일람
2.3 3세대 GCN
- ISA 명령어 세트 개선.
- 테셀레이션/지오메트리 프로세싱 유닛 개선.
- 무손실 델타 컬러 메모리 압축 기술 도입. [5]
- UVD 6.0[6], VCE 3.1, 하이퀄리티 스케일러 추가.
2.3.1 사용 제품 일람
- GPU
- APU
2.4 Polaris(4세대 GCN)
4세대 GCN 아키텍처, 통칭 폴라리스로 라데온 Rx 400 시리즈와 ZEN 기반 APU에 탑재될 예정이다. 개발 코드네임인 Polaris가 먼저 알려지면서 개발 코드네임으로 많이 불려졌으며 결국 정식 명칭역시 Polaris로 확정되었다.[7]
기존 아키텍처 대비 최대 15%의 CU 성능 향상이 존재하며, 개선점들은 아래와 같다.
- 지오메트리 프로세싱 향상
- 가변 해상도 렌더링을 위한 AMD LiquidVR API
- DCC[8] & 업데이트된 메모리 컨트롤러
- 셰이더 명령어 프리페치, 강화된 버퍼링
- 스케줄링을 통한 실시간, 우선순위 비동기 연산
- dGPU에서 네이티브 FP16/Int16 지원
- AMD TrueAudio Next
- 10-bit / 12-bit HDR 지원
- 비디오 인코딩/디코딩 가속 지원 확대[9]
- 스트리밍 기능 향상[10]
- AVFS 추가[11]
- Multi-bit-flip-flop(MBFF) 개선[12]
2.4.1 Primitive Discard Accelerator
샘플 포인트와 공간을 차지하지 않는 Cull 삼각형을 지오메트리 엔진에서 알아서 버리는 기능으로, 멀티 샘플링 안티에일리어싱과 같은 경우 그 효율이 극대화돼 2배 ~ 3.5배의 성능 향상을 가져올 수 있다.
2.4.2 사용 제품 일람
- GPU
-
Greenland - Polaris 10 (Ellsmere)
- Polaris 11 (Baffin)
-
3 관련 항목
- ↑ 동적 주파수 스케일링. 제한 TDP된 내에서 발열, 소음, 전력 소비를 최소화하면서 순간 성능을 충족하기 위한 기능이다.
- ↑ 아이들 시 코어와 팬까지 정지시켜 전력 소비량을 낮춰준다. 다만 단일 카드에선 디스플레이 절전 모드에서 활성화된다. CF시에는 절전 모드가 아니라도 2/3/4번 카드의 전원이 완전히 나간다.
파일:Agti2xl.jpg - ↑ 당연하지만 CPU가 3.0을 지원해야 한다. 샌디브릿지-E부터 지원.
- ↑ CPU는 DRAM을, GPU는 GDDR로, 서로 다른 자원을 가지고 동작된다.
- ↑ 256비트로 축소된 메모리 대역폭을 커버하기 위해 도입되었다.
- ↑ Fiji 기반 GPU와 카리조 APU만 해당된다. Tonga 기반 GPU는 UVD 5.x 스펙까지 지원한다.
- ↑ 다만, 그 정체성은 GCN 4세대임을 명시하고 있다.
- ↑ Delta Color Compression, 델타 컬러 압축. 2:1, 4:1, 8:1 압축을 지원하며 1세대 GCN 대비 약 40%의 압축율을 보여준다.
- ↑ HEVC 1080p240fps, 11440p@120fps, 4K@60fps / VP9 4K / MJPEG 4K@30fps 가속 지원 추가.
- ↑ 2-pass 인코딩 기술 지원
- ↑ 카리조와 브리스톨 리지에 처음 들어갔던 유닛이다.
- ↑ 기존 설계 TDP의 15%를 차지하던 유닛으로, 폴라리스에서의 개선을 통해 4-5%의 TDP를 감소시켰다.
- ↑ C 시리즈부터 GCN 계열 GPU를 쓴다.