퀄컴 Adreno GPU

(Adreno에서 넘어옴)

1 개요

퀄컴에서 설계하는 GPU 브랜드. 퀄컴의 모바일 AP 브랜드인 퀄컴 스냅드래곤 시리즈 전용으로 사용된다.

2 상세

전신은 ATI의 모바일 그래픽 사업부다. 퀄컴이 Imageon으로 대표되는 해당 사업부를 인수하여 개발한 것이다. 따라서, 명칭 역시 Radeon스펠링 배열을 바꿔서 Adreno로 정했다고 한다.

전통적으로 버텍스 성능은 꽤 괜찮은 편에 비해 픽셀 처리능력은 떨어진다. 때문에 버텍스 위주의 벤치마크가 있다면 역시 점수는 잘 나오겠지만 모바일 게임들을 보면 폴리곤은 적당히 적게 사용하고 그 위에 텍스처를 좀 발라주는 형식인데 이런 게임들은 당연히 픽셀 필레이트가 버텍스보다 비교적 딸리는 Adreno GPU에 별로 맞지 않는 형태. 당연히 버텍스에 중점을 두는 벤치마크는 ARM Mali 그래픽[1]보다 잘 나오겠지만 실 성능이라 볼 수있는 게임 성능이 딸린다는 것이다.

이는 플레이스테이션 3CELL-Broadband Engine와 거의 판박이인 특징으로, 모바일 기기의 고성능화에 따라 이러한 하드웨어 사양을 활용할 수 있는 애플리케이션들이 차차 나오겠지만 지금으로써는 비교적 효용성이 낮은 하드웨어 사양을 갖췄는데 거의 비슷한 특성을 지닌 플레이스테이션 3의 CELL-Broadband Engine도 언젠가는 플레이스테이션 3용 부동소숫점 프로그램 나올거다라는 말이 차기작이 나올 때까지 반복되었던 것을 떠올리면 희망이 보이지 않는다.

다만, 2012년 말부터 FP32 연산능력이나 텍스처 필레이트 등이 ARM Mali 그래픽보다 더 높은 모습을 보여주고 있다. 최근 AP로 예를 들면, 엑시노스 7 Octa (5433)의 ARM Mali-T760 헥사코어와 스냅드래곤 805 APQ8084의 Adreno 420의 GFX벤치 맨하탄 오프스크린 수치는 각각 17 Fps, 19 Fps로 측정되고, 엑시노스 7420의 ARM Mali-T760 옥타코어와 스냅드래곤 810 MSM8994의 Adreno 430의 경우, 거의 동급의 성능을 보여준다. 또한 GFX벤치 맨하탄 3.1에서도 ARM Mali-T760 옥타코어보다 확실하게 우위를 보여준다. 하지만, 스냅드래곤 810 MSM8994의 경우 제조사들이 알아서 GPU 클럭을 500 MHz 대로 낮추고 있기에 실질적으로는 차이가 나보인다고 한다.

GPU 벤치마크 중 로우레벨쪽 GPU 내부 연산 ALU 모듈의 결과만을 보면, 항상 타 업체보다 높은 성능을 보여주는데, 실질적인 하이레벨 결과는 큰 차이가 없다는 점에서 내부적으로 많은 병목 현상이 있는것이 아니냐는 추측이 있다.어디서 많이 같으면 착각이다

ARM Mali 그래픽과 비교하면 최신 API 지원을 잘 안해주는 편이다. ARM Mali가 최신 API 지원이 가장 빠르고, 최신 API에서 낮은 GPU 성능을 후속 드라이버 업데이트로 올려주는 타입이라면, 아드레노는 그냥 API 지원을 안해준다(...)

3 제품 목록

3.1 1XX

  • Adreno 130
퀄컴 스냅드래곤 시리즈로 모바일 AP 사업이 재편되기 전의 퀄컴의 모바일 AP인 퀄컴 MSM 시리즈에 탑재되었다.

3.2 2XX

퀄컴 스냅드래곤의 초창기 시절부터 S4까지 함께한 시리즈이다.

전체적인 Adreno 2xx 시리즈의 특징을 살펴보자면 픽셀 성능이 낮은 대신에 통합셰이더 아키텍쳐의 특성상 높은 부동소숫점 연산성능이 버텍스 성능의 향상으로 이어져서 그 당시에는 좋은 소리를 못 들었으나, GL 벤치마크가 GFX 벤치마크로 업데이트 되고 버젼이 올라갈수록 점점 버텍스, 높은 연산성능의 반영비중이 상승하여 타사의 GPU 대비 상대적인 위치가 많이 상승하였다.

  • Adreno 200
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
8133~245 Mhz0.133~245 GPix/s? GTexel/s2.1~3.92 GFLOPS

퀄컴 스냅드래곤 S1 QSD8x50에 최초로 탑재되었다. 이후, 퀄컴 스냅드래곤 S1 라인업에 속한 모바일 AP에 주력으로 탑재되었다.

  • Adreno 203

퀄컴 스냅드래곤 S4 Play MSM8x25에 최초로 탑재되었다.

  • Adreno 205
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
16266 Mhz0.266 GPix/s? GTexel/s8.5 GFLOPS

퀄컴 스냅드래곤 S2 라인업에 최초로 탑재되었다.

사실 이시기까지는 GPU 성능 비교 자체가 생소한 개념이고 그당시 사용하던 벤치마크인 쿼드런트에 안투투도 CPU나 다른 요소의 비중이 높아서 별 다른 평가가 존재하지 않는다(...)

  • Adreno 220
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
32266 Mhz0.532 GPix/sGTexel/s17 GFLOPS

퀄컴 스냅드래곤 S3 라인업에 최초로 탑재되었다. 위에 표만 봐도 그당시 타사 AP의 GPU와 비교해봐도 비정상적으로 높은 FP성능, 낮은 픽셀성능이 눈에 띈다.

네이밍에서 두자릿수가 바뀐만큼 전작 205 대비 성능이 2배 상승했지만 GL 벤치마크 2.1, 2.5 모두 엑시노스 4210의 Mali-400과 Apple A5의 SGX543 MP2보다 낮은 성능을 보여주었다. OMAP 4시리즈의 SGX540보다는 좋지만... 그 친구는 CPU 성능은 넘사였으요...

  • Adreno 225
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
32200~400 Mhz0.4~0.8 GPix/sGTexel/s12.8~25.6 GFLOPS

퀄컴 스냅드래곤 S4 Plus APQ8060A & MSM8x60A & MSM8960에 최초로 탑재되었다.

GL 벤치마크 2.1상에서는 갤럭시 S2ARM Mali-400 MP4 266Mhz와 비슷한 성능을 보여준다. 위에서 말했듯이 그당시의 사용환경을 감안하면 2.1이 실제로 체감되 성능이다. 2.5 결과를 보면 동시기에 나와서 경쟁하던 엑시노스 4412의 Mali-400 MP4 440Mhz[2]보다 약간 낮은 성능을 보여준다. GFX 벤치마크 2.7의 결과[3] 를 봐도 결국 엑시노스 4412의 Mali-400을 잡지 못한걸로 보인다. 물론 Mali-400도 아드레노 320 등의 쟁쟁한 GPU들이 나오면서 한계가 보이기 시작했다.[4]

3.3 3XX

  • Adreno 302
  • Adreno 304
  • Adreno 305
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
24400~450 Mhz0.8~0.9 GPix/sGTexel/s19.2~21.6 GFLOPS

퀄컴 스냅드래곤 S4 Plus MSM8x27에 최초로 탑재되었다. 이후, 퀄컴 스냅드래곤 400 라인업에 속한 모바일 AP에 주력으로 탑재되었다.

보급형 AP에 들어가는 GPU라서 아드레노 320보다는 부족한 모습을 보여준다. 페이퍼스펙 상으로는 상술한 아드레노 225보다 딸리지만 실제로 GL 벤치마크 2.5나 GFX 벤치 2.7 결과를 보면 아드레노 225보다 더 높게 나온다. 아드레노 225가 각각 14.5fps, 4.5fps가 나온다면, 305는 무려 17fps, 6.5fps 까지 올라갔다. 이런류의 효율 상승은 아드레노 510에서도 볼수 있다. 이쪽은 낮은 FP성능, 필레이트로 높은 벤치마크 결과를 달성한 케이스. 아마 Adreno 시리즈의 앞자리가 2→3, 4→5로 변하면서 아키텍쳐상으로 효율이 상승한게 아니냐는 의견이 있다.

  • Adreno 306
  • Adreno 320
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
64→96400→400~450 Mhz1.6 or 3.2[5]→2.4~2.7 or 3.2~3.6[6] GPix/sGTexel/s57.6→86.4~97.2 GFLOPS

퀄컴 스냅드래곤 S4 Pro 라인업에 최초로 탑재되었고, 스냅드래곤 600에서는 ALU 수가 1.5배 올라간 버젼이 탑재된것으로 보인다. 표에서 화살표 좌측이 舊 아드레노 320이고 화살표 우측이 新 아드레노 320이다.

2012년 말부터 사용된 스냅드래곤 S4 Pro으로 인해 스냅드래곤이 쓰레기라는 오명을 벗기 시작했고 그 평가에 걸맞게 GPU 성능도 수준급이다.[7] GL벤치마크 2.5의 결과를 보면 2012년 초에 상용화된 엑시노스 4412의 Mali-400을 가볍게 뛰어넘은 모습을 보여주었다.

이후 2013년 초에 동일한 시기에 경쟁한 스냅드래곤 600의 Adreno 320은 엑시노스 5410의 SGX544 MP3보다 높은 성능을 보여주었고 이 시기부터 동일한 시기[8]에 상용화된 엑시노스퀄컴 스냅드래곤 대비 높거나[9] 비슷한[10] CPU 성능에 소폭 낮은[11] GPU 성능을 가지게 되었다.

  • Adreno 330
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
128450~578 Mhz3.6~4.624 GPix/sGTexel/s129.6~166.5 GFLOPS

현재까지도 무난하게 사용이 가능한 명품 AP인 스냅드래곤 800/801 시리즈에 사용된 GPU이다. 스냅드래곤 800에는 삼성과 Others사 제품의 GPU 클럭을 각각 550MHz, 450MHz로 세팅해서 차별을 주었고, 스냅드래곤 801에서는 578MHz로 작동된다.

경쟁사인 엑시노스 5420의 Mali-T628 MP6과 비교하면 Mali-T628은 GFX벤치 3.0 기준 10.6fps, GFX벤치 2.7 기준 25fps의 성능을 보여주는데에 비해서 아드레노 320은 450mhz에서 GFX벤치 2.7이 23fps, 578mhz에서는 각각 12fps, 27fps의 성능을 보여준다.

엑시노스가 아닌 다른 AP들과 GPU 성능을 비교해 보면, 동일한 시기에 상용화가 되고 GFX벤치에서 각각 13fps, 28fps가 나오는 Apple A7의 PowerVR G6430과 비교해도 전혀 부족한 수준이 아니고, Apple A6X의 GPU 성능은 가볍게 누르고 심지어는 2015년~16년에 나오는 보급형 AP들보다 높은 GPU 성능을 가지고 있다.

3.4 4XX

  • Adreno 405
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
48550 Mhz? GPix/s? GTexel/s59.4 GFLOPS

퀄컴 스냅드래곤의 400, 600번대 라인업에서 Cortex-A53 옥타코어를 탑재한 대부분의 AP에 들어가는 GPU이다.
보급형 AP에 들어가는 GPU 답게 다른 중국쪽 업체의 AP에 들어가는 GPU 처럼 성능은 별 볼일 없다. 비슷한 급을 찾자면 예전에 스냅드래곤 600에 사용되던 Adreno 320, 역시 비슷한 성능목표를 가진 엑시노스 7580의 Mali-T720 MP2 800Mhz와 동일한 성능을 가지고 있다고 한다.

  • Adreno 418
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
96 or 128600 Mhz? GPix/s? GTexel/s? GFLOPS

이름에서 부터 알수 있듯이 아드레노 420보다 뭔가 딸린 성능을 보유하고 있다. 화룡의 대체제로 널리 사용된 스냅드래곤 808이 사용한 GPU이다. 플래그쉽급 스마트폰에서 널리 사용되었지만 성능은 게임같은걸 돌리지 않는다는 가정 하에, 대충 WQHD급 해상도를 무난히 구동시킬수 있는 수준정도이다.

  • Adreno 420
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
128500~600 Mhz4~4.8 GPix/sGTexel/s144~172.8 GFLOPS

윗 항목의 아드레노 320, 330 처럼 플래그쉽급 AP인 퀄컴 스냅드래곤 805에 탑재된 GPU이다. 엑시노스 5433의 Mali-T760 MP6, Apple A8의 PowerVR GX6450과 경쟁했다.
경쟁 AP들의 GPU 성능을 살펴보면 Mali-T760 MP6이 GFX벤치 3.1 상에서 11fps, 3.0 상에서 17fps, 2.7 상에서 38fps가 나오는 반면에 아드레노 420은 각각 12fps, 18fps , 42fps이 나온다. GX6450은 각각 8.4fps, 19fps, 45fps가 나온다.
GFX벤치 3.0과 2.7만 보면 Mali-T760 ≤ Adreno 420 ≤ GX6450이라는 결과가 나온다. 그러나 GFX벤치 3.1의 결과를 보면 GX6450은 뭔가 심하게 낮은 결과가 나온다.

실질적으로 저 세 AP의 GPU 성능은 오차범위내 동급이지만 굳이 따지면 Adreno 420이 가장 좋다.
우수한 GPU 성능 덕에 WQHD에 LTE Cat.6 통신규격을 지원하는 2014년 하반기 플래그쉽급 스마트폰에 많이 사용되었는데 해상도가 WQHD임에도 불구, FHD + Adreno 330보다 높은 온스크린 성능을 보여주었다.

  • Adreno 430
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
192600 Mhz4.8 GPix/s9.6 GTexel/s252 GFLOPS? 388.8GFLOPS?[12]

퀄컴 스냅드래곤 810 MSM8994에 탑재되어 2015년 스마트폰 시장에서 Mali-T760 MP8 772mhz과 경쟁한 GPU이다. 초창기에는 GFX벤치 3.0에서 측정된 성능이 20fps 초반대여서 26fps으로 측정되는 엑시노스 7420의 Mali-T760 MP8에 비해 낮은 성능을 보여줬으나, AP 자체의 지속적인 성능 개선으로 600mhz 기준 28fps의 성능을 보여주고 있다. GFX벤치 3.1에서 측정된 성능은 20fps로 16fps로 나오는 Mali-T760 MP8에 비해 우위를 점하고 있다. 다만 GFX벤치 2.7상에서는 Mali-T760 대비 소폭 열세를 보여주고 있고 GFX벤치 Car Chase offscreen에서도 자세한 이유는 불명이지만 11fps로 측정되는 넥서스 6P를 제외한 나머지 기기의 벤치마크 결과가 6~7fps로 측정되어, 9.1fps로 측정되는 Mali-T760 MP8에 비해 열세인 모습을 보여주고 있다. 그리고 발열논란으로 인해 CPU, GPU 클럭이 낮게 세팅되서 출시된 기기도 꽤 있는걸 감안해야 한다.

출시 전년에 나온 Apple A8의 GPU보다는 40% 높은 성능을 보여주었고, 연말에 상용화된 Apple A9의 PowerVR GT7600과 비교하면 30% 낮은 성능을 보여주었다. 성능 자체로만 보면 그 시기에 나올수 있는 적절한 성능인 셈.

각종 웹진에서 까이는 스냅드래곤 810에서 그나마 안까이는 요소가 Adreno 430의 GPU 성능인데 하단 주석의 전력소모를 보면 무리하게 성능을 끌어올린 모습이 보여서 그닥 장점으로 보이지는 않는다.[13]

3.5 5XX

  • Adreno 505
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
MhzGPix/sGTexel/sGFLOPS
  • Adreno 506
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
MhzGPix/sGTexel/sGFLOPS
  • Adreno 510
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
600 MhzGPix/sGTexel/sGFLOPS

ARM Cortex-A72와 Cortex-A53의 조합으로 구성된 퀄컴 스냅드래곤 650, 652에 탑재되는 GPU이다. 스냅드래곤 600번대에 들어가는 GPU 답지 않게[14] 어마어마한 성능을 보여주고 있다. 초기 벤치마크 결과로는 Adreno 330과 418 사이의 성능을 가질것이라고 추측 되었으나, 실제 벤치마크 측정치 상에서는 Adreno 418과 근접한 성능을 가진다는게 드러났다. 기존의 스냅드래곤 600번대에 탑재되던 Adreno 405가 Adreno 320과 동급의 성능을 가진다는걸 고려하면 성능이 거의 두 단계 차이나는 셈(...)
ALU 수나 내부 구성 등의 자세한 제원은 아직 확실하게 드러난 사항은 없지만, GFX 벤치마크의 로우레벨 테스트로 추측한 제원을 보면 상대적으로 낮은 텍스쳐 필레이트랑 부동소숫점 연산성능으로 높은 성능을 거둔것으로 알려져서 성능쪽에서 상당히 효율이 상승한 것으로 보인다.

자세한 내부 제원이 알려진다면 추가바람.

  • Adreno 530
ALU 수동작 클럭픽셀 필레이트텍스쳐 필레이트FP 32 연산 성능
256510~624 MHz6.7(510MHz), 8.1(624MHz) GPix/sGTexel/s407.4~498.5 GFLOPS

퀄컴의 2016년 플래그쉽급 AP인 퀄컴 스냅드래곤 820에 탑재된 GPU이다. 2016년에 주력으로 쓰일 제품이라서 GPU 성능이 상당히 높게 측정되었다. 탐스하드웨어에 공개된 GFX벤치 결과를 보면 GFX벤치 3.0 상에서 48fps, GFX벤치 3.1 상에서는 30fps를 넘기는 성능을 보여주었고 이 정체불명의 기기 결과를 봐도 각각 48fps, 31fps의 결과를 보여주는걸 알수 있다. Apple A9의 PowerVR GT7600대비 맨해튼 3.0 기준 20% 높고 3.1 기준으로도 약 10% 또는 그 이상 높은 성능이다.

갤럭시 S7으로 비교한 결과:
Mali-T880 MP12 650mhz 와 Adreno530 624mhz의 GFX 4.0 맨하탄 3.1.1 오프기준으로 T880 16.6FPS, Adreno530 16.6FPS로 격차가 나지 않는다. car chase offscreen으로는 T880 17.7, Adreno530 19.0으로 격차가 벌어진다.

4 참고 링크

모바일 GPU 전력소모 데이터(Anandtech)

5 관련 문서

이 문서의 내용 중 전체 또는 일부는 퀄컴 스냅드래곤문서에서 가져왔습니다.</div></div>
  1. ARM Mali-400 쿼드코어 기준, 버텍스 프로세서 하나에 픽셀 담당 프로세서가 네 개나 박혀있다.
  2. 이후에 업데이트를 통해 533Mhz로 클럭이 상승함.
  3. 사실 이 비교는 5fps 이하의 비교라서 오차범위에 따른 편차때문에 의미가 없긴 하다.
  4. 물론 이시기에 Krait 코어를 쿼드코어로 탑재하고 아드레노 320같은 고성능, 고전력소모 GPU를 모바일 AP에 탑재하면서 본격적인 성능 경쟁이 일어났고 전력소모의 과도한 상승으로 인해 쓰로틀링이 이시기부터 급격히 심해졌다. 당장 예전 Mali-400의 전력소모를 보면 OOO mW 수준이고 엑시노스 5250은 CPU, GPU 전력소모가 각각 4W에 달해서 휴대폰 탑재는 꿈도 못꿨지만 지금 통상적으로 사용되는 스마트폰용 모바일 AP는 CPU, GPU 모두 각각 보통 5~6W, Cortex-A53만을 사용하는 저전력 AP부터 화룡까지 범위를 넓게 잡으면 3W에서 10W이상까지 소모하여서 3~4W대로 쓰로틀링이 걸리는게 일반적이다.
  5. 자료에 따라 다름. 전자는 ROP가 4개인 상황, 후자는 ROP가 8개인 상황을 상정한듯 하다.
  6. 자료에 따라 다름. 각각 ROP가 6개인 상황과 8개인 상황을 상정.
  7. 물론 윗 각주에서 언급한것처럼 전력소모 상한선이 높아지면서 과도한 쓰로틀링이 걸리기 시작했다.
  8. 2013년 상반기 → 5410 vs 600, 2013년 하반기 → 542x vs 80x, 2014년 하반기 → 5433 vs 805, 2015년 → 7420 vs 810
  9. 5410(1600Mhz 결과 참고) vs 600(1728Mhz 결과 참고), 5433(1300Mhz 결과 참고) vs 805(2649Mhz 결과 참고), 7420 vs 810
  10. 5420(1900Mhz 결과 참고, 싱글 950에 멀티 2900~3000점대) vs 800(2265Mhz 결과 참고, 싱글 970에 멀티 2900~3000점대), 5422(1300Mhz 결과 참고, 그래프 상의 1900Mhz는 갤럭시 탭 S 10.5의 점수이다. 싱글 970~980점에 멀티 2900~3300점대) vs 801(2457Mhz 결과 참고, 싱글 최대 1023점에 멀티 최대 3176점)
  11. 보통 1~2fps정도 차이가 난다.
  12. 원래 192 ALU라면 230 GFLOPS가 나와야 한다. 이쪽 바닥은 확실한 정보가 없으니 388 기가플롭스는 걸러듣자. 그 끝판왕인 A9X가 345.6 기가플롭스로 알려져 있다(...)
  13. 삼성전자 엑시노스퀄컴 스냅드래곤은 서로 상대방 AP의 GPU 성능에 맞추려고 무리하게 전력소모를 올리는 경향이 있다. 805 vs 5433때는 엑시노스 5433이 805 수준의 GPU 성능을 얻기 위해 무리하게 GPU 소비전력을 6W 까지 올렸고, 810 vs 7420때는 7420의 GPU 소비전력이 4W 후반대인데 퀄컴 진영에서 GPU 성능을 잡기위해 소비전력을 7.3W 까지 올린 전적이 있다(...) 밑 항목의 모바일 GPU 전력소모 자료 참고.
  14. 다만 기존의 600번대와 성능이 큰 차이가 나서 618, 620에서 650번대로 리네이밍된 물건들이다.