CELL-Broadband Engine

소니IBM, 도시바의 합작으로 만들어진 CPU. 소니IBM, 도시바가 새로운 프로세서 개발을 위해 제휴하기로 결정하면서 개발이 시작됐다. 2001년 3월에 텍사스에 STI[1] 디자인 센터가 만들어졌고, 그 후 약 5년 넘게 개발됐다고 한다. 이 동안 소니는 약 4억 달러 정도 투자한 것이 알려졌다.

POWER 아키텍쳐 기반으로 설계됐다. 주 연산과 제어를 담당하는 2개의 스레드를 동시 처리 가능한(SMT) 1개의 PPE(Power Processor Elements)와, 보조 연산 및 벡터 프로세싱을 담당하는 8개의 SPE(Synergistic Processor Elements)가 내장되어 있다. PS3의 CPU는 수율 문제로 SPE 1개가 차단되어있다. 이론상의 최대 성능은 3.2GHz 클럭에서 각 유닛 1개당 25.6GFLOPs의 단정밀도 연산을 할 수 있다. 다만 실제로 셀이 달성해낸 최대 성능은 약 150GFLOPs 대.[2] 소니플레이스테이션 3에 MPU(Main Processing Unit = CPU)로 사용된 것이 유명.[3]

소니 자체 생산이었던 PS2의 메인프로세서인 Emotion Engine과 Graphics Synthesizer도 반도체 공정의 미세화로 다이 사이즈 감소와 최종적으로는 두 칩이 원칩화 되면서 거기서 발생한 제조 비용 하락 폭이 상당하였기에 PS2 중~후반기에 기기 판매로 인한 마진폭은 상당하였다. 거기까지 염두한 쿠타라기 켄 당시 SCE 사장의 원래 CELL의 설계계획은 최근의 개념인 APU에 가까운 것을 구상했다. PS3NVIDIA 커스텀칩인 RSX 대신 CELL을 두 개 탑재하여 4GHz로 동작시키는 것이 목표였다. CELL을 소니가 직접 공장에서 찍고 후반부엔 원칩화해서 단가를 내리겠다는 야심찬 계획이었지만 테스트 머신을 굴려보곤 그 성능에 절망하여 XBOX360의 XENOS칩 개발에 바쁜 ATI 대신 NVIDIA를 급하게 찾아갔다는 얘기가 있다.[4]

이 기묘한 구조의 CPU 덕택에 처음에는 제대로 활용하기 어려운 데다가 개발툴도 불친절한 관계로, 일반적인 개발자 입장에선 윈도에서도 결과 확인이 가능한 엑스박스 360을 선호했었다. 심지어 존 카맥조차 'PS3로 개발하는 것은 너무 난해하니 난 안할거다' 라고 돌려 깠고, 밸브게이브 뉴웰PS3를 재앙이라고 발언했다. 그리고 2010 E3 소니 컨퍼런스에 등장하고 PS3에도 포탈 2를 출시한다. 그러나 GDC 2007 때 SCEA에서 PS Edge 엔진이, GDC 2008 때엔 SCEE에서 PhyreEngine이 공개, GDC 2009 때엔 PhyreEngine에서 Deferred rendering 지원이 추가되고, SCE 월드와이드 스튜디오의 개발 노하우들이 공유되면서 많이 나아진 편이다.

태생이 태생이라 멀티미디어나 병렬 연산 성능이 매우 좋은 축이라서, 모 게임의 서버로 이 녀석을 여러 대 병렬로 연결해 서버로 굴리거나, 각종 영상 처리용 워크스테이션 등으로 만들기도 한다. 도시바에서는 멀티미디어 플레이어나 TV에 넣어서 영상 처리를 맡은 제품도 나왔다. 이 방법이 얼마나 효율적인가 하면 미국 공군(!)에서 PS3을 2천개(!!) 넘게 사서 병렬 연결하여 연구용 슈퍼컴퓨터로 사용하고 있다.[5] 물론, PS3 말고도 이 칩은 B2B로 구입이 가능하기에 동영상 업계에서 뭘 처박았길래 이렇게 빠른 지 의아한 수많은 외장형 가속기에 들어가 잘 쓰이고 있다. 실제로 PS3를 이용한 HD 소스 리핑이나 DVD의 업스캔 컨버팅은 매우 간단한 데다가 빠르기로 유명.

하지만 정작 게임에서 중요한 정수 연산 능력은 엑스박스 360의 CPU나 다른 CPU에 비해 떨어지며 부동소수점 연산도 GPU에는 미치지 못한다. PS3가 당초 목표를 변경하고 엔비디아의 그래픽 칩셋을 단 이유도 이 때문. IBM에게 소니가 크게 낚였다고 할만하다. 2003년 2월에 엑스박스 360용 CPU를 마이크로소프트에게서 의뢰받은 IBM이, 셀의 개발 중 노하우를 참고하여 CPU를 마이크로소프트에 만들어 줬다는 비화를 봤을 때도 소니IBM에 제대로 낚였다.[6][7]

현재의 셀은 배정밀도 부동소수점 연산시 연산작업이 중지되는 버그로 인해 제 성능이 나오지 않으나, 어차피 배정밀도 부동소수점 연산기능은 게임이 아닌 다른 목적으로 주로 쓰이는 기능이다. 언젠간 게임에 쓰일수도 있으나 그것은 아주 먼 미래로 2014년 현재도 게임에서 배정밀도 연산은 거의 쓰이지 않는 상태.

연산작업 중지 버그를 해결한 PowerXCell 8i까지 출시된 상태이며 그 이후로 예정 되어 있었던 신규 모델들은 취소된 상태로 아직까지 추가적인 개선이나 차세대에 대한 계획은 불투명하다.

이 CPU는 구조는 복잡하였지만, 출시 당시 기준으로 상당한 성능을 냈었기에, 슈퍼컴퓨터 용으로 사용되기도 하였다. 1페타플롭스의 성능을 최초로 돌파했던 슈퍼컴퓨터 로드러너(Road runner)에서 CELL과 옵테론을 조합해서 사용했었다.

플레이스테이션 3의 적자와 CELL의 민간 부문 판매 부진으로 인해, 2006년 11월 30일 쿠타라기 켄 SCE 사장은 회장으로 승진했으나, 업계는 문책성 좌천 인사 이동으로 판단하고 있다. 2007년 4월 26일 쿠타라기 켄은 사표를 제출했고, 그 해 6월 28일 소니를 떠나게 된다.

2007년 10월 18일, CELL에 대한 제조 설비를 도시바에 900억엔에 매각할 계획이라고 밝혔으며, 도시바가 60%를 출자하고 소니가 40%를 출자한 새로운 조인트 벤처 기업, NSM(Nagasaki Semiconductor Manufacturing Corporation)을 설립해 CELL을 생산하기로 합의했다. 또한 2007년 11월 7일, 소니IBM, 도시바와의 CELL의 32nm 반도체 공정 개발에서 포기하기로 결정했다고 밝혔다. 하지만 2010년 12월 24일, 소니도시바에게서 조인트 벤처 기업, NSM의 도시바 지분 60%를 500억엔에 재매입하는 것이 밝혀진다.

한편, IBM은 꾸준히 CELL을 개량해 90nm, 65nm에 이어 45nm로의 이행을 완료하였다. 다만 이젠 앞으로의 추가 개선은 불투명한 상황.
  1. Sony, Toshiba, IBM
  2. PS3의 경우 8개의 SPE중 1개는 수율문제로 차단돼 있으며 1개는 코드 보안용으로 OS 전용으로 쓰이므로 게임용으로는 6개의 SPE만 쓸 수 있다. 그러면 얼추 계산이 맞는다. 그 중 1개는 오디오 및 사운드 처리 전용으로 썼으므로 그래픽 처리용으로는 보통 5개의 SPE를 썼다.
  3. 참고로 Xbox360 후속기기의 칩 이름은 'Oban'이라고 한다.. 드래곤볼? 그러나 Oban은 XBOX360 후속기기인 XBOX ONE이 아닌 XBOX ONE과 동시 출시한 XBOX360E의 주 프로세서 XCGPU(Xenon CPU+Xenos GPU)의 IBM 32nm SOI공정 개선 프로세서임이 훗날 밝혀졌다.
  4. 하지만 만약 CELL/BE 듀얼로 나왔다 하더라도 개발중 예상했던 성능이 나올 것이라는 보장도 없었으며, 도리어 개발자들에게 더 안 좋은 환경을 제공하여 게임 제작이 매우 어려워졌을 확률도 높았다. 당장 PS3에 들어가 있는 NVIDIA RSX도와 44GFLOPs의 버텍스 연산 성능과 356.4GFLOPs 픽셀 연산 성능을 보여준다.
  5. 소니가 해킹과 복사를 방지하기 위해 3.21패치를 감행하면서 OS 설치기능을 삭제해버렸기 때문에 미 공군은 제대로 엿먹을 뻔 했다. 현재는 PSN 업데이트를 아예 하지 않는 방법으로 사용 중이라고 한다. 하지만 고장시 A/S를 보내면 최신 업데이트를 해서 돌려줘서 곤란하다고.
  6. 다만 IBM이 CELL을 다른 고객에게도 팔 수 있도록 소니도시바가 합의했을 때 그게 경쟁기업 마이크로소프트도 될 수 있음을 판단하지 못한 소니의 책임도 없다고 말할 수는 없다.
  7. 엑스박스 360의 CPU, Xenon은 셀의 SPE를 개선하고 대형화된 특수한 1개의 SPE를 3개의 PPE가 공유하는 구조. IBM은 셀이 일반적인 논리 처리 성능이 부족한 것을 파악하고, 논리 성능을 높이고 연산 성능을 약간 줄였다.