Direct Stream Digital


파일:DSD Sony.png

1 개요

Direct Stream Digital은 소니필립스에서 SACD에 사용하기 위해 제작된 포맷으로 필립스의 비트스트림(Bitstream)[1] 방식을 응용한, 2.8224MHz 샘플링 주파수 및 1bit 인코딩 방식의 고음질 포맷이다.

이 포맷이 만들어진 이유는 CD의 대체 미디어로 DVD-Audio 진영과 대립하던 소니와 필립스[2]가 독자적 포맷으로 CD의 연장선상에 있는 SACD(Super Audio CD) 를 준비하였고, 이 때 PCM과는 다른 새로운 오디오 인코딩 방식으로 DSD를 선택하게 되었다는 것이다. SACD의 경우 고음질을 지향하기는 하였으나, 탄생의 이유 자체가 특허료 수입의 연장[3]이라는 다소 불순한 의도가 있었던 탓에 기존 CD PCM의 음질적인 개선 요소보다는 복사 방지의 보안에 지나치게 치중하였고, DSD의 경우 PCM 추종자들의 입장에게는 치명적으로 해석될 수 있는 음향적인 문제점을 드러내는 등, 끊임없이 논란의 떡밥을 제공한 상업적 문제점을 보여준 대표적인 포맷이 되어버렸다.

다른 이유로 The Complete Guide to High-End Audio(저자 : Robert Harley)[4]의 내용에 나왔다고 하는 'DVD 오디오 샘플링 규격에서 소니와 필립스가 88.2kHz를 지원하지 않아서'라는 이야기가 있는데, The Complete Guide to High-End Audio에는 이런 내용이 전혀 없으며 DVD-Audio의 샘플링 주파수 규격에는 88.2 및 176.4kHz가 있으니... 즉 잘못된 정보다.

물론 DVD-Audio의 표준화 과정 중에 소니와 필립스가 CD와의 호환성을 가질 것을 요구한 것은 사실이다. DVD의 모든 스펙은 DVD Forum이라는 단체에서 표준화를 추진하였는데(소니와 필립스도 DVD Forum의 설립 멤버이고, 아직도 DVD Forum의 회원사다), 소니와 필립스는 DVD-Audio 표준에 대해 처음부터 CD 플레이어에서도 재생할 수 있는 (물론 DVD-Audio 플레이어 뿐만 아니라 DVD 플레이어에서는 당연히 재생되어야 하고) 호환성을 요구하였다. 하지만, DVD Forum에서 표준화 작업을 주도한 구성원들이 대부분 비디오 기술 엔지니어였기 때문에 CD 플레이어와의 호환성에 대해 그리 중요하게 생각하지 않았으며,

그래서 소니와 필립스의 주장은 받아들여지지 않았다. 결국 두 회사는 독자적으로 CD와의 하위 호환성을 갖는 미디어로써 SACD의 작업에 착수하게 되어,
파일:SACD Disc.jpg파일:SACDDisc2.jpg
그 결과 SACD는 하이브리드 방식으로 CD 플레이어에서도 재생할 수 있게 되었다. [5] 참고로 최초의 DVD-Audio 플레이어는 1999년 말 파나소닉이 발표하였으나(DVD-A7), 소니가 만든 최초의 SACD 플레이어(SCD-1)는 이보다 6개월 빠른 1999년 5월의 일이다. [6]

2 특징

파일:DSD Sorce.jpg
흔히 많이들 광고하는 것이 CD-DA 포맷의 44.1kHz와 비교하며 64배의 샘플링 주파수를 담아 엄청나게 우월한 것처럼 광고를 띄우고 있는 것이 특징이다.

여기서 포인트는 1bit라는 것이다. 쉽게 생각해서 CD-DA 경우 아날로그화하였을 때 2x8=16bit라는 계산이라면 DSD는 1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1=16bit라는 식으로 하기에 어떻게 보면 가장 단순하고 무식한 방법으로 보일 수도 있는 방식이다. 1bit 방식으로 처리하다 보니 비트 정밀도가 매우 떨어지며 이것을 보완하기 위해 샘플링 주파수에 몰빵한 방식으로 이해하면 된다..

파일:PCM&DSD.gif
DSD는 디지털화(=부호화)가 △∑(델타 시그마) 방식으로 오버 샘플링하여 저장하는 방식이기에 복호화도 매우 단순해서 PCM에 비해 재생 시 거치는 과정이 매우 적기에 음질이 좋다고 알려져 있다. 그리고 PCM에 비해 임펄스 값이 매우 우수한 것으로 알려져 있으며 1-bit 방식에 2.8224MHz의 오버 샘플링이 더 아날로그에 가까운 파형을 낸다는 전문가의 소견주장[7]도 있다.

파일:Dsd-pcm-impulse-response.gif
그리고 이론상 2.8224MHz로 최대 100kHz[8]까지 재생 가능하여 재생 주파수 범위가 최대 22.05kHz(이론적 수치)인 CD에 비해 크게 늘어나서 우월한 음질을 자랑하는 것도 특징이다. 이걸 비트레이트로 표기하면 5,644kbps의 용량을 가지고 있다. CD급 음질 PCM(16bit/44.1kHz)과 SACD급 음질인 DSD64[9]의 차이점을 비교하면 이렇다.

파일:DSD11.22.gif

PCM (CD 오디오)

  • 포맷 : 16bit
  • 샘플링 주파수 : 44.1kHz
  • 비트레이트 : 1,411kbps (2채널 기준)
  • 다이나믹 레인지 : 96dB
  • 재생 주파수 대역 : 20Hz~22kHz
  • 5.1 멀티 채널 서라운드 : 불가능 [10]


DSD64

  • 포맷 : 1bit
  • 샘플링 주파수 : 2.8224MHz
  • 비트레이트 : 5,644kbps (2채널 기준)
  • 다이나믹 레인지 : 120dB[11]
  • 재생 주파수 대역 : 20Hz~100kHz[12]
  • 멀티 채널 서라운드 : 가능 [13]

3 DSD의 전송과 재생

DSD가 오직 SACD 플레이어에서만 재생 가능했던 과거와 달리, 오늘날의 DSD 재생은 다양한 방법으로 가능하다. 특히 초창기 SACD 플레이어에서는 DSD 신호의 출력을 아날로그만 허용하였으나, 일부 메이커에서 i.Link(=IEEE1394)를 통해 DSD 신호의 raw data를 출력하면서부터 디바이스(소스 플레이어)에서 디바이스(외장 DAC나 AV 리시버)로의 DSD 출력 방법에 대한 시도가 이루어졌고, 결국 HDMI 1.2에서는 DSD native 전송이 가능해졌으며, HDMI 1.3에서는 DSD의 무손실 압축 포맷인 DST(Direct Stream Transfer) 신호의 전송도 가능해졌다. 하지만, HDMI 입력을 지원하는 DAC가 거의 없었던 탓에, HDMI를 통한 DSD의 전송은 그리 보편화가 되지 못했는데, 2011년 몇몇 회사들이 모여, USB Audio 2.0 프로토콜을 통한 "DSD over PCM standard 1.0"을 만들면서 PC 소프트웨어로 DSD 파일을 재생하여 외장형 USB DAC로 출력을 내는 컴퓨터 기반 오디오 시스템(PC-AUDIO)에서 DSD 전송과 재생이 활성화되기 시작하였다.

3.1 하드웨어 & 소프트웨어 재생

DSD 재생은 하드웨어 재생 방식과 소프트웨어 재생 방식 두 가지[14]로 나누어진다. 하드웨어 재생 방식으로 Native DSD가 지원되는 DAC를 사용하거나, 혹은 DSD 신호를 받아 PCM 변환을 하여 재생하는 DSD 입력 지원의 PCM DAC를 사용하는 방법이 있으며, 소프트웨어 재생 방식은 일반적으로 프로그램의 자체 내장된 DSD 디코더를 가지고 PCM으로 변환하여 PC의 사운드 카드를 통해 재생하거나, 변환된 PCM을 옵티컬(=SPDIF)이나 USB 출력으로 외장형 DAC로 재생하는 방식이 있다. 사운드 카드 또는 DAC의 성능만 받쳐준다면 어느 쪽이든 별 차이는 없다고 보면 된다. 그리고 프로그램에 대해서도 별로 고민할 필요가 없는데 가장 널리 쓰이는 디코더인 ffmpeg가 DSD 디코딩을 지원해서 그냥팟플레이어로도 재생할수있다. 다만 소프트웨어적으로 디코딩할경우 음악 파일 치고는 상당히 시스템 자원을 많이 요구하는편이다. 참고로 성능이 많이 달리는 기기는 24비트 flac를 잘 풀어내는 스펙이더라도 디코딩이 힘들수도 있다.

3.2 Native DSD

DSD를 원본 그대로 전송 또는 재생하는 방법에 대해 Native DSD라는 용어를 쓴다. 즉, Native DSD 전송은 DSD raw data를 훼손시키지 않고 전송하는 것을 의미하고, 마찬가지로 Native DSD 재생은 DSD raw data를 그대로 아날로그 변환하여 재생하는 것을 의미한다. 그렇다면 Native DSD의 반대되는 의미도 있을 것 같은데, Native DSD의 반대는 DSD를 PCM으로 변환하는 것이 된다. 예를 들어, Native DSD를 지원하는 플레이어란 DSD 신호를 DAC 칩까지 어떠한 변환 없이 그대로 출력하는 플레이어를 말하고, Native DSD를 지원하지 못하는 플레이어란 DSD 신호를 PCM으로 바꿔 재생하는 것을 의미한다. 가끔은 뒤에 서술할 DoP를 DSD to PCM 변환으로 착각하여 Native DSD의 반대 의미로 오해하는 경우가 있는데, DoP란 DSD를 PCM data에 숨겨서(≒encryption) 전송하는 것을 의미하며 DSD의 raw data가 훼손되지는 않는다.

그리고 델타 시그마 기술을 사용하고 있는 DAC 칩이라도 내부적으로 1bit가 아닌 6bit 멀티 비트 델타 시그마 기술을 사용하는 경우라면, 100% Native DSD 재생이 되지는 않는다. [15] Native DSD 재생을 위해서는 원래대로라면 DSD 전용 1bit DAC 칩[16]을 사용해야 하겠지만, 이는 DAC 칩에서 여러가지 기능을 요구하는 요즘에 있어서는 효율성이 떨어지고 현실성이 없는 구조라, 최근 대부분의 DAC 칩은 DSD를 입력받더라도, 칩 내부에서는 이를 PCM으로 변환해서 재생하는 방법[17]을 사용하고 있다. 따라서 100% Pure Native DSD 재생[18]을 지원하는 기기나 DAC는 극히 드문 편이다. 게다가 PC뿐만 아니라 스마트폰 DAP 등에서의 모든 음 처리가 PCM으로만 가능하여, Native DSD 환경을 만드는 것이 여간 어려운 일이 아니다.

3.3 DoP 전송

파일:DSDWS.jpg
DSD 음원을 기존 PCM으로 변환해서 재생하게 하는 것을 알기 전에 먼저 DoP(DSD over PCM)라는 규격을 알아야 하는데, DoP는 DSD 음원을 24bit PCM의 형태로 변환하여 전송하는 방식[19]으로 24bit의 상위 8bit에 DSD Marker라는 구분자를 넣어서 이 시그널이 DSD임을 구분하고 하위 16bit에 1채널 DSD 데이터를 넣어 전송하는 원리이다. 상위 8bit Marker에는 버전에 따라 여러 종류가 있어서 과거 1.0 버전에서는 16진수로 0xAA 값을 가지는 Marker가 사용되었으며 1.1 규격에서는 0x05와 0xFA가 사용되고 있다.[20]

전송된 DoP 신호는 DAC에서 다시 DSD로 변환되어 재생된다. 문제는 DAC 기기가 이 신호가 DSD인지 PCM인지 구분하기 위해서는 규정상 최소 32개의 시그널을 분석해서 Maker가 연속되어 있는지 확인해야 한다는 것이다. 이 확인 루틴은 대부분이 DAC에서 매끄럽게 구현되어 있지 않기 때문에 PCM을 재생하다 DSD가 재생되면 노이즈가 발생할 수 있다.

또 다른 문제점으로 DoP 규격은 PCM 전송 방식이기에 DSD 데이터를 전송하기 위해서 대충 규정된 것이기에 운영체제의 Mixer나 샘플레이터 자동 변환 루틴을 거치게 되면 데이터가 변형되어 DSD 데이터로 인식하지 못하기에 노이즈밖에 나지 않는 현상이 발생하는 점이다. 또한 소리 크기를 변경해도 데이터가 변형되므로 마찬가지로 노이즈만 재생된다. 반드시 bit-perfect 재생만이 제 소리를 낼 수 있기에 전용 재생 프로그램을 이용해야 하며 출력 방식은 ASIO 또는 WASAPI으로 해야 한다.[21]

DoP 규격으로는 DSD64가 24bit/176.4kHz로 전송되며 DSD128은 24bit/352.8kHz로 전송한다.

더 자세한 내용은 DoP Ver 1.1을 참고하자.

3.4 소프트웨어 재생

소프트웨어 재생 방식이란, 소프트웨어 상에서 DSD를 PCM으로 변환하여 처리하는 방식을 말한다. 소프트웨어 재생 방식은 DSD DAC 같은 하드웨어를 필요로하지 않으므로 PC에서 사용할 때 장점이 극대화되는데, Native DSD를 지원하지 않는 일반적인 사운드 카드 등의 하드웨어 조건에서 사용 가능하다는 특징이 있다. 특히 기본 설정이 고정되어 있는 Native DSD와 다르게 사용자가 입맛대로 DSD 재생 설정이 가능한데, 사용 중인 사운드 장치의 하드웨어 성능에 따라 DSD의 정해진 스펙보다 더 높은 비트 정밀도와 샘플링 주파수로도 변환 재생도 가능하며, 출력이 낮은 DSD 음원에 대해서는 출력 보정 여부를 설정할 수도 있다. 또한, DSD to PCM 변환 과정에서 양자 노이즈에 의한 에일리어싱 현상[22]을 제거하기 위해 로우패스 필터가 필요한데, 이러한 필터의 특성을 지정할 수 있으며, 설정된 필터에 따라 미세하게 소리가 달라지는 성질을 활용하면 자기만의 음색 조정도 가능하게 된다.

하지만 스마트폰 앱의 경우 별다른 설정 메뉴가 없는 경우가 많고, 자체 기본 음악 앱이 아닌 다른 앱을 사용하면 16-bit/44.1&48kHz로 커널에서 재생이 제한되어 버리기에[23] Native DSD의 발끝도 못 따라가는 재생 문제점이 있다. 이걸 해결하려면 OTG를 지원하는 외장 DSD USB DAC를 사용해야 하는데 휴대성부터 편의성까지 여러모로 불편한 점이 많고 해당 지원 앱이 유료이기에 결제해야 하는 단점도 있다.

PCM과 달리 DSD의 경우 다이나믹 레인지를 유지하기 위해 컴프레싱 작업이 매우 적은 편이다. PCM의 경우, 0dBFS를 넘어서 클리핑이 되면 찌그러짐이 심하게 발생하나, DSD는 구조상 오버로드가 되어 클리핑이 발생하더라도 헤드룸이 있어 찌그러짐(디스토션)이 심하게 일어나지 않는다. 때문에 DSD 녹음 시 컴프레싱을 하지 않아도 음질적으로 문제가 발생하지 않는다.[24] 하지만 DSD를 PCM 변환하게 되면 DSD 만큼의 헤드룸을 확보하기 위해 출력을 기본 CD에 비해 6db 낮추어야 한다. 이 때 낮추어진 출력을 보정하는 기능이 없다면 소리가 작게 들릴 것이므로, 상대적으로 출력이 센 기기 또는 앰프가 필요하게 된다. 요즘 나온 Native DSD DAC 기기들은 기본적으로 이런 출력 보정 기능[25]을 제공하고 있지만, 소프트웨어 디코딩을 한다면 해당 소프트웨어에서 출력 보정 기능이 없는 경우, 별도 앰프를 고려하는 게 좋다. 소프트웨어 디코딩시 출력 보정의 경우, 클리핑을 억제하는 기능이 없으면 자칫 클리핑이 일어난 소리를 들을 수 있으니 조심하자.

4 DSD의 문제점

DSD를 까야 하는 이유.
말만 좋지 실제로는 PCM보다 한참이나 떨어지는 음원을 만들어내는 엉터리 방식이다.
사실 DSD의 목적은 원래 어디까지나 고음질이 아닌 비용절감이었다.
플스2 스펙 블러핑 발표와 더 불어 또 하나의 희대의 블러핑 발표 연도 마져 동일하다.


위의 내용을 보면 상당히 좋은 포맷 같지만 몇 가지 단점도 있는데, 먼저 1bit 방식이기에 이퀄라이저/DSP 등을 적용할 수 없으며 1bit의 정밀도로 디지털을 아날로그로 변환하는 작업 중 양자 노이즈가 엄청나게 증가하여 30kHz 주파수 이상에서는 스피커 트위터에 무리가 갈지도 모르는 문제와 실질적으로 CD-DA의 문제점이었던 지터 노이즈 등은 전혀 해결되지 못했다는 주장도 있다.

파일:Hi-ResDSD02.jpg
WHITE ALBUM2 VOCAL COLLECTION : さよならのこと 음원
스펙 : SACD 변환 DSD64(2.8Mhz)

특히 이 노이즈 쉐이핑 (Noise Shaping)라고 불리우기도 하는 양자 노이즈는 위 이미지에서도 볼 수 있듯 엄청난 노이즈띠를 가지고 있으며 소니에서도 이 문제를 인지하고 있기에 이걸 저역 통과 필터(LPF)로 노이즈를 제거하는 방식을 사용하였는데 이로 인해 초고역대마저 손실을 입어버리기에 소니는 대부분의 제품에 S-Master라는 독자적인 PWM 앰프를 사용하고 있는데, S-Master 앰프의 특성이 30kHz 이상을 재생하지 못한다. 때문에 소니에서는 DSD가 재생되는 제품이라 하더라도 S-Master 앰프가 사용된 경우 매뉴얼에 재생 대역을 30kHz로 표기하고 있다. 이로 인해 실제로 PCM에 24bit 96kHz 4600KB 비트레이트를 가지고 있는 스펙의 PCM과 비교하면 DSD는 용량도 너무 크고 그 초고음역대도 필터로 인해 제대로 사용하지 못한다는 문제점을 남겨버렸다.이걸 해결 하기 위해 DSD64를 더블 샘플링한 DSD128가 나왔지만 이건 50kHz에서부터 양자노이즈가 발생하는 문제가 있다. 특히 음원의 완성도, 즉 다양한 음과 초고음역대가 풍부할수록 양자 노이즈가 심하며 로우패스 필터(범위 30kHz 기준)로도 많이 걸러내지 못하는 단점도 있다. 트위터가 죽었슴다..ㅡㅡ;

파일:DSD Sorce01.jpg

이런 상태에서 현대의 DSD 재생은 PCM으로 변환하는 과정을 사용하면서 DSD의 특징인 샘플링 주파수 MHz의 장점을 살리기 위해 PCM 추종자들에게는 필요 이상의 오버스펙인 32bit/384kHz 방식의 DXD가 등장했으며 다양한 DAC와 제조 회사마다 다른 LPF 필터 방식 등으로 인해 음색이 바뀌는 문제점이 있고 이걸 PCM 음원으로 변환하면 전자의 특성 때문에 기존 DSD 음색이 변하는 문제(음이 좀 더 밝아지고 저음은 적어지는 등) 때문에 여러모로 까다로운 음원이 되었다

파일:Hi-ResDSDSorce02.jpg
밥 딜런 - Blonde on Blonde : Visions of Johanna 하이 레졸루션 오디오 음원 파형
스펙 : 24bit/96kHz

파일:Hi-ResDSDSorce01.jpg
밥 딜런 - Blonde on Blonde : Visions of Johanna [MFSL] SACD 음원 파형
스펙 : SACD 변환 16bit/176.4kHz
양자 노이즈로 파형이 불안정해진 것을 확인할 수 있다.

즉 DSD는 무손실 음원도 아닌 기록되는 순간부터 초고역 노이즈로 인해 손실 음원이 되며 이것을 다시 디코딩 하는 것부터 초고역 노이즈 필터를 적용하여 재생하기에 역시나 음질이 손실이 되어 디코딩된다고 보면 된다.

그리고 CD의 64배라는 것도 허위과장인데 비트 정밀도가 낮은 DSD 1bit로 그보다 높은 정밀도를 가진 CD의 16bit를 동급으로 비교하는 것 자체가 억지며 실제 DSD와 CD를 비트레이트로 비교를 하면 CD의 4배라는 계산이 나온다. 즉, CD(44100×16×2=)=1411Kbps이기에 이걸 계산하면 1411×4=5644Kbps라는 DSD 비트레이트 값이 나온다. 다시 말해 DSD 의 정식 스펙은 16bit/176.4kHz(176400×16×2=5644Kbps)와 동급 수준이다. 황금귀를 위해 스펙을 다시 정의하면 32bit/88.2kHz(88200×32×2=5644Kbps)라는 그럴듯한 스펙이 된다. 물론 상술했듯 양자화 노이즈도 고려자자

이 DSD 특유의 양자화 노이즈의 정체에 대해서 다시 생각해 볼 필요가 있다. 이 양자화 노이즈는 1bit 인코딩 시 사용되는 Noise Shape에 의해 발생되는 Shaped Noise이다. 전문적으로 설명한다면, 가청대역에서의 다이나믹 레인지를 확보하기 위해, 가청 대역의 노이즈를 가청 대역 밖으로 밀어낸 것이다. 수치적으로 16bit/176.4kHz PCM과 동등 비트레이트지만, 80kHz까지의 재생 대역에서에서 일정한 96dB의 다이나믹 레인지를 가지는 PCM이냐, 100kHz 까지 재생하면서 20kHz 이하의 가청 대역에서 120dB의 다이나믹 레인지를 가지는 대신 30kHz 이상에서는 Shaped Noise로 다이나믹 레인지가 떨어지는 DSD냐는 어디까지나 선택의 문제이다. 우연치 않게도, DSD의 Shaped Noise는 등청감 곡선 Equal Loudness Contour의 모양과 많이 비슷하며. Fletcher-Munson의 Equal Loudness Contour를 근거한다면, 20kHz 이상에서는 100dB 이상의 다이나믹 레인지를 인간이 느낄 가능성은 0에 수렴하지만, 20kHz 이하에서 100dB 이상의 다이나믹 레인지를 인간이 느낄 가능성은 충분히 존재한다. 무엇을 선택할 것인가는 어디까지나 청자의 지식 수준, 즉 기술에 대한 이해도의 문제로 귀결될 것이다.그냥 24bit/96kHz를 쓰면 전 대역에서 이론상 144dB에 대역도 48kHz까지 나오니 해결. 난 brick wall filter 가 뭔지도 몰라.

5 파일 형식

파일로의 인코딩 방식은 세 가지로 나눠지는데 필립스 방식과 소니 방식, 1bit 오디오 컨소시엄 방식이 있으며 서로 호환은 되지 않는다.

필립스 방식의 포맷 명은 DFF(DSDIFF - Direct Stream Digital Interchange File Format)[26]이며 2000년 필립스에서 정한 규격으로 SACD에서 사용하는 규격이기도 하다. DSD를 지원하는 DAP, 스마트폰, 무선 스피커라도 이 포맷을 지원하지 않는 경우가 많으니 만약 DFF 포맷의 사용을 고려해서 음향기기를 구입한다면 꼭 DFF 확장자를 지원하는지 확인하자. 참고로 DFF를 지원해도 DST를 지원하지 않는 음향기기도 있으니 이것도 확인해야 한다.

DST(Direct Stream Transfer)는 DFF의 무손실 압축 파일 로 포맷명은 DFF와 동일하며 압축이 되어 있어 DST 사용 시 용량이 DSF보다 적은 장점이다. 이런 압축 기술을 사용하는 이유는 SACD 는 2채널과 5.1채널 음원을 동시에 최대 80분의 재생 시간 만큼 담을 수 있도록 되어 있는데, 산술적으로 약 13.5GB 의 용량(=80분 * 8채널 DSD)을 필요로 하게 된다. SACD는 물리적으로 DVD 디스크와 99% 동일한 포맷이며, 듀얼 레이어 SACD의 경우 DVD-9 포맷을 사용하는데, 이는 약 8.5GB의 용량에 해당되어 13.5GB의 음원을 담을 수 없으므로 압축이 필수로 요구된다. SACD는 각 층을 스테레오 채널와 멀티 채널 구역으로 나눌 수 있으며, 사용자가 플레이어 조작 시 스테레오 채널과 멀티 채널을 선택하여 감상하게 된다. 이 때 스테레오 채널에 80분의 DSD 음원을 기록하게 되면 약 3.39GB(= 2,822,400bit ÷ 8bit × 2채널 × 60초 × 80분)에 해당하며 이는 4.7GB 싱글 레이어 디스크 내에 수록하는 데는 문제가 없다. 하지만 멀티 채널은 80분 음원이 약 10.16GB에 해당하여 4.7GB 디스크에 수록이 불가능하다.

때문에 초기 듀얼 레이어 SACD에 2채널과 5.1채널을 동시에 수록할 경우, 2채널 음원은 압축되지 않은 DSDIFF로, 5.1채널 음원은 DST로 압축된 DSTIFF 포멧으로 8.5GB 용량에 맞춰 수록하게 된다. 2채널 음원에 대해 DST 압축을 하지 않는 이유는 SACD 여명기에 멀티 채널 SACD 포맷과 DST 압축이 뒤늦게 추가된 스펙이라, SONY SCD-1 과 같이 초기에 나온 스테레오만 지원하는 SACD 플레이어에서는 DST 재생을 지원하지 않기 때문이다. 그리고 후에는 결국 2채널도 DST로 압축하여 같이 압축된 5.1채널도 SACD에 같이 수록하게 되었다.

만약 SACD에 2채널만 기록한다면 싱글 레이어에 최대 95분까지 기록할 수 있도록 표준이 되어 있다.

DST의 압축 기술은 Adaptive Prediction Filter를 사용하는 Arithmetic Coding 기술로 H.264에서 사용된 CABAC(Context-adaptive binary arithmetic coding)과 같이, 확률적으로 다음에 나타날 값을 예측하여 binary code를 re-allocation하는 방식을 사용, 저장에 필요한 용량을 약 40% 내지 50%의 크기로 줄여주게 된다. 통상 0과 1이 나타날 확률이 전체적으로는 50 대 50이지만, 이 비율이 시간에 따라 서서히 변화되고 있는 경우, 이러한 Adaptive Prediction Filter를 사용하는 Arithmetic Coding이 Entropy Coding에 매우 유용하다. 더 자세한 기술 내용은 이 위키 문서(일본어)를 참고하자. 거의 절반에 가까운 높은 압축률을 자랑한다.

하지만 실제 5.1채널이 들어 있는 SACD에 경우 2.0과 5.1채널이 DST로 압축된 경우가 있으며 또 2.0채널이라도 DST로 압축된 경우가 있다.
대표적으로 대만에 한정판으로 판매된 앨범인 이츠와 마유미 - 好時代珍藏系列 回憶錄… 가 그런 경우이다. 그리고 무손실 압축이라고 하지만 이상하게 2채널에서는 22kHz 음역대가 잘리는 경우가 있다. 위에서도 서술했듯 DST는 무손실 압축 기술이기에 이런 손실이 없어야 하는데 의왜로 많은 앨범들이 22kHz에서 잘리는 경우가 많다.

파일:Hi-ResDSD08.jpg
카펜터스 - single 1969-1981 : Goodbye to Love 음원
스펙 : SACD DST 2.0채널 압축 음원 변환 16Bit/176kHz

파일:Hi-ResDSD21.jpg
제네시스 - The Lamb Lies Down on Broadway : it.
스펙 : SACD DST 2.0채널 압축 음원 변환 16Bit/176kHz

2채널 버전에서 용량압축을 극대화하려고 자른 것으로 보기에는 DST 음원중에는 잘리지 않는 것을 보면 충분한 압축률을 가지고 있기에 그런 것은 아닌 것 같으나 마스터링에서 문제가 있는 것인지 아니면 다른 문제가 있는 것인지는 알 수 없고 보통 2000년도 초에 발매된 SACD에 DST 2채널에서 이렇게 주파수가 잘린 경우가 많으며 2005년 후에 나온 앨범들에서는 제대로 나오는 경우가 많다.

소니 방식은 DSF(DSD Stream File)이며 2005년[27] 소니가 정한 규격으로 DST를 사용할 수 없기에하지 않는 무압축이며 그렇기에 용량이 큰 편[28]이지만 ID3TAG를 사용하기에 태그 편집과 앨범 아트등을 넣을 수 있고 무엇보다 DSD를 지원하는 대부분은 DAP,스마트폰,무선 스피커등이 기본적으로 지원하는 포맷이며 DSD를 판매 유통하는 사이트들이 사용하는 포맷도 다 DSF이다.

WSD(Wideband Single-bit Data)는 1bit 오디오 컨소시엄 (와세다 대학, 샤프, 파이오니어의 공동 그룹)에서 개발한 포맷으로 채널 수와 샘플링 주파수 제한이 없으며 다양한 형식의 데이터에 대응할 수 있도록 설계되었으며 사양이 공개되었다고 한다. 하지만 DFF 보다 더 심하게 재생할 수 있는 기기가 매우 적은 게 단점이다.

DSD도 보통 64~512 외 다른 형태로도 불리고 있는데 DSD64는 그냥 DSD. DSD128은 더블 DSD, DSD256은 쿼드 DSD, DSD512는 옥타 DSD로 불리고 있으며 32Bit/384kHz는 DXD[29]로 불리고 있다. DSF로는 음원 압축이 안 되는 문제가 있고 쿼드 DSD 급은 용량이 비효율적으로 크기에 보통은 더블 DSD(DSD128)까지만 사용하고 있다.

파일:DSD64~256.png
DSD 샘플링별 양자 노이즈 시작 지점

DSD 자체가 단순한 구조로 되어있다 보니 이런 업 샘플링 업그레이드 방식을 사용했는데 추후 SACD의 성공으로 후속 미디어가 나왔을 때 업그레이드로 업 샘플링만 시켜서 우려먹을 계획이었는지도 모른다.

6 음원 종류

해당 문서 참조

7황금귀들은 DSD 음원을 선호하는가?

황금귀들은 하이 레졸루션 오디오(고해상도 PCM 음원) 보다 DSD 음원을 선호하는 경우가 많은데 대표적인 이유로 저음의 질과 전체적 음의 정보량이 많으며 더 부드럽고 아날로그 스럽다는 이유가 대부분이다. 위에 언급한 DSD의 문제점대로 DSD는 기존 PCM과 다르게 매우 불안정한 음원으로 이러한 구조 때문인지 아니면 보급된 DSD 마스터링 레코딩 시설 때문인 지 DSD만의 독특한 음색을 가지고 있다.

일단 이러한 언급을 하기 전 SACD가 나왔던 시기로 돌아가서 황금귀들 사이에서는 CD 오디오(이른바 'PCM 음원')에 대해서 매우 부정적인 의견을 많이 가지고 있었는데 CD 오디오 음질은 딱딱하고 날카롭다는 평이였다. CD 오디오가 처음 나왔던 시기엔 LP의 문제점이었던 노이즈와 전체적 음역대 표현력을 해결한 획기적인 음향기기였기에 어둡고 탁한 음색의 LP와는 다르게 컴프레싱[30] 작업 시 맑고 선명한 음을 내도록 마스터링되었다. 문제는 이런 음색 조정으로 인해 중, 고음이 올라가다 보니 저음도 밝은 성향으로 되고 중, 고음에 치찰음이 심해지는 문제가 있었는데 이런 음색으로 인해 다시 LP를 선호하는 빈티지 황금귀들이 등장하기 시작했으며 1993년부터 LP가 다시 부활하는 계기가 되었으며 특히 2000년 초엔 미국내 LP 판매량이 140만장이 넘을 정도였으니 SACD가 나왔던 이 시기에서도 소니, 필립스에서도 이런 점을 고려하여 DSD 마스터링 음색을 조정했을 수도 있다.

하이 레졸루션 오디오 음원이 기존 CD에서 업그레이드된 부드럽고 섬세하고 풍부한 밝은 음색이라면 그와 반대로 DSD는 LP 쪽에 가까운 음색이라 할 수 있는데 저음이 많고 음이 따뜻한 성향이며 음선이 두텁고 차분한 성향을 가지고 있다. 하이 레졸루션 오디오의 측정 스펙트럼으로 봐도 무손실이라는 점에서 분명 원본에 매우 근접한 음과 초고역대 노이즈도 없고 품질도 우수하다. 그리고 청음상으로도 분리도와 섬세함과 분리도에서 하이 레졸루션 오디오가 객관적으로도 분명 좋은데 청음상으로 가면 오히려 DSD가 황금귀들이 선호하기 좋은 음색 조건을 갖추었으며 특히 1950~80년대 팝과 재즈,포크 등의 장르에서는 DSD의 특유에 음색 덕분에 하이 레졸루션 오디오보다 더 매칭이 좋다.

카펜터스 - single 1969-1981 앨범의 DSD 음원의 경우 하이 레졸루션 오디오 음원(24Bit/96kHz)과 차이가 많이 난다. [31]

그리고 에릭 클랩튼의 461 Ocean Boulevard 음원도 꼽을 수 있는데 그중 I Shot the Sheriff를 기준으로 DSD마다 음색 차이는 이렇다.

24bit/192kHz 461 Ocean Boulevard : 저음이 많고 음이 탁함
SACD 461 Ocean Boulevard 2010 일본 한정판 : 저음이 약간 적고 중, 고음이 약간 맑음
SACD Timepieces: The Best of Eric Clapton : 저음이 더 적고 중, 고음이 맑고 더 명료함

그리고 DSD의 문제점에서 상술한 대로 DSD는 자체가 내부적으로 불안정한 구조를 가진 까다로운 음원이기에 이로 인해 DAC 성능에 의한 음색차가 심한 편이기에 각 DAC에서 어떤 필터를 적용하고 어떤 범위까지 DoP를 적용하였는지 샘플링은 어떻게 하였는지 등으로 인해 음색이 많이 달라지며[32] 특히 소프트웨어 튜닝으로 인한 것까지 포함하면 그 다양하고 방대한(!?) 조합 방식으로 인해 다양한 음색이 구현 가능하기에 자신들만이 좋아하는 음색으로 튜닝이 다양하게 가능하기에 튜닝 좋아하는 하드코어 황금귀들로서는 매우 매력적인 요소로 적용된 점도 있다. 백금 바른 DAC 나오는 게 아닌가 걱정된다.

DFF와 DSF 간에 음질이 차이가 난다는 황금귀의 주장이 있는데, DFF이던 DSF이던 최종적으로 DAC에 전달되는 스트림은 동일한 내용이어야 한다. PC에서 파일을 알집으로 압축하던 pkzip으로 압축하던 rar로 압축을 하던 원본과 달라질 리가 없는 것과 마찬가지이다. DSF 파일은 압축되지 않은 DFF나 혹은 DST로 압축된 DFF 포맷을 디코드한 후 DSF 포맷에 맞게 다시 인코드한 것 뿐이어야 한다. 하지만 실제 PC에서 동작하는 많은 변환 툴이 DFF 디코더와 DSF 인코더를 조합한 조악한 성능의 프로그램으로서, DSD(=DFF) 가 중간에 PCM으로 변환되었다가 다시 DSD(=DSF)로 인코딩되는 경우가 있다. 이는 DSD 의 개념을 이해하지 못한 프로그램 설계자가 돌아다니는 오픈 소스를 가지고 프로그램하다가 만든 병크로 중간 변환된 PCM의 샘플레이트가 44.1kHz로 설정되어 있으면 결과적으로 재생 대역이 22kHz로 줄어들게 된다.

제대로 만들어진 변환 툴이라면 무손실 변환을 하고 있으니, 이를 잘 찾아 사용하기 바란다.[33] 가끔 DSF의 경우 레코딩 회사에서 SACD 용으로 직접 레코딩한 다이렉트 레코딩이거나 원본 아날로그 음원에서 리마스터링한 음원이기에 DSF가 기존 판매된 SACD와 차이가 없을 것이니 음질이 더 좋은 것이라고 생각하는 사용자들도 있다. 하지만 실제 판매되는 DSD 음원은 DSD 레코딩 시설을 갖춘 곳에서는 그대로 원본을 빼서 넣기에 차이가 없거나 리마스터링해서 더 나을 수 도 있다. 그러나 귀차니즘으로 그냥 SACD의 DFF 포맷을 뽑아서 DSF로 변환하여 파는 망할 레코딩 회사도 있다. 첫 트랙에 앞 부분이 원본과 다르게 2~3초 공백 트랙이 있다면 100% SACD에서 뽑아다가 변환한 거다.

8 DVD-Audio와의 경쟁

SACD가 DVD-Audio와의 경쟁에서 이길 수 있었던 것은 플레이어의 고가 정책에 의한 차별화 전략 때문이다. DVD-Audio 의 경우 웬만한 DVD 플레이어에서 재생이 가능하였고, 플레이어의 지속적인 가격 하락 경쟁으로 고급 이미지가 탈색된 반면, SACD 전용 플레이어는 오디오 전용이라는 이유 때문에 전문 오디오 회사 위주로 제품을 출시하면서 고가 정책이 가능하였다. 또 하나, PS3 커펌으로 SACD를 립핑하기 전에는 DVD-Audio에 비해 SACD는 읽을 수 있는 매체가 오직 SACD 플레이어였고 그리고 불법 복제가 어렵다는 점과 DSD 특성 상 변조가 어렵다는 장점으로 인해 여러 레코드사에 참여하면서 승리할 수 있는 장점이 되었다.

뭔가 다른 차별성을 기대한 오디오필들에게 상대적으로 DVD-Audio 대비 비싸고 크고 무거운 SACD플레이어 덕분에 고급 제품이라는 인식을 가져올 수 있었다. 이런 시장 전략으로 SACD는 승리하여 DVD-Audio를 2007년 사장시키는 데 성공하였다. 그러나 SACD 역시 언론에서는 실패로 간주하고 있으며 업친대 겹친격으로 같은 시기에 발표된 SACD와 CD와의 같은 불륨에서의 음질 차이는 발견하지 못했다는 논문(?)도 발표되었다. 이런저런 이유가 있긴해도 지금까지 SACD 앨범이 지속적으로 발매 되고 있는 것으로 보면 그럭저럭 수요가 있는 듯하다.[34]

현재는 DSD64~256 인코더와 디코더도 제공되고 있으며, 소니의 PCM-D100 처럼 DSD 레코딩이 가능한 소비자 제품도 있어, 차츰 소비자 인식이 넓어지고 있다. 그래도 시장 사정상 호환성에서 그렇게 효율적인 포맷이 아니고, DSD128을 지원하는 제품이 많지 않기에 DSD의 미래가 썩 좋은 편이라고 얘기하기에는 이르다.

그러나 여러 고급 DAC들이 꾸준히 Native DSD를 지원하고 있고, 많은 음원 판매사이트에서 DSD 음원을 취급하여 황금귀들의 좋은 평가가 이어지고 있으며, 2015년 말부터 포터블용 ESS Sabre 9018 칩(ES9018K2M)의 보급으로 DSD128 디코딩의 관심이 부각되고, 최근에는 소니의 LP PSH-X500으로 DSD128 레코딩이 가능해지는 등, DSD가 부활할지도 모른다는 전망도 있다.

9 DSD 인코딩/변환 관련 팁

DSD 인코딩
PCM을 DSD로 인코딩하여 DSD 재생을 지원하는 DAC이나 DAP로[35] 감상하는 비효율적 위키러에게 팁을 준다면 만약 변환해서 감상할 경우 DSD64보다는 DSD128을 권장하며 변환 재생 소프트웨어가 DSD256도 지원한다면 DSD256으로 해도 괜찮다. 위에도 상술 했듯 DSD의 샘플링 주파수가 높을 수록 용량이 엄청나게 커지지만 그만큼 초 고음역대 노이즈 구간 범위가 높아지기에 원본 PCM 음원의 손실도가 줄어든다. 그렇기에 매우 단순하게 생각해서 DSD를 지원하는 DAC에 스펙에 맞춰 DSD인코딩 음질 스펙을 최고로 올리면 된다. (...)

그래도 효율성을 따진다면 비트 정밀도 상관없이 샘플링 주파수 기준으로 44,48kHz는 DSD64를 88,96kHz는 DSD128을 176,192kHz는 DSD256이 좋으며 체배 수 샘플링을고려해서 44,88,176kHz 샘플링이 재 변환을 안해도 되기에 음질적에서는 이 주파수대가 DSD 변환에서 최적의 음질을 낸다고 보면 된다.


DSD 변환
대부분의 무선 스피커나 네트워크 플레이어등에서는 DSD를 지원하지 않기에 변환은 필수 라고 할 수 있다.

DSD에서 PCM으로 변환하는 것은 용량이나 효율면에서 의미가 있으나, 그 반대로 PCM을 DSD로 변환하는 것은 아무런 장점이 없으며 오히려 음질이 나빠질 수도 있고 압축이 안 되서 용량이 쓸데없이 커지기에 권하지 않는 편이다. 일부 황금귀 양반들이 PCM을 DSD로 변환하여 음질이 더 좋아지는 경험을 했다고 말하는 경우가 있는데, 이는 플라시보 효과이거나 PCM을 DSD로 변환시 달라진 노이즈 특성에 귀가 반응하거나 (가끔 나이드신 분들은 적당한 고역 노이즈에 대해 뽀사시 느낌을 받는다), 그게 아니라면 가지고 있는 시스템의 DAC 회로가 DSD 입력 때와 PCM 입력 때 다른 특성을 보이는 경우였을 확률이 크다.

SACD를 DSD로 변환하면 첫 1번 트랙이 3~4초(공백) 정도 늘어나는데 다른 변환 프로그램을 사용해도 마찬가지. 물론 PCM 변환도 똑같이 3~4초 정도 늘어난다. 다만 SACD 자체에서 재생하면 시간은 제대로 나온다.

DSD64를 PCM 음원으로 변환하려면 24bit/88.2kHz와 24bit/176kHz 두 가지 스펙을 권하고 있는데 DSD스펙에 비해 오버스펙으로 샘플링한 것을 알 수 있다. 16bit/176kHz가 동일 비트레이트 스펙이지만 DoP 규격 기준은 24bit/176kHz PCM을 기본으로 하고 있으며 그리고 대부분의 인코더도 이에 맞춰 24bit/176kHz로 하고 있거나 또는 오버해서 24bit/352kHz로 하는 경우가 있다. 이런 오버스펙은 위에 상술했듯 DSD의 샘플링 주파수때문인 것이다. 그래서 대부분의 음원판매 사이트에서도 DSD를 PCM으로 변환한 음원은 24bit/88.2kHz와 24bit/176kHz으로 변환해서 공급하고 있다.

48kHz/192kHz를 사용하지 않는 이유는 48~192kHz가 DSD의 샘플링 주파수 2.8224MHz의 체배주파수가 아니기 때문이다. 즉, 176.4kHz는 2.8224MHz의 1/16 이고, 88.2kHz는 2.8224MHz의 1/32 이기 때문에, DSD를 PCM으로 변환 시 쉽게 구현 가능하지만, 48이나 96, 192kHz의 샘플링 주파수는 비동기 샘플레이트 변환이 필요하며, 이 때 자칫하면 음질 손실이 발생할 수 있다. 하지만 이걸 PCM 변환해 판매하는 곳은 24bit/88.2kHz와 24bit/176kHz 뿐만 아니라 24bit/96kHz로 해서 판매하는 곳도 있는데 대표적으로 아쿠아플러스 음악을 독점으로 레코딩하는 F.I.X. RECORDS가 대표적이다.

그렇기에 DSD를 PCM으로 인코딩할때 이 두스펙(24bit/88.2kHz, 24bit/176kHz)에서 선택해야 하는데 어렵게 선택을 고민할 필요는 없다.

파일:Hi-ResDSD07.jpg
가장 원본에 가깝게 하려고 한다면 24Bit/176kHz로 하면된다. 이부분은 DSD에 특성상 높은 샘플링 주파수를 위해서 양자노이즈에 포함된 고주파수를 살리는 것에 의의가 있다. 트위터에 무리가 갈 수 있으나 요즘은 대부분 DAC에서 해당 음역대를 잘라버리는 경우가 있고 그리고 어지간한 싼 트위터가 아니고선 무리가 안간다는 의견이 많다. 그래도 걱정되면 30kHz LPF 필터를 해주면 된다. 참고로 DSD 마스터를 PCM으로 변환해서 판매하는 음원 사이트에서는 아예 안하는 경우도 있다. 특히 마이클 잭슨 Thriller, 사운드가든 Superunknown 앨범이 대표적인 예이다. 하지만 SACD마다 양자노이즈에 차이가 많기에 해당 문서 참조를 참고하자.

파일:Hi-ResDSDSorce03.jpg
현실적인 선택을 한다면 24bit/88.2kHz가 최적이다. 이 설정을 하면 용량도 줄일 수 있을 뿐더러 양자 노이즈도 필터를 안해도 될만큼 44.1kHz부분에서 잘라버리며 그리고 어지간한 올드팝,락등에서는 30kHz를 돌파하는 주파수가 드물기에 용량과 효율과 필터부분에서도 상당히 효율적인 부분이다. 청음상에서도 24Bit/176kHz와 구분하기 매우 어려울 정도로 유사한 음질을 들려준다.


DSD를 PCM으로 변환할때 LPF설정을 잘 해야 하는데 이게 프로그램마다 달라서 명확한 기준을 잡기가 힘들지만 보통 3가지 기준으로 나뉜다. 24kHz, 30kHz, 50kHz로 필터 기준을 정할 수 있는데 너무 낮게 잡으면 고역의 다이나믹 레인지가 손실되어 버리고(어차피 가청 영역 이상 범위라 상관없지만) 너무 높게 잡으면 고주파 노이즈가 많이 남게 된다. 설정에 따라 미세하지만 음질적 차이가 발생하니 들어보고 본인의 취향대로 설정하면 된다. 하지만 대부분 요즘 스마트폰, DAP플레이어는 로우패스로 대역을 잘라버리기에 어느 쪽이든 그다지 크게 문제될 것은 없다. 다만 문제는 PCM 재생시에는 기본적으로 DSD와 다르게 대역 필터가 없기에 왠만하면 해주는 것이 좋다. 만약 이 과정을 거치지 않을 시 40kHz 이상을 제대로 재생하는 고성능 DAC로 재생하면 스피커 트위터 무리가 갈 수 있으니 주의하자.

SACD 중 멀티 채널(5.1채널)의 경우 2채널과 5.1채널이 같이 들어 있는데 이걸 DSF나 PCM 음원으로 변환한다면 원본과 동일한 음색은 2채널을 권하고 높은 음역대와 담백한 색다른 음색을 찾는다면 5.1채널을 권한다. 먼저 2채널의 경우 위에도 DST에도 상술 했듯 CD와 동일하게 22kHz에서 잘려 있으며 5.1채널은 24kHz이상의 주파수를 가지고 있다. 하지만 5.1채널용으로 제작되다 보니 원본 음악과는 약간은 다른 음색을 가질 수 있으니 주의하자.[36] 그리고 DST로 압축된 SACD를 DFF로 변환하면 DST 압축 그대로 유지되기에 용량을 많이 줄이긴 하지만 DSF나 또는 PCM으로 변환하면 용량이 엄청나게 커진다. (최대 9GB 이상) 합리적인 용량으로 스마트폰 & DAP로 감상하려면 5.1채널을 2채널 PCM 으로 재변환해서 용량을 줄이고 추가로 6db정도 볼륨을 뻥튀기시키는 것을 권한다. 불륨 뻥튀기를 해야 하는 이유는 2채널 DSD보다 5.1채널 DSD는 볼륨이 더 작기 때문이다. 하지만 이런 조절 방식은 높은 볼륨으로 인해 클립핑이 일어나서 음이 찌그러지는 잡음 문제가 있으나 스마트폰 특성상 볼륨이 제한되어 있기에 이 방법을 사용해야 한다. 그래서 클리핑이 최소화된 볼륨을 6db로 잡은 것이다.

DSD로 인코딩한다면 DSF 포멧이 테그 편집과 앨범아트 삽입이 가능하기에 가장 권하는 포멧이지만 DSF는 인코딩 과정에서 중간에 거처가는 과정 (특히 DST에 경우 압축 풀어 제 DSF 인코딩)이 있기에 DST 압축등을 고려해서 가장 SACD원본에 가까운 포멧은 DFF이다. DFF에 경우 테그 편집과 앨범아트를 넣을 수 없는 문제가 있지만 무엇보다. 황금귀들은 DFF 쪽이 음이 좀더 힘있고 풍부하다고 해서 DFF를 더 선호하는 경우도 있다. (중간에 PCM 변환하는 인코더를 사용했나?) 해당 미니기기가 CUE를 지원한다면 가장 SACD 원본에 가까운 이상적인 음원이라는 장점도 있긴 하지만 지원되지 않는 재생기기도 있고 DST압축을 지원하지 않는 기기등도 있기에 별로 권하지 않는다.

10 여담

SACD가 실패한 이유는 일단 플레이어가 너무 크고 무거우며 (기본 30kg) 가격이 고가에 형성되어 있다 보니, 특히 한국에는 음반이 매우 적었으며 더욱이 제대로 된 SACD/DSD 음원은 그 레코드 회사가 DSD 기반으로 시설을 갖춰야 했기 때문이다. 이런 환경이 갖춰지지 못한 회사는 PCM 음원을 그대로 DSD로 변환해서 제대로 된 성능을 살리지 못하는 문제점이 있다.[37] 현재 DSD 레코드 시설을 갖춘 대표적인 회사는 일본의 F.I.X. RECORDS[38]로, 이 곳에서는 모든 것을 DSD로 하고 있으며 PCM 버전으로 판매한 것도 DSD를 변환해서 한 거라 30kHz 이상에서는 특유의 양자 노이즈가 있다. 최근에 나온 티아라 투 티어즈2 보컬 앨범은 부분을 많이 필터링해서 제거하였지만 그래도 약간은 남아 있다.

예전엔 스펙이 딸려서 못하였지만 요즘은 스마트폰이 워낙 스펙이 괴물같이 좋아져서 DSD도 감상이 가능하다. 대표적으로 온쿄 HF, 뉴트론 뮤직 플레이어[39], iOS의 NePLAYER인데 안드로이드라면 온쿄 HF를 추천한다. 왜냐하면 위에도 서술했듯 DSD는 PCM보다 불륨이 낮은 편이라 온쿄 HF는 6db 정도 출력을 업시켜 재생해 준다. 참고로 DSD를 PCM으로 변환하여 재생하기에 정확한 재생 방식이 아니다.

DSD를 PCM으로 재생하는 방식의 재생 플레이어나 DAC 들은 스펙 규격이 DAC의 성능에 따라 다르겠지만 24Bit~32Bit 192kHz~352kHz 또는 384kHz로 엄청 넓게 주파수를 잡고 재생하는 비 효률적인 DSD → PCM 변환 방식을 사용하기도 하는데 아마도 DSD의 2.8224MHz로 인한 임펄스 값을 살리기 위해 Anti-aliasing filter를 가급적 slow-slope의 Filter로 필터링하기 위해 이렇게 오버 샘플링을 잡아서 재생하는 듯하다. 이러한 DSD to PCM 변환시, PCM 샘플링 주파수의 선택과 Anti-aliasing filter의 방식(=IIR filter 차수 또는 FIR filter의 tap 수)에 따라 배터리 소모량이 달라 재생시간이 많이 줄어드는 비 효율적인 문제를 야기할 수 있다. 이 처럼 DSD 자체가 워낙 엽기적인 스펙이기에 그만큼 DSD to PCM 변환 DAC은 그 자체 성능 즉 DAC의 로우 패스 지점과 필터, 성능 등의 차이가 DSD 변환 재생에 영향이 많이 받는 편이다. 만약 DSD to PCM 변환하여 재생을 하는 DAC을 찾는다면 32Bit/352&384kHz를 지원하는 DAC을 고려하자.

스마트폰 중 Native DSD를 재생 가능한 제품은 LG V10으로 새롭게 바뀌어서 탑재된 ESS 9028C2M DAC 덕분에 DSD의 하드웨어 재생을 지원하게 되었다. 최대 DSD128까지 지원하며 DSF로 되어 있어야 한다. V20에서도 재생이 가능하며 여기다가는 무려 4개의 DAC를 때려넣었다!

팟플레이어 스킨 확장자인 DSF와 동일하기에 재생되는 줄 알고 클릭하면 재생이 안 되고 스킨을 추가하겠냐고 물어보니 주의하자.

DSD 음원을 감상하는 사람을 무조건 무시해서는 안 된다. 왜냐 하면 고음질 음원중 DSD로만 나온 앨범이 많기 때문에 SACD로만 감상할 수 있는 앨범이 많은데 예를 들어 하마사키 아유미의 최후의 밀리언셀러 앨범인 MY STORY의 고음질 & 5.1채널 음원은 오직 SACD로만 나왔으며 노라 존스의 Come Away with Me의 5.1채널 음원은 오직 SACD에만 수록되었고 야마구치 모모에, Suara 등의 앨범도 상당수 SACD로만 출시되었다. 복제율이 낮다는 이유로 SACD로 리마스터링 출시하는 음악이 2016년이 넘어도 계속 나오고 있다.

SACD의 음질에 의문을 제기한 사람들도 많았으나 SACD에 있는 DSD 음원을 분석할 수 없었기에 그다지 의문을 제기하지 못해 왔다. 하지만 PS3로 립핑이 나오면서 이런 경우가 발견되면서 논란이 되기도 하였다. 이 경우는 DST 압축을 해서 그런 것인데 DST 압축을 하면 더 많은 음악을 넣을 수 있지만 2.0채널 압축은 22kHz 이상의 주파수가 잘려버리는 문제점이 있다. 하지만 대부분의 SACD는 DST압축을 쓰지 않는 경우가 많기에 이런 경우는 매우 드물다고 할 수 있으며 설령 DST 압축으로 2.0채널이 잘려도 CD와는 다른 음색을 내준다.


PCM으로 레코딩된 음원을 DSD로 변환 후 SACD로 발매하는 일이 많아 이것을 비난하는 경우가 있는데 이것이 사실 비난의 여지가 될 수는 없다. 레코드 회사에서는 당연히 수익성이 높고 그나마 보급이 된 쪽으로 해당 앨범을 내는 것이 당연한데 이것이 문제라면 레코드 회사보고 망하라는 말과 같으며 오픈 릴 테이프로 마스터링 된 음반은 CD로 내면 안 되고 오직 테이프와 LP로만 출시하라는 억지나 다름 없다.

같은 앨범의 하이 레졸루션 오디오 버전과 DSD 버전을 같이 파는 사이트 대부분은 DSD를 더 비싸게 파는 경우가 있는데 일본 쪽은 그나마 둘 다 같은 가격으로 판매하지만 외국과 국내는 좀더 값을 쳐서 판다.

2000년대 초에는 혁신(!?)의 기술이다 보니 오픈릴 테이프를 DSD 마스터한 경우가 많았다. 예를 들어 롤링 스톤즈의 모든 앨범을 DSD 마스터[40]하고 마이클 잭슨의 최고 명반 Thriller도 DSD 마스터하는 업적을 이루기도 했다.

SACD에 경우 2000년 초기와 후기로 나눠지는데 초기에 나온 SACD음반은 오픈릴 테이프 기반이지만 후기에 나온 것은 오픈릴 테이프에서 하이 레졸루션 오디오로 복원하고 다시 DSD로 변환한 음원인 경우가 대부분이다.

DSD 음원의 경우 출처 신경을 많이 써야 한다. 왜냐면 가짜 DSD도 있기 때문이다. 예를 들어 ClariS에 DSD64~256 까지 나온 カラフル, コネクト, ルミナス의 DFF 음원의 경우 100% 가짜다. 출처 자체도 없고 거기에 ClariS에 음원에 경우 음원 종류에서도 볼 수 있듯 원래 부터 소니 뮤직에서 디지털 마스터링 한 음원이기에 이걸 그대로 DFF로 변환한 것이기 때문이다. 이미 원본은 하이 레졸루션 오디오 음원으로 판매중이기에 괜히 용량 낭비하는 쓸대 없는 짓 하지 말자.

모든 트위터가 무리가 가는 것은 아니다 저렴한 트위터는 작살이 날 지도 모르겠지만, 30kHz 이상의 대역에 실려있는 Shaped Noise는 약 RMS level 로 환산시 -23.5dBFS 정도로 볼륨을 너무 높이지만 않는다면 정상적으로 트위터를 망가뜨릴 수준은 아니다(-23.5dB의 수치는 "Resolution Magazine"의 2004년 7/8월호에 실린 Mikael Vest 의 "The advantages of DXD for SACD"에서 설명되어 있다. DSD 변환시 100kHz 이하에서 발생하는 Shaped Noise의 RMS 값은 전대역의 약 1/15(=100kHz/1.4112MHz)에 해당되는데, 이를 데시벨로 계산해보면 유사한 값을 얻게 된다). 하지만 저렴한 트위터의 경우 내구성이 좋지 않다 보니 장시간 Shaped Noise 에 노출될 경우 보이스 코일의 발열에 의해 열파괴가 일어날 가능성이 충분히 있다.

DSD에 지터에 경우 DSD는 오히려 샘플링 주파수가 CD보다 높기 때문에, 이론상 지터가 감소한다. 하지만 플레이어의 하드웨어를 구현함에 있어 시스템의 구조에 따라 지터가 CD보다 더 심할 수도 있고 아닐 수도 있다. CD의 경우 정해진 시스템 클럭에 100% 동기화된 시스템이었으나, SACD 플레이어나 DVD-Audio 지원의 유니버설 플레이어는 그렇지 않으며 때문에 하드웨어 설계자의 노하우에 따라 지터 성능이 떨어질 수 있다.

소니에서 LPF를 사용하는 이유는 양자 노이즈를 제거 하기 위해서 아니라 디지털 불륨 기능을 사용하기 위해 어쩔 수 없이 PCM 변환을 해야 하고 그 과정을 LPF를 사용하고 있는 것이라는 SACD 개발자의 주장도 있다.

Mobile Fidelity Sound Lab Inc.에서 출시하는 SACD는 이전에 초창기 선 발매된 SACD와 그리고 후에 디지털 복원 발매된 하이 레졸루션 오디오 음원과는 다르게 원본 오픈 릴 테이프을 리마스터링 한 후 새로 레코딩하여 복원한 DSD인데 얼마나 다르냐면 밥 딜런 - Highway 61 Revisited SACD와 후에 출시된 하이 레졸루션 오디오 음원에서는 거의 동일하게 노이즈가 있는 반면 Mobile Fidelity Sound Lab Inc.에서 발매된 SACD에 경우 이런 노이즈가 제거 되고 이런 노이즈 제거로 인한 음원 손실이 최소화되고 매우 깔끔하게 복원된 스펙드럼을 확인할 수 있다. 그렇기에 리마스터링이긴 해도 2010년 후반 오픈 릴 테이프 복원 음원을 감상하고 싶다면 MFSL에서 출시한 SACD 앨범을 구입하면 된다. 참고로 한정 판매한다. 하이 레졸루션 오디오로 공개 안된 앨범도 은근히 많이 있다.
  1. PDM(pulse-density modulation) 기술에 기초한 방식으로 CD 플레이어용 DAC 구현에 활용되었다.
  2. 당시 1982년 CD 개발 이후 벌어먹던 라이센스가 만기되어서 이에 대한 대안으로 새로운 미디어가 고려되고 있었다.
  3. CD의 탄생이 1982년이므로, 특허 기간 20년을 기준하여 2000년대 초가 되면 CD의 특허는 만료될 예정이었다.
  4. 디지털 오디오에 대한 많은 정보가 있으니 관심 있는 위키러는 읽어보자. 단 영문이다.(...)
  5. 나중에 호환성의 중요성을 깨달은 디스크 제작 업체들은 DualDisc 라고 하여, 더블사이드 포맷으로 CD 면(面)과 DVD-Audio 면을 가지는 변종 디스크를 만들기도 했다.
  6. [1][2] 참조.
  7. PCM 이론의 가장 큰 맹점은 나이퀴스트 이론에 근거하여 에일리어싱이 일어나지 않도록 기록 재생 가능한 주파수 대역을 샘플링 주파수의 절반으로 제한해야 한다는 점이다. 이 때문에 CD에서는 brick-wall filter라 하여, 20kHz 이상의 대역을 칼로 자르듯 급격히 필터링해야 했는데, 그것이 음질적으로 매우 나쁜 결과를 초래한다는 주장이 있다. 이는 하이 레졸루션 PCM에서도 그대로 이어지는데, 192kHz 샘플링 주파수를 사용해도 90kHz 이상의 대역을 필터링해야 한다. 하지만 델타 시그마 변환을 하는 DSD의 경우, 샘플링 주파수가 상대적으로 높아 에일리어싱 현상을 무시해도 되며, 따라서 brick-wall filter에 의한 음질 열화를 피할 수 있어, 아날로그에 가까운 특성을 재생한다는 주장이 가능하다.
  8. 델타 시그마의 이론에서는 100kHz 이상의 대역도 기록 재생이 가능하다. 하지만 필립스와 소나가 공개한 초기 SACD 공식 문서(Super Audio CD - A Technical Overview)에서는 재생 대역을 100kHz까지로 정의하고 있으며, 실제 필립스가 제작한 SACD 테스트 디스크에도 100kHz까지 신호가 기록되어 있다.
  9. 64의 뜻은 CD 샘플링 주파수의 64배라는 뜻이다.
  10. 실제로는 손실 압축으로 멀티 채널 기록이 가능하다. 드물긴 하지만, 돌비 디지털이나 DTS가 CD로 발매된 바 있으며, 그러한 디스크를 재생하여 SPDIF 연결로 AV 리시버 등의 기기를 통해 재생하면 멀티 채널을 감상할 수 있다.
  11. 델타 시그마 변환 시 다이나믹레인지는 Noise Shape Filter의 차수에 따라 달라지며, 통상 DSD의 표준으로 제안하는 5차 내지 7차의 Noise Shape Filter를 사용하는 경우 120dB의 다이나믹 레인지를 얻을 수 있다.
  12. 양자 노이즈로 인해 30kHz정도 유효 재생 범위다.
  13. 멀티 채널 SACD 디스크는 5채널 혹은 5.1채널까지 지원되며, 통상의 경우 2채널 음원도 같이 포함되어 있다. 용량이 크기에 대부분 DST압축을 사용한다.
  14. DSD 신호라 하더라도 최종적으로는 아날로그로 변환되어 앰프와 스피커를 통해 소리가 나야 하므로 어떻게 DSD를 아날로그로 변환할 것이냐는 문제인데, 첫째, DSD를 직접 아날로그로 바꾸거나, 둘째, DSD를 PCM으로 바꾸어 다시 PCM을 아날로그로 바꾸는 방법을 생각해볼 수 있다. 하드웨어 재생 방식으로는 이 두 방법이 모두 가능하며, 소프트웨어 재생 방식은 오직 두 번째 방법만 가능하다고 이해하면 된다.
  15. 꼭 그런 것은 아니다. AKM에서 나오는 DAC 칩은 아직까지도 DSD 입력을 지원할 경우 Native DSD로 재생할 수 있는 옵션을 제공한다. 다만 Native DSD 재생 옵션에서는 볼륨 처리 등의 다양한 기능을 사용하지 못하는 제약이 발생하게 된다. 이와는 달리 최근의 ESS Sabre DAC 칩의 경우, Native DSD 재생의 옵션이 아예 없으며 입력된 DSD를 내부에서 PCM 변환 처리한다(실제로 ESS Sabre 칩에 의해 재생되는 신호를 분석해보면 이를 확인해볼 수 있다. 믿거나 말거나...).
  16. SACD 초창기의 DAC 칩은 대부분 Native DSD를 재생할 수 있는 옵션을 제공하였었다. 예를 들어 울프슨 마이크로일렉트로닉스(지금은 시러스로직에 인수되었다.)의 WM8741 DAC에는 Direct DSD 모드와 PCM-coverted 모드를 모두 지원한다.
  17. 실제로는 이를 다시 델타 시그마 방식으로 PWM 처리하여 재생한다. 사실 최근의 DSD 입력 DAC 칩은 DSD 입력을 받아 PCM으로 변환하는 것 외에는 PCM DAC와 구조적으로 큰 차이가 없다.
  18. 100% Pure Native DSD 재생을 위해서는 아날로그 방식의 볼륨 처리가 반드시 필요하다. DSD 신호는 PCM으로 변환하지 않는 한, 디지털적으로는 볼륨 처리가 불가능에 가깝다. 예를 들어, Native DSD DAC이라 잘못 소문난 ESS Sabre 9018도 볼륨 제어를 위해 DSD 신호를 내부에서 PCM 변환 후, 다시 수십 MHz의 매우 높은 샘플링 주파수의 멀티 비트 PWM으로 재양자화하여 처리한다. 이런 칩 내부의 구조를 모르고 DAC 칩이 DSD 입력만 받을 수 있으면 무조건 Native DSD DAC이고 음질이 좋은 것이다라고 설레발치는 황금귀들의 얘기는 그냥 흘려 듣기 바란다.
  19. DSD 신호를 PCM처럼 구성하여 전송하는 방식은 DoP 이전에 DSD over AES/EBU 라는 소니가 제안한 전송 방식이 있었으나 이는 스튜디오용 프로 장비에서 사용되었으며 일반 소비자 제품에서 활용되어지지는 않았다.
  20. Marker 값이 변경된 이유는, DoP를 지원하지 않은 DAC에서 오동작 발생 시, 기존 1.0에서 사용한 0xAA 값은 굉장히 큰 소음을 유발하거나 직류를 발생하여 제품의 고장을 일으킬 수 있었기 때문이다. 1.1 규격에서 사용한 0x05 및 0xFA는 DAC가 오인식하더라도, 발생하는 소음이 88kHz/-34dBFS 수준의 초고주파 잡음이라 소비자 문제가 우려되지는 않는다.
  21. 원래 DoP 규격이 만들어진 배경은 PC 때문이 아니라 Mac OS 때문이다. PC의 경우, Windows 환경에서 ASIO를 통해 상위 어플리케이션 레벨에서 하드웨어 레벨로 오디오 신호를 bit-perfect 전송할 수 있으며, ASIO 2.1부터는 native DSD를 지원하여 전용 ASIO 드라이버만 있으면 DSD 재생에 크게 문제가 없었다. 하지만, PC Windows 환경보다 음질이 좋다고 알려진 Mac OS X는 ASIO 드라이버 없이 Native로 PCM만 지원하여, DSD를 Native로 처리할 수 있는 마땅한 방법이 없었다. 그래서 만들어진 것이 DoP라는 처리 구조이다.
  22. DSD 신호에는 가청대역 이상에서 Noise Shaper에 의해 발생한 Shaped Noise라는 노이즈가 존재한다. PCM 변환시 이 Shaped Noise를 충분히 제거하지 않으면, 샘플링 이론에 따른 에일리어싱 현상(1/2 샘플링 주파수을 넘어서는 주파수가 1/2 샘플링 주파수 이하의 대역으로 간섭-transition-되는 현상)에 의해 가청 대역 상에 노이즈가 발생하게 된다.
  23. 이유는 사운드 칩을 제공하는 곳과 안드로이드 커널에서 자체적으로 제한을 걸어버리기에 앱에서 대부분이 제한되어 있다. 기본적으로 안드로이드는 96kHz 이상의 PCM 신호를 처리하기에 적합한 OS가 아니다. 안드로이드의 커널에는 PC Windows의 KMixer 와 같이 Audioflinger라 하여 모든 오디오 신호를 48kHz로 변환하여 처리하는 부분이 있는데, 이 역시 PC의 ASIO와 같이 우회하는 방법 없이는 96kHz 이상의 오디오 신호를 온전히 처리할 수 없다.
  24. 이와 관련하여 SACD의 표준 문서(Scarlet Book)에서는 0dB SACD 기준으로 +3.1dB의 헤드룸을 가지고 있는 것으로 기술하고 있다.
  25. Native 방식으로 DSD를 아날로그 변환하게 되면, 출력 보정이 필요 없으나 대부분의 DAC는 중간에 레벨링 등을 위해 PCM 변환하는 경우가 많으며, 이 경우 클리핑에 의한 찌그러짐을 방지하기 위해 PCM 변환 시 레벨을 낮추게 되며, 이를 다시 아날로그 단에서 보정하게 된다. 자칫 DAC의 아날로그 단이나 DAC 바로 뒤 아날로그 단에서의 전원 전압이 충분히 높지 않은 경우(예를 들어 +/-3.3V 를 사용하는 경우)에도 찌그러짐이 심하게 발생할 수 있는데, 잘 설계된 DAC라면 이러한 점들을 고려해서 충분한 헤드룸의 아날로그 단이 설계되어 있을 것이다.
  26. 원래 DST로 압축된 데이터에 대해 DSTIFF(DST Encoded Audio Data) 라는 이름을 쓰고, DST 압축이 되지 않은 raw DSD 데이터의 경우 DSDIFF라 하는데, 파일 확장자를 두 개 모두 DFF(3문자 제한)로 사용하다 보니, 일반인들은 두 포맷을 혼동하여 모두 DFF 파일이라 부르고 있다.
  27. 원래는 2000년대 초반부터 VAIO 등 소니 제품에서 DSD 파일을 지원하기 위한 포맷으로 고안되었다. 2005년에 정식으로 V1.0 및 1.1 spec 을 공개하게 되었는데, 이는 DSF를 MPEG-4 Audio standard에 포함하기 위한 이유가 있었다.
  28. 특히 5.1채널 SACD 앨범을 립핑하면 DFF는 3.7기가인 것이 DSF는 9기가 이상으로 커진다.
  29. Digital eXtreme Definitiond. Pyramix 에서 DSD 의 편집 환경을 만들기 위해 고안된 포맷
  30. 이 작업을 안 하면 CD 볼륨이 매우 작아진다.
  31. 해당 음원 판매 사이트를 보면 DSD는 최고의 음질이라며 극찬하는 게시글이 넘치지만 반대로 HI-Res 쪽은 평가 글이 하나도 없다. 중요한 건 측정 스펙트럼에서는 DSD판은 22kHz밑으로 잘렸는데 그 반대로 HI-Res는 어느 정도 고음역대가 살아 있다. 즉 HI-Res 쪽이 객관적으론 더 좋은 음질이다. 하지만 청음하면 DSD 쪽이 더 저음이 많고 음이 두툼하고 찰지다.(!?)
  32. 오죽하면 이 음원을 만든 소니도 NW-ZX2에 DSD 재생 음색을 두 종류로 나눠버렸을 정도이다.
  33. DFF to DSF 변환이 필요한 이유는, 위 설명과 같이, DSF가 태그 편집이나 앨범 아트 등을 적용할 수 있기도 하지만, DST 디코딩이 CPU 퍼포먼스를 대단히 많이 요구하는 알고리즘이라 포터블 제품에서 구현하게 되면 엄청난 속도로 배터리 광탈이 발생할 수 있기 때문(혹은 아예 버벅거려서 재생도 못할 수 있다)이다. 때문에, 리핑후 DFF 형태로 돌아다니는 음원을 포터블에서 재생하기 위해서는 어쩔 수 없이 DSF 변환이 필요할 수 있다(만약 DFF 파일이라도 DST 압축이 적용되지 않은 음원-주로 2채널-이라면, 굳이 DSF로 변환할 필요는 없다). DFF → DSF 변환이 필요하다면 사용하려는 툴이 무손실 변환인지 아닌지 수단과 방법을 가리지 말고 알아보도록 하자. 참고로, DFF → DSF 변환 시 무손실 변환이 확인된 툴로는 TASCAM이 제공하는 Hi-Res Editor가 있다.
  34. 다만 2000년 후반기에 나오는 SACD에 경우 오픈릴 테이프가 아닌 하이 레졸루션 오디오를 DSD 변환한게 대부분이다.
  35. 보통 DSD를 재생할 수준의 DAC이나 DAP면 PCM도 대부분의 스펙은 다 커버되지만 그래도 DSD를 선호하는 사람들이 은근히 많다.
  36. 원본에는 코러스가 들어가는데 5.1버전은 코러스가 빠지기도 하며 전체적으로 음향 효과가 빠져서 음이 담백하다 할 정도로 단순해진 경우도 있다.
  37. 대표적으로 유니버설에서 나온 SACD가 그렇다.
  38. 투하트, 화이트 앨범2등의 아쿠아플러스 음악을 독점적으로 레코드하고 있는 회사이다. Suara의 음원도 이 곳 담당.
  39. iOS 버전의 경우 처음에는 지원하지 않았으나 1.89.0 업데이트로 지원
  40. 최상급 마스터링을 위해 극저온 케이블도 사용했다고 기제 되어 있다.