[출처] http://people.xiph.org/~xiphmont/demo/neil-young.html
이 내용들은 지난달 음악가 Neil Young과 애플사의 Steve Jobs가 압축되지 않은 스튜디오 음질의 디지털 음악 다운로드를 제공하는 것에 대해서 논의하는 내용을 내타내고있다.
많은 문서와 사용자들의 해설은 압축되지 않은 24bit 192kHz의 음원 다운로드에 대한 예측에 대해서 특별히 열정적이다.
24bit/192kHz(고품질 음원)은 Mr. Young's 그룹과 몇 달전에 나눈 나의 대화에서 눈에 띄는 특징이다.
불행하게도, 24bit/192kHz(고품질 음원) 형식으로 음악을 배포할 가치가 없다. 그것의 재생 안정도는 약간 16bit/44.1kHz혹은 16bit/48kHz보다 약간 하위에 있다.
그리고, 6배는 더 저장 공간을 차지한다.
오늘날 디지털방식으로 배포되는 음악의 경험과 음악 품질과 관련된 몇가지 실제적인 문제들이 있다. 24bit/192kHz(고품질 음원)는 이러한 문제점들 중 아무것도 해결하지 못한다. 모든 이들이 만병통치약으로 알려진 24bit/192kHz(고품질 음원)으로 추출될때 우리는 어떤 실제적인 개선을 느끼지 못하게 될 것이다.
먼저, 나쁜 소식들.
몇 주전에 나는 24bit/192kHz의 음원(고품질 음원)을 다운로드하는 것에 확신을 가지고, 어떻게 이러한 사실들을 동의 할 수 없는지를 알고 싶어 하는 지적이고 과학적인 지식을 가지고 있는 개인들과 대화를 가졌었다.그들은 자세한 해답을 요구하는 좋은 질문들을 했다.
나는 또한 어떤 동기에 의해서 이런 고품질(high-rate)의 디지털 음원을 옹호하는 분위기가 되었는지에 흥미를 가지고 있었다.그에 대한응답들은 몇몇 사람들이 기본적인 신호 이론과 샘플링 원리를 심하게 놀라운것으로 이해하고 있는 것을 보여준다.수학적, 기술적, 그리고 생리학적인 부분에서 잘못이해하고 있는 것들이 대화에서 많이 나타났고, 자주 중요한 오디오 전문 기술을 가지고 있는 전문가에 의해서도 주장되어 진다. 몇 사람은 샘플링 이론은 디지털 오디오가 실제로 어떻게 작동하는지를 잘 설명하지 못한다고 주장한다.
잘못된 정보와 미신은 단지 허풍선이만 만들어 낸다. 그래서, 실제로 적용되는 몇가지 개선점을 제안하기 이전에 24bit/192 kHz(고품질 음원)의 배포는 왜 쓸떼없는 짓인지에 대한 약간의 기본지식을 다루도록 하자.
위의 왼쪽 그림: 기저막이 베이지색으로 표현된 인간의 달팽이과늬 해부학적 단면도. 각 세포는 그것의 길이에 따라서 서로 다른 주파수에서 공진하도록 되어 있다. 외각에 가까운 곳은 높은 주파수에서 그리고 꼭대기 부분으로 갈수록 낮은 주파수에서 공진하는 세포로 되어 있다. 몇가지 공진 주파수에 대한 추정치들이 표시되어 있다.
위의 오른쪽 그림: 겹치는 필터의 뱅크처럼 보이는 기저막 세포에 해당하는 모세포의 응답 특성을 보여주는 개념도.
이것은 튜너가 설정된 곳에 가까운 강한 양의 주파수를 취득하는 아날로그 라디오와 유사하다. 중앙의 주파수에서 더 멀어지게 될 수록 (완벽히 사라지게 될때까지) 점증적으로 더 약해지고 왜곡되게 된다. 마지막 모세포의 감도가 0으로 떨어지게되고 들을 수 없게 되는 시점 이전인 상한 (하한) 가청 주파수 한계점이 있다.
먼저, 우리는 청음 그룹에 대해서 모든 소리 파장대에 걸쳐서 '청음의 절대적인 한계점'을 측정한다. 이러한 작업은 건강한 귀에 이상적인 환경에서 측정이 이루어져 어떤 주어진 주파수에 대한 인간의 귀가 임지 할 수 있는 매우 미세한 소리를 표현하는 그래프를 우리에게 제공한다. 울림을 막아주는 주변환경, 정교하게 교정된 재생 장치, 그리고 엄격한 통계 분석은 쉬운 부분이다. 귀와 청각의 집중은 둘다 빨리 피로해 진다. 그래서 실험은 청음자가 피로하지 않은 상태에서 이루어져야만 한다. 이러한 점은 많은 휴식과 실험 중단이 이루어진다는 것을 의미한다. 실험은 측정 방법에 따라서 몇 시간에서 몇 일에 걸쳐 어떤 곳에서 이루어진다.
그리고 나서 우리는 다른 극한점인 '고통 한계점'에 대한 자료를 수집한다. 이러한 작업은 소리의 크기가 귀의 물리적, 신경계적인 체계가 가해진 소리에 의해서 완벽히 압도되지 않을 만큼 그러나 물리적인 고통은 경험할 만큼 높아지게 되는 지점이다. 이러한 자료의 수집은 약간 사기성이 있다. 여러분들은 어떤 사람도 이 과정에서 청음을 통해 영구적인 피해를 입게 되기 원치 않는다.
위의 그림: 16kHz 이상의 주파수에 해당하는 현대적인 음원을 포함한 Flectcher와 Munson (1933)에 의해서 유도된 근사적인 등음량 곡선(equal loudness curve). 절대적인 청음 한계치와 고통 곡선의 한계치는 빨간색으로 표시되어 있다. 이후의 연구자들은 Phon 단위와 ISO 226 표준 등음량 곡선에서의 한계점과 이러한 측정치를 더 정교화 하였다. 현재의 측정치는 귀는 Fletcher와 Munson의 결과보다 낮은 주파수에 대해 분명히 덜 민감하다고 알려주고 있다.
인간의 청음 범위의 상한은 청음 그래프의 절대치가 고통 한계치와 만나는 지점이 되도록 정의되어 진다. 이 지점에서 혹은 그 아래에서 소리를 희미하게 나마 인지하기 위해선 동시에 참을 수 없을 정도로 크게되어야만 한다.
낮은 주파수에서 달팽이관은 저음 반사 모음집(bass reflex cabinet)처럼 동작한다. 달팽이관의 구멍은 사람에 따라서 40Hz에서 65Hz사이의 어떤 주파수에 맞춰진 통로로 작동하는 기저막의 꼭지점의 입구이다. 응답특성은 이 주파수 아래에서 가파르게 떨어지게 된다.
이와같이, 20Hz에서 20kHz는 일반적인 범위이다. 이것은 철저히 가청 스펙트럼을 포함하고 이건 거의 한세기의 걸친 실험 자료에 의해서 증명되는 주장이다.
이러한 문제는 여러 분들이 무엇을 황금귀로 부르는가에 따라 다르다.
젊고, 건강한 사람의 귀는 늙고 아픈 사람의 귀보다 잘 듣는다. 어떤 사람은 대부분의 사람들이 존재 조차 의식하지 못하는 음악과 소리에서 미묘한 차이를 듣도록 예외적으로 잘 훈련된다. 내가 모든 주류 mp3 인코더(과거에는 그들 모든 것들이 아주 좋지 못했다.)를 인지할 수 있었고 이중-맹검법(double-blind testing)에서 믿을 수 있게 이것을 증명할 수 있었을 때는 1990년 대의 어느 시점이었다.
건강한 귀는 고도로 훈련된 감별능력을 가지고 있을때, 나는 그 사람을 황금귀라고 불렀다. 그렇기는 하지만, 평균 이하의 청력은 비훈련된 청음자를 뛰어 넘는 미세함을 인지하도록 훈련되어 질 수도 있다. 황금귀는 평균적인 사람들의 물리적 능력 이하의 청력보다 좀 더 훈련되어 있다.
청력 연구자들은 진짜로 예외적인 청력을 갖는 예를 들자면 대단히 확장된 청력 범위를 갖는 개개인들을 찾아내고, 실험하고 문서화하는데 열의를 가지곤 한다. 일반적인 사람들도 훌룡하고 모든 것을 가지고있다. 그러나 모든 이들은 정말로 호감가는 페이퍼를 위해서 유전적인 놀라움을 찾고 싶어 한다. 우리는 과거의 100년간의 실험동안 그러한 어떤 사람도 찾지 못했다. 그래서 그들은 아마도 존재하지 않는다. 미안하다, 우리는 미래에도 계속해서 찾을 것이다.
위의 그림: 가시광 대역의 스펙트럼위에 겹쳐서 표현한 사람의 눈의 시세포층의 근사한 log 스케일의 응답 특성이다. 이러한 감지 기관들은 귀의 모세포들이 소리의 겹쳐지는 파장대역에 응답하도록 조절되어 있듯이, 겹쳐진 스펙트럼 대역에서 빛에 응답한다.
인간의 눈은 가시광 대역의 스펙트럼으로 알려진 빛의 제한된 범위의 주파수만 볼 수 있다. 이와 같은 현상은 소리의 파장의 가청 스펙트럼에 대해서도 동일하게 적용된다. 귀와 같이, 눈은 서로 다른 대역의 그렇지만 서로 겹쳐지는 파장 대역의 빛을 감지하는 감지 세포(시세포층)를 가지고 있다.
가시광 스펙트럼은 400THz(강한 빨강색)에서 850THz(강한 보라색)까지 걸쳐있다[3]. 인지력은 양쪽 끝에서 급하게 떨어진다. 이런 대략의 제한지점 밑에서, 미세하게나마 감지하기 위해서 요구되는 빛의 파워는 여러분의 망막을 손상시킬 수 있다. 이와 같이, 이러한 사항들은 가청 스펙트럼의 일반적인 제한치로 해석되는, 젊고, 건강하고, 유전적으로 축복받은 개개인들에게 일반적인 범위이다.
우리의 가상적인 Wide Spectrum Video 현상에서, 이러한 제한치들이 일반적으로 충분하지 않다고 믿는 열렬한 스펙트럼 애호가 그룹을 생각해 보자. 그들은 비디오가 가시광 스펙트럼 뿐만 아니라, 적외선 및 자외선 대역을 표현한다고 주장하는 것과 같다. 대치하여 비교를 계속해 보면, 이런 확장된 범위는 아직도 불충분하다고 주장하고 이런 비디오는 마이크로파와 X-ray 스펙트럼도 포함할때 꽤나 자연스럽게 느겨진다는 좀더 하드코어하고 자랑스러운 사실과 허구의 뒤범벅이 있다. 황금 눈에게 그들은 다른 점은 낮과 밤이다라고 주장한다.
물론 이러한 것들은 터무늬 없는 일이다.
아무도 X-ray나 적외선, 자외선, 그리고 마이크로파를 볼 수 없다. 사람들이 그가 얼마나 많이 할 수 있는지를 믿는지는 중요하지 않다. 망막은 간단한 감지 체계를 가지고 있지 않다.
여기에 어떤이도 할 수 있는 실험이 있다: Apple사의 IR 리모콘을 가져오라. LED는 근적외선 대역인 약 306THz에 해당하는 980nm의 빛을 방출한다. 이 대역은 가시영역에서 그리 멀지 않은 영역이다. 리모콘을 지하실로 가져가거나, 여러분의 집에서 가장 어두운 방으로 가져가라. 그것도 한밤중에 모든 등들은 다끄고. 여러분의 눈을 어둠에 적응 시키자.
위의 사진: 디지털 카메라를 이용해 Apple사의 IR 리모콘을 찍은 사진. 비록 LED가 아주 밝고 가시광 대역의 빨간색 영역에서 멀지 않은 대역의 주파수를 방출할지라도, 이건 눈에 완벽히 보여지지 않는다.
여러분들은 버튼을 눌렀을때 Apple사의 리모콘의 LED 플레시를 볼 수 있습니까[4]? 아니라구요? 아주 작은 양 조차도 볼 수 없다구요? 몇개의 다른 IR 리모콘도 시도해 봅시다: 많은 것들이 310-350THz에 해당하는 가시광에 아주 근접한 IR 파장을 사용한다. 여러분들은 그들도 마찬가지로 볼 수 없을 겁니다. 나머지 것들은 가시광 대역의 끝자락의 오른쪽에 해당하는 350-380Thz의 빛을 방출할지도 모르고 어둠에 적용된 눈에 완벽히 어둠에서 드물게 볼 수 있게 될지도 모른다[5]. 그들이 가시광대역 안쪽에 있었다면 모두 눈이 부시고 고통스럽게 밝을 것이다.
이들 근적외선 LED들은 가시 주파수 한계점 밑에서 거의 20% 지점의 해당하는 가시광 영역의 경계지점의 빛을 방출한다. 192kHz 오디오는 가청한계의 400%에 해당한다. 나는 사과와 오렌지를 비교하는 우를 범하지 않기 위해서, 소리와 가시광의 인지가 양 한계점에서 유사하게 감소된다.
이들 근적외선 LED들은 가시 주파수 한계점 밑에서 거의 20% 지점의 해당하는 가시광 영역의 경계지점의 빛을 방출한다. 192kHz 오디오는 가청한계의 400%에 해당한다. 나는 사과와 오렌지를 비교하는 우를 범하지 않는다, 소리와 가시광의 감지는 인지 한계지점들에서 유사하게 감소된다.
과도한 샘플링은 단순하고 명징하다. 여러분들은 높은 샘플링 레이트가 (샘플링 레이트의 반에 해당하는) Nyquist 주파수와 우리가 듣을 수 있는 최대 주파수인 20Khz 사이의 더 넓은 대역을 아주 잘 다룰 수 있다는 것을 보여주는 나의 A Digital Media Primer for Geeks을 되돌아 보아라.
이것은 더 단순하게, 자연스럽게, 더 신뢰할 만한 아날로그 anti-aliasing 필터를 구성할 수 있게하고 그에 따라서 더 고음질을 갖도록 해준다. 20KHz와 Nyquist 주파수 사이의 이 추가 대역은 본질적으로 그져 아날로그 필터를 위한 스펙트럼의 여유공간이다.
이것은 단지 한면만 이야기하는 것이다. 디지털 필터는 아날로그 필터를 실제적으로 구현하는 제한사항을 몇 가지 가지고 있기 때문에, 우리는 더 훌룡한 효율성과 디지털적으로 정확성을 가지는 anti-aliasing 과정을 완성할 수 있다. 매우 높은 샘플링 레이트의 순수한 디지털 신호가 디지털 anti-aliasing filter를 통과하는 작업은 전송 대역을 빡빡한 대역에 맞추는데 문제가 없다.
이 확장된 디지털 anti-aliasing filter를 거친후, 여분의 대역에 있는 샘플들은 그져 사라져 버린다. 과도하게 샘플링된 음원을 플레이하는 과정은 이와의 반대의 과정으로 대부분 이루어 진다.
이것은 우리가 192kHz나 더 높은 샘플링이 갖는 모든 고음질의 이득들을(자연스러운 주파수 응답, 낮은 aliasing) 가지고 44.1KHz나 48kHz등의 낮은 샘플링 주파수를 사용할 수 있고 단점은 전혀 없다 (복원 과정의 왜곡을 일의키는 초음파는 쓸모없는 것이다.). 거의 모든 오늘날의 ADC와 DAC들은 매우 높은 주파수의 과도한 샘플링으로 이루어진다. 몇몇의 사람들은 이것이 순전히 자동적으로 인지하지 못하게 이루어지기 때문에 잃어나는 현상이라는 것을 알고 있다.
ADC와 DAC는 항상 눈에 보이게 과도한 샘플링을 하지 않는다. 30년전에 어떤 녹음 기기들은 단지 아날로그 필터만을 이용해서 높은 샘플링 주파수로 녹음하였고, 결과물과 mastering은 단순히 그 높은 주파수의 신호를 사용하였다. 디지털 anti-aliasing과 decimation 과정들은 (CD 나 DAT를 위해 낮은 주파수로 다시 샘플링하는 작업) matering의 마지막 단계에서 이루어졌다. 이것이 아마도 96kHz와 192kHz가 전문적인 음악 산업과 관련이 있게 되게된 초기의 이유 중 하나일 것이다.
.............번역중.................
나는 또한 어떤 동기에 의해서 이런 고품질(high-rate)의 디지털 음원을 옹호하는 분위기가 되었는지에 흥미를 가지고 있었다.그에 대한응답들은 몇몇 사람들이 기본적인 신호 이론과 샘플링 원리를 심하게 놀라운것으로 이해하고 있는 것을 보여준다.수학적, 기술적, 그리고 생리학적인 부분에서 잘못이해하고 있는 것들이 대화에서 많이 나타났고, 자주 중요한 오디오 전문 기술을 가지고 있는 전문가에 의해서도 주장되어 진다. 몇 사람은 샘플링 이론은 디지털 오디오가 실제로 어떻게 작동하는지를 잘 설명하지 못한다고 주장한다.
잘못된 정보와 미신은 단지 허풍선이만 만들어 낸다. 그래서, 실제로 적용되는 몇가지 개선점을 제안하기 이전에 24bit/192 kHz(고품질 음원)의 배포는 왜 쓸떼없는 짓인지에 대한 약간의 기본지식을 다루도록 하자.
여러분, 당신의 귀를 살펴봅시다.
귀는 달팽이관의 공진 기저막에 있는 모(발)세포(hair cell)를 통해서 듣는 기능을 수행한다.각각의 모세포는 효과적으로 세포의 각각의 위치에 해당하는 좁은 파장대역으로 조절한다. 감지되는 파장대의 피크는 맨 중앙에 있고 인접하고 있는 모세포 간에 약간의 겹치는 파장이 존재하면서 꼬깔콘 모양을 이루면서 양쪽으로 갈수록 줄어 들게 된다.위의 왼쪽 그림: 기저막이 베이지색으로 표현된 인간의 달팽이과늬 해부학적 단면도. 각 세포는 그것의 길이에 따라서 서로 다른 주파수에서 공진하도록 되어 있다. 외각에 가까운 곳은 높은 주파수에서 그리고 꼭대기 부분으로 갈수록 낮은 주파수에서 공진하는 세포로 되어 있다. 몇가지 공진 주파수에 대한 추정치들이 표시되어 있다.
위의 오른쪽 그림: 겹치는 필터의 뱅크처럼 보이는 기저막 세포에 해당하는 모세포의 응답 특성을 보여주는 개념도.
이것은 튜너가 설정된 곳에 가까운 강한 양의 주파수를 취득하는 아날로그 라디오와 유사하다. 중앙의 주파수에서 더 멀어지게 될 수록 (완벽히 사라지게 될때까지) 점증적으로 더 약해지고 왜곡되게 된다. 마지막 모세포의 감도가 0으로 떨어지게되고 들을 수 없게 되는 시점 이전인 상한 (하한) 가청 주파수 한계점이 있다.
샘플링 주파수와 가청 스펙트럼
여러분이 이러한 말들을 많이 반복적으로 들었을 것으로 확신한다: 인간의 가청 범위는 20Hz에서 20kHz에 걸쳐있다. 연구자들이 어떻게 이런 특정 숫자를 지정하게 되었는지 아는 것은 중요한 문제이다.그리고 나서 우리는 다른 극한점인 '고통 한계점'에 대한 자료를 수집한다. 이러한 작업은 소리의 크기가 귀의 물리적, 신경계적인 체계가 가해진 소리에 의해서 완벽히 압도되지 않을 만큼 그러나 물리적인 고통은 경험할 만큼 높아지게 되는 지점이다. 이러한 자료의 수집은 약간 사기성이 있다. 여러분들은 어떤 사람도 이 과정에서 청음을 통해 영구적인 피해를 입게 되기 원치 않는다.
인간의 청음 범위의 상한은 청음 그래프의 절대치가 고통 한계치와 만나는 지점이 되도록 정의되어 진다. 이 지점에서 혹은 그 아래에서 소리를 희미하게 나마 인지하기 위해선 동시에 참을 수 없을 정도로 크게되어야만 한다.
낮은 주파수에서 달팽이관은 저음 반사 모음집(bass reflex cabinet)처럼 동작한다. 달팽이관의 구멍은 사람에 따라서 40Hz에서 65Hz사이의 어떤 주파수에 맞춰진 통로로 작동하는 기저막의 꼭지점의 입구이다. 응답특성은 이 주파수 아래에서 가파르게 떨어지게 된다.
이와같이, 20Hz에서 20kHz는 일반적인 범위이다. 이것은 철저히 가청 스펙트럼을 포함하고 이건 거의 한세기의 걸친 실험 자료에 의해서 증명되는 주장이다.
유전적 축복과 황금귀들.
나의 서신에 기초해 보면, 많은 사람들이 듣는 기능에 특수한 축복을 가지고 있는 개개인들이 있다고 믿는다. 정말로 '황금귀'같은 것들이 존재하긴 하는 걸까?이러한 문제는 여러 분들이 무엇을 황금귀로 부르는가에 따라 다르다.
젊고, 건강한 사람의 귀는 늙고 아픈 사람의 귀보다 잘 듣는다. 어떤 사람은 대부분의 사람들이 존재 조차 의식하지 못하는 음악과 소리에서 미묘한 차이를 듣도록 예외적으로 잘 훈련된다. 내가 모든 주류 mp3 인코더(과거에는 그들 모든 것들이 아주 좋지 못했다.)를 인지할 수 있었고 이중-맹검법(double-blind testing)에서 믿을 수 있게 이것을 증명할 수 있었을 때는 1990년 대의 어느 시점이었다.
건강한 귀는 고도로 훈련된 감별능력을 가지고 있을때, 나는 그 사람을 황금귀라고 불렀다. 그렇기는 하지만, 평균 이하의 청력은 비훈련된 청음자를 뛰어 넘는 미세함을 인지하도록 훈련되어 질 수도 있다. 황금귀는 평균적인 사람들의 물리적 능력 이하의 청력보다 좀 더 훈련되어 있다.
청력 연구자들은 진짜로 예외적인 청력을 갖는 예를 들자면 대단히 확장된 청력 범위를 갖는 개개인들을 찾아내고, 실험하고 문서화하는데 열의를 가지곤 한다. 일반적인 사람들도 훌룡하고 모든 것을 가지고있다. 그러나 모든 이들은 정말로 호감가는 페이퍼를 위해서 유전적인 놀라움을 찾고 싶어 한다. 우리는 과거의 100년간의 실험동안 그러한 어떤 사람도 찾지 못했다. 그래서 그들은 아마도 존재하지 않는다. 미안하다, 우리는 미래에도 계속해서 찾을 것이다.
스렉트럼 애호가들.
아마도 여러분들은 내가 써놓은 모든 것에 대해서 의심이 많을 것이다; 이것들은 아마도 대부분의 시장의 광고물과는 반대로 가고있다. 대신, 기존의 오디오 분야에서 다루지 않는 가상적인 Wide Spectrum Video 현상을 한번 생각해 보자.위의 그림: 가시광 대역의 스펙트럼위에 겹쳐서 표현한 사람의 눈의 시세포층의 근사한 log 스케일의 응답 특성이다. 이러한 감지 기관들은 귀의 모세포들이 소리의 겹쳐지는 파장대역에 응답하도록 조절되어 있듯이, 겹쳐진 스펙트럼 대역에서 빛에 응답한다.
인간의 눈은 가시광 대역의 스펙트럼으로 알려진 빛의 제한된 범위의 주파수만 볼 수 있다. 이와 같은 현상은 소리의 파장의 가청 스펙트럼에 대해서도 동일하게 적용된다. 귀와 같이, 눈은 서로 다른 대역의 그렇지만 서로 겹쳐지는 파장 대역의 빛을 감지하는 감지 세포(시세포층)를 가지고 있다.
가시광 스펙트럼은 400THz(강한 빨강색)에서 850THz(강한 보라색)까지 걸쳐있다[3]. 인지력은 양쪽 끝에서 급하게 떨어진다. 이런 대략의 제한지점 밑에서, 미세하게나마 감지하기 위해서 요구되는 빛의 파워는 여러분의 망막을 손상시킬 수 있다. 이와 같이, 이러한 사항들은 가청 스펙트럼의 일반적인 제한치로 해석되는, 젊고, 건강하고, 유전적으로 축복받은 개개인들에게 일반적인 범위이다.
우리의 가상적인 Wide Spectrum Video 현상에서, 이러한 제한치들이 일반적으로 충분하지 않다고 믿는 열렬한 스펙트럼 애호가 그룹을 생각해 보자. 그들은 비디오가 가시광 스펙트럼 뿐만 아니라, 적외선 및 자외선 대역을 표현한다고 주장하는 것과 같다. 대치하여 비교를 계속해 보면, 이런 확장된 범위는 아직도 불충분하다고 주장하고 이런 비디오는 마이크로파와 X-ray 스펙트럼도 포함할때 꽤나 자연스럽게 느겨진다는 좀더 하드코어하고 자랑스러운 사실과 허구의 뒤범벅이 있다. 황금 눈에게 그들은 다른 점은 낮과 밤이다라고 주장한다.
물론 이러한 것들은 터무늬 없는 일이다.
아무도 X-ray나 적외선, 자외선, 그리고 마이크로파를 볼 수 없다. 사람들이 그가 얼마나 많이 할 수 있는지를 믿는지는 중요하지 않다. 망막은 간단한 감지 체계를 가지고 있지 않다.
여기에 어떤이도 할 수 있는 실험이 있다: Apple사의 IR 리모콘을 가져오라. LED는 근적외선 대역인 약 306THz에 해당하는 980nm의 빛을 방출한다. 이 대역은 가시영역에서 그리 멀지 않은 영역이다. 리모콘을 지하실로 가져가거나, 여러분의 집에서 가장 어두운 방으로 가져가라. 그것도 한밤중에 모든 등들은 다끄고. 여러분의 눈을 어둠에 적응 시키자.
위의 사진: 디지털 카메라를 이용해 Apple사의 IR 리모콘을 찍은 사진. 비록 LED가 아주 밝고 가시광 대역의 빨간색 영역에서 멀지 않은 대역의 주파수를 방출할지라도, 이건 눈에 완벽히 보여지지 않는다.
여러분들은 버튼을 눌렀을때 Apple사의 리모콘의 LED 플레시를 볼 수 있습니까[4]? 아니라구요? 아주 작은 양 조차도 볼 수 없다구요? 몇개의 다른 IR 리모콘도 시도해 봅시다: 많은 것들이 310-350THz에 해당하는 가시광에 아주 근접한 IR 파장을 사용한다. 여러분들은 그들도 마찬가지로 볼 수 없을 겁니다. 나머지 것들은 가시광 대역의 끝자락의 오른쪽에 해당하는 350-380Thz의 빛을 방출할지도 모르고 어둠에 적용된 눈에 완벽히 어둠에서 드물게 볼 수 있게 될지도 모른다[5]. 그들이 가시광대역 안쪽에 있었다면 모두 눈이 부시고 고통스럽게 밝을 것이다.
이들 근적외선 LED들은 가시 주파수 한계점 밑에서 거의 20% 지점의 해당하는 가시광 영역의 경계지점의 빛을 방출한다. 192kHz 오디오는 가청한계의 400%에 해당한다. 나는 사과와 오렌지를 비교하는 우를 범하지 않기 위해서, 소리와 가시광의 인지가 양 한계점에서 유사하게 감소된다.
이들 근적외선 LED들은 가시 주파수 한계점 밑에서 거의 20% 지점의 해당하는 가시광 영역의 경계지점의 빛을 방출한다. 192kHz 오디오는 가청한계의 400%에 해당한다. 나는 사과와 오렌지를 비교하는 우를 범하지 않는다, 소리와 가시광의 감지는 인지 한계지점들에서 유사하게 감소된다.
위험하다고 여겨지는 192kHz의 샘플링 주파수.
192kHz 디지털 음악 파일들은 아무런 이득도 제공하지 않는다. 그런것들은 전혀 중립적이지 못하다; 실제적인 원음 충실도는 약간 나쁘다. 초음파는 재생되는 동안 골칫거리이다.
소리 변환기와 파워 증폭기 둘다 왜곡이 없는 것은 아니다. 그리고 왜곡은 저주파와 고주파에서 갑작스럽게 증가하게 되어있다. 동일한 변환기가 가청 재생물에서 초음파를 발생시킨다면, 상호변환 디스토션 제품의 제어되지 않은 방출물이 모든 가청 주파수를 덮어 버리듯이 어떤 비선형은 약간의 초음파를 가청 범위의 영역으로 이동시키게 될 것이다. 파워 증폭기의 비선형성도 동일한 현상을 발생 시킨다. 현상은 매우 미약하지만, 청음 실험은 두 현상을 통하여 (초음파와 가청음) 다 듣을 수 있다는 것을 확인해 준다.
위쪽 그림: 약 0.09%정도의 변하지 않는 총 화음 왜곡(THD)을 갖는 이론적인 증폭기에서의 30kHz와 33kHz의 톤을 상호 변환기로 부터 유도된 디스토션 제품의 표현. 디스토션 제품들은 이 두 톤 보다 낮은 주파수를 포함하는 스펙트럼에 걸쳐서 표현된다.
듣지 못하는 초음파가 상호 변환 디스토션에서 가청영역 (연한 파란색 영역)에 공헌한다. 일반적으로 초음파를 생산하지 않도록 디자인된 시스템은 20kHz이상에서 더 높은 양의 왜곡을 가지고 있다. 많은 공헌을 상호변환기가 하고 있다. 초음파의 발생을 설명하는 디자인된 주파수 대역의 확장은 가청 스펙트럼내의 노이즈와 왜곡의 발생을 감소시키는 타협안을 요구한다. 어느 쪽이든, 초음파의 불필요한 재생산은 성능을 떨어 뜨린다.
추가적인 왜곡을 회피하는 몇 가지 방법이 있다:
- 여러분이 듣을 수 없는 초음파를 분리해서 독립적으로 재생산하는 전용 초음파 스피커, 증폭기, 그리고 교차형 중간체,등은 그져 여러분이 만드는 소리를 어지럽히지 않는다.
- 증폭기와 변환기는 더 넓은 주파수의 재생산을 위해 디자인 되었다, 그래서 초음파는 소리의 상호변환을 잃으키지 않는다. 같은 양의 비용과 복잡성이 주어진다면, 이 추가적인 추파수 범위는 스펙트럼의 가청 대역에서의 어떤 성능 개선의 비용을 발생 시키게 될 것이다.
- 스피커와 증폭기는 어쨋든 초음파를 발생시키지 않도록 디자인되어야 한다.
- 시작 단계에서 넓은 대역을 포함하는 인코딩은 하지 말아야 한다. 초음파를 포함한 컨텐츠가 아니라면 여러분은 가청 대역에서 초음파 상호면환 왜곡을 만들거나 만들 수 없다.
위의 것들은 모두는 같은 효과를 갖는 것들이다. 그러나 4번만이 합리성이 갖는다.
여러분이 여러분 자신의 시스템의 성능에 대해서 의구심을 가지고 있다면, 다음의 샘플들은 30kHz와 33kHz의 톤을 가지고 있는 24bit/96kHz의 WAV 파일과 FLAC으로 된 긴버전과, 어떤 세가지 톤의 신호음 파일이다. 그리고 일반적인 노래 클립은 완벽히 24kHz에서 46kHz의 초음파 영역이 되기 위해서 24kHz로 주파수 상승이 가해졌다.
- 상호변환 테스트:
30kHz tone + 33kHz tone (24 bit / 96kHz) [5 second WAV] [30 second FLAC]
26kHz - 48kHz warbling tones (24 bit / 96kHz) [10 second WAV]
26kHz - 96kHz warbling tones (24 bit / 192kHz) [10 second WAV]
Song clip shifted up by 24kHz (24 bit / 96kHz WAV) [10 second WAV]
(original version of above clip) (16 bit / 44.1kHz WAV)
여러분의 시스템은 실제로 완벽한 96kHz 재생이 가능하다고 가정한다면[6], 위의 파일들은 어떤 들리는 노이즈, 톤, 휘파람소리, 클릭음, 혹은 다른 소리들이 없는 완벽히 무음이어야한다. 여러분이 어떤것을 듣게 된다면, 당신의 시스템은 초음파의 가청대역의 상호변환을 일으키는 비선형성을 가지고 있다고 봐야 한다. 소리를 높일때는 주의를 해야한다; 디지털 혹은 아날로그 음성을 가벼운 음성조차도 구동하는것은 갑자기 아주 큰 상호변환 톤을 일으킬 수도 있다.
요약해 보자면, 초음파의 상호변환은 주어진 시스템에서 듣을 수 있다는 것은 불확실하다. 추가적인 왜곡은 사소한 것일 수도 있고 주의를 요하는 것일 수도 있다. 어느 쪽이든, 초음파는 전혀 이득 될 것이 없다. 그리고 많은 시스템에서 그것은 듣기에 확실히 고통 스러울 것이다. 고통을 주지 않는 시스템에서는 초음파를 다루는데 필요한 비용과 노력은 줄일 수 있고 대신 가청 범위의 성능을 개선하는데 사용되어 질 수 있다.
샘플링에 대해 잘못 알려진 오류 그리고 오해
샘플링 이론은 신호처리에 대한 지식이 없다면 대부분 이해하기 어렵다. 대부분의 사람들이 다른 분야의 지식있는 박사들 조차도 반복적으로 잘못 이해하고 있다는 것은 놀랄일이 아니다. 또한 많은 사람들이 그들이 잘못하고 있다는 것을 인지 조차 못하는 것도 놀랄일이 아니다.
위의 그림: 샘플링된 신호들은 자주 미세하지 못한 계단 모습(빨간색)으로 묘사 된다. 이것은 원래의 신호의 잘못된 추정치를 보여준다. 그러나, 이러한 표현은 수학적으로 정확하고 그 신호는 아날로그로 다시 복원되었을 때 원본 신호(파란색)의 정확히 부드러운 모습을 복구한다.
대부분의 공통적인 오해는 샘플링은 원칙적으로 미세하지 못하고 손실을 발생한다는 것이다. 샘플링된 신호는 원래의 완벽한 부드러운 신호의 들쑥날쑥한, 심하게 꺽인 계단 모양의 복제혀으로 자주 묘사된다. 이것이 여러분이 샘플링이 어떻게 동작하는지 이해하는 이미지라면, 여러분은 아마도 더 빠른 샘플링 비율과 더 많은 샘플링 비트수를 좋은 것으로 여길 것이다. 아마도 그것은 더 미세한 계단 모양과 좀 더 원본에 가까운 추정치가 될 것이다. 디지털 신호는 무한대에 가까운 샘플링 비율로 갈 수록 원래의 아날로그 신호에 더욱 더 가까워지는 소리가 될 것이다.
비슷하게, 많은 디지털 신호처리 지식이 없는 사람들은 다음과 같은 사항을 살펴보게 될 것이다:
그리고 말하자면 "어허!" 이러한 점은 샘플링된 신호는 더 높은 주파수의 아날로그 신호는 엉망으로 표현하게 된다는 점을 이야기 한다. 혹은, 음성 신호의 주파수가 증가함에 따라, 샘플링 품질은 떨어지고 주파수 응답 특성도 엉망이 된다. 즉 입력 신호에 대단히 민감하게 된다.
보이는 것은 현혹적인 것이다. 이러한 믿음들은 잘못된 것이다!
2013-04-04에 추가된 내용:
디지털 신호와 계단모습에 관해 내가 가졌든 모든 메일에 덧붙여, 나는 여러분이 내 방식대로의 설명의 단순히 받아 들일 필요 없이 우리의 비디오 Digital Show & Tell에서 진짜 장비의 실제 디지털 원리를 보여준다.
보이는 것은 현혹적인 것이다. 이러한 믿음들은 잘못된 것이다!
2013-04-04에 추가된 내용:
디지털 신호와 계단모습에 관해 내가 가졌든 모든 메일에 덧붙여, 나는 여러분이 내 방식대로의 설명의 단순히 받아 들일 필요 없이 우리의 비디오 Digital Show & Tell에서 진짜 장비의 실제 디지털 원리를 보여준다.
과도한 샘플링
48KHz 이상의 샘플링 레이트는 고음질의 오디오 데이터와 관계없지만, 몇몇 현재의 디지털 오디오 기술에 내제하는 핵심이다. 과도한 샘플링이 이와 가장 관련된 예제이다[7].과도한 샘플링은 단순하고 명징하다. 여러분들은 높은 샘플링 레이트가 (샘플링 레이트의 반에 해당하는) Nyquist 주파수와 우리가 듣을 수 있는 최대 주파수인 20Khz 사이의 더 넓은 대역을 아주 잘 다룰 수 있다는 것을 보여주는 나의 A Digital Media Primer for Geeks을 되돌아 보아라.
이것은 더 단순하게, 자연스럽게, 더 신뢰할 만한 아날로그 anti-aliasing 필터를 구성할 수 있게하고 그에 따라서 더 고음질을 갖도록 해준다. 20KHz와 Nyquist 주파수 사이의 이 추가 대역은 본질적으로 그져 아날로그 필터를 위한 스펙트럼의 여유공간이다.
위의 사진: A Digital Media Primer for Geeks으로 부터의 흰 칠판 그림은 48KHz의 ADC/DAC(왼쪽)과 96KHz의 ADC/DAC를 위해 사용되는 변환대역폭을 묘사한다. |
이 확장된 디지털 anti-aliasing filter를 거친후, 여분의 대역에 있는 샘플들은 그져 사라져 버린다. 과도하게 샘플링된 음원을 플레이하는 과정은 이와의 반대의 과정으로 대부분 이루어 진다.
이것은 우리가 192kHz나 더 높은 샘플링이 갖는 모든 고음질의 이득들을(자연스러운 주파수 응답, 낮은 aliasing) 가지고 44.1KHz나 48kHz등의 낮은 샘플링 주파수를 사용할 수 있고 단점은 전혀 없다 (복원 과정의 왜곡을 일의키는 초음파는 쓸모없는 것이다.). 거의 모든 오늘날의 ADC와 DAC들은 매우 높은 주파수의 과도한 샘플링으로 이루어진다. 몇몇의 사람들은 이것이 순전히 자동적으로 인지하지 못하게 이루어지기 때문에 잃어나는 현상이라는 것을 알고 있다.
ADC와 DAC는 항상 눈에 보이게 과도한 샘플링을 하지 않는다. 30년전에 어떤 녹음 기기들은 단지 아날로그 필터만을 이용해서 높은 샘플링 주파수로 녹음하였고, 결과물과 mastering은 단순히 그 높은 주파수의 신호를 사용하였다. 디지털 anti-aliasing과 decimation 과정들은 (CD 나 DAT를 위해 낮은 주파수로 다시 샘플링하는 작업) matering의 마지막 단계에서 이루어졌다. 이것이 아마도 96kHz와 192kHz가 전문적인 음악 산업과 관련이 있게 되게된 초기의 이유 중 하나일 것이다.