作者exFREEzy (~RadicalDreamer~)
看板AudioPlayer
标题[讨论] Dither (in数位音讯)
时间Thu Mar 20 03:31:12 2008
Dither 中文似乎译作:高频振动 看过大陆这样翻
主要转贴 kouyoumin 发问的『Dither 的影响』
http://forums.dearhoney.idv.tw/viewtopic.php?p=183297
先转贴最小篇幅的文章〔作者:hotball〕
http://forums.dearhoney.idv.tw/viewtopic.php?f=3&t=29565&p=183201#p183201
---------------------------------------
Dithering 通常会增加量化误差(也就是杂讯会变多),但是会减少失真(指人的感觉上)。
这是因为,在没有 dithering 的情形下,量化误差会比较集中在低频部份。
而加上 dithering 後,低频部份的量化误差会减少,而转移到高频。
由於对大部份情形来说,高频是比较不重要的,所以这样是可以减少失真的。
所以,在使用 dithering 的情形下,取样率要高到某个程度以上才行
(即让其高频部份超出人所能侦知的范围)。
对於影像讯号来说,
当解析度高到某个程度时,人眼就无法分辨各别的 pixels
(所以 dithering 的图远看会比较好看)。
声音的情形也类似,因为人耳无法听到某个频率以上的声音。
但是若取样率不够高的话,
则 dithering 所造成的高频量化误差的增加,就不一定会有好的效果。
---------------------------------------
每次整理这种名词解释文章 似乎都会提到一篇
网友 LukeLo 的「漫谈数位音乐」 2001/07/05刊出
http://www.dearhoney.idv.tw/?p=29
http://www.dearhoney.idv.tw/Audio/LukeLo20010705/
节录其中对於 Dither 的说明
---------------------------------------
Dither是数位音乐处理上非常神奇的技巧,
目的是用少数的 bits 达到与较多 bits 同样的听觉效果,
方法是在最後一个 bit (LSB: Least Significant Bit)动手脚。
例如用 16bits 纪录听起来好似 20bits 的资料,听到原先 16bits 无法纪录的微小资讯
举例来说,
今天我有个 20 bits 的取样资料,我现在想把存成 16 bits 的资料格式,
最简单的转换方式就是直接把後面四个 bits 直接去掉,
但是这样就失去用 20 bits 录音/混音的意义。
比较技巧性的方法是在第 17~20 bits 中加入一些噪音,这段噪音就叫做 dither。
这些噪音加入後,可能会进位而改变第 16 个 bit 的资料,
然後我们再把最後四个 bits 删掉,这个过程我们称为 redithering,
用意是让後面四个 bits 的资料线性地反映在第 16 个 bit 上。
由於人耳具有轻易将噪音与乐音分离的能力,所以虽然我们加入了噪音,
实际上我们却听到了更多音乐的细节。
关於 dither 有种比喻是说我们透过手指间的细缝只能看到眼前部分的图形,
但是如果前後挥动手掌,就可以透过不同时刻看到的各个图形的一小部份,
在脑中建构出完整的图形资讯,这是大脑神奇的地方,不是简单的理论就可以说得通的。
在此我提供一个网址,该网页内提供经过 dither 处理和原始的 wav 档下载,
内容是一个固定频率的声音以等比例逐渐降低音量,
我们可以发现经过 dither 处理过的声音听起来失真比较少且持续比较久,
也就是可以让我们听到更小的音量与细节,还附有 dither 前後的波型图示,网址如下:
(连结失效)
http://www.mtsu.edu/~dsmitche/rim420/reading/rim420_Dither.html。
在众多的 dither 技术中,Sony 公司的 SBM (Super Bit Mapping),
LIVE STUDIO RECORDINGS 的 ULTRA MATRIX PROCESSING,
都是专攻 20 bits 转 16 bits 的技术。
Dither 在数位音讯处理用途非常广泛,
举凡两个波型的相加、振幅的缩放、Normalize 都会用到。
现在的录音室已经进展到 24 bits 录音,
在 CD 还是主流储存媒体的时代,dither 还是非常重要的技术。
顺道一提,在影像处理领域,
将 24 bits 的全彩图形以 16 bits 的高彩画面显示也会用到 dither 的技术。
後续讨论:
http://forums.dearhoney.idv.tw/viewtopic.php?f=3&t=16778
---------------------------------------
接着继续介绍相关有用的资讯:
teamJDK 的「看图理解音讯 Dither」 推荐指数:
★★★★★
http://forums.dearhoney.idv.tw/viewtopic.php?f=3&t=29565&p=183297#p183297
---------------------------------------
人耳对具有周期性的声音、
频谱上特别突出的频率(formant)、
随时间变化而移动的突出频率特别敏感。
当声音从高解析度降低为低解析度的时候,
舍弃末尾 bit 所造成增加的 quantization error,
会和原本的声音讯号有高度的"关连性",
会造成很明显的泛音失真,人耳对这种突出的泛音失真会很敏感。
dither 在音讯中加入所造成的是一种 white noise,
也就是能量在各个频率都一样的 noise。
这种 noise 是随机的、乱序的、不规则的,
我们对这种讯号,大脑会认为这是比较不重要的、没有意义的、无法 tracking 的,
所以会自动降低对它的敏感度,直接把它忽视掉。
所以我们就利用这样的特性,
在由高解析度转为低解析度之前,先对原始的声音讯号加入一个随机的杂讯,
这个杂讯会增加整体的杂讯量,但是会不规则打破原本的 quantization error,
消除 quantization error 和原本讯号之间的"关连"。
也就是用我们比较可以忍受、比较不会去注意到的"沙沙沙"的 white noise,
去取代原本突出的泛音失真。
(图片部份请自行参阅)
加入 dither 後的频谱,注意到总 noise 量比原本多,
但是突出泛音的失真却没有了,
这些原本由於(关连於)sine wave 产生的 quantization error
已经被加入的乱序的、扰动的 dither 给打破了
另外,dither 同时具有将低位元的 information 带到高位元的作用。
最後因为我们对不同频率的敏锐度不一样,
所以如果加入的 dither(noise) 能够做适当的选择,
让这个杂讯的能量在我们比较不注意的高频比较多,而低频比较少,
这样加入 dither 所造成的增加 noise 的副作用,就比较不会被我们察觉到。
为此各家都有不同的演算法,不同的 dither + noise shaping 技术,
例如最有名的 Apogee 公司用的 "UV22"。
---------------------------------------
--
To be Continued。。。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 119.77.133.140
※ 编辑: exFREEzy 来自: 119.77.133.140 (03/20 04:59)