- 积分
- 3474
- 在线时间
- 4924 小时
- 最后登录
- 2024-5-12
- 阅读权限
- 100
- 精华
- 0
- UID
- 202633
- 帖子
- 3397
- 精华
- 0
- 经验
- 3474 点
- 金钱
- 3394 ¥
- 注册时间
- 2010-5-18
|
发表于 2022-5-30 13:28
来自手机端
|
显示全部楼层
本帖最后由 lszyc 于 2022-5-30 15:33 编辑
先说结论,人耳完全具备分辨16位以上精度音频的能力,并且这种能力已经被研究证实,也在音频工业里得到认可并针对这一能力进行特定的处理。结合楼主在这个问题下的回复,楼主的这个问题带点无知和偏见。
研究结论1:动态范围 人耳听觉的动态范围通常在120dB~140dB之间。 对于Naive listener而言,大约为125dB;对于有经验的听音者而言,可以达到135dB~140dB,远超16位音频 96db的动态范围。虽然由于掩蔽效应的原因,人耳不能同时听到强音和弱音,但如果强音和弱音不同时出现,人耳就有这么大的动态范围。以前受限于磁带和LP的动态范围,录音都要经过动态压缩,现代的CD也一样,音乐在制作时,必须经过动态压缩才能在CD上记录不“破音”的声音。
研究结论2:有CD后,最早期的CD音乐听众很多反馈,CD音乐的弱音部分有吱吱的杂音,很难听。音频工作者研究发现,这个吱吱声就是16位的量化噪声,因为发现并明白这个问题时,录音时普遍已经使用了20bits,编辑时普遍使用24位。因此研究人员使用一种称为dither的算法,将弱音部分低于16bits的信息保留下来,使用这种算法后,CD音乐的弱音不再有听众反应吱吱声。
dither算法,在图像领域应用最广泛,比如在只有黑白(1bit 量化)的报纸上,印刷出具有灰度的照片。本质上对空间(频率)分辨率的一种利用,牺牲空间(频率)分辨率,提升精度(bits)。
dither图像算法示例图(转自sysuxx)
|
|