[基础知识] 将DSD转WAV的一点心得

[复制链接] 查看: 60474|回复: 89

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 09:23 | 显示全部楼层
也就是说,除非象38#那样关掉滤波器,自己用软件转换SACD到PCM文件,只能得到CDDA采样率的频响范围。

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 13:00 | 显示全部楼层
接续前贴

但是,
38#楼的88.2KHz FLAC文件也存在一个严重问题,
回头看按常规gsf2pcm软件滤波后还有相当多的RF噪声没有滤净(滤波对通带纹波的附加伤害另说),
38#楼的88.2KHz FLAC文件,如果以NOS的方式推给PCM DAC,DAC将承受多大的压力!完不成任务啊!
所以如我以前认为高清文件可以NOS那是错得离谱。

论坛先前有一篇《【回归理性】对话Thorsten·Loesch(解读PCM vs DSD)翻译 & 曾颂勤博士谈“高清音频”》的文章,这几天跟楼主走一遍DSD转PCM,实际也是过了一遍文章内容:
如果我们把24-Bit 352.8KHz(DXD-PCM)文件转换成1-Bit 2.822MHz (DSD) 文件,我们会损失近99.96% PCM格式支持的振幅信息,而我们只能得到12.5% DSD系统支持的时域信息。

如果我们把DSD文件转换成DXD文件,也就是把1-Bit at 2.822MHz转换为24-Bit at 352.8kHz,我们将会损失87.5% DSD文件的时域信息,尽管理论上我们可以把这些重新映射成振幅域。

所以实质上我们得到了两种格式的糟粕,而不是其中一种的精华。

1

主题

0

好友

1989

积分

侠之大者 当前离线

Rank: 6Rank: 6

UID
225808
帖子
1796
精华
0
经验
1989 点
金钱
1777 ¥
注册时间
2010-8-2
发表于 2021-2-16 14:53 | 显示全部楼层

目前   业余条件下都显得不很成熟(DSD播放及其转换)   DAW相对宽松也非主流...........

戏文里说:饭得一口一口地吃,酒要一杯一杯地喝........步子迈得大了,容易扯着蛋!
咱感觉DSD可能不是一个必然的存在........持观望态度

4

主题

2

好友

65

积分

论坛游民 当前离线

Rank: 3Rank: 3

UID
877260
帖子
61
精华
0
经验
65 点
金钱
57 ¥
注册时间
2020-5-6
 楼主| 发表于 2021-2-16 14:53 | 显示全部楼层
LeonBernieniv 发表于 2021-2-16 09:05
这次试试跳过软件前端,临时找个 https://github.com/hank/dsf2flac
也没几个开关,走你
挑一首诺拉琼斯
...

dsd2flac应该是不同于Sound Forge,Audio Gate和Foobar2000的,转码出来的声谱,有可能出现差异。

4

主题

2

好友

65

积分

论坛游民 当前离线

Rank: 3Rank: 3

UID
877260
帖子
61
精华
0
经验
65 点
金钱
57 ¥
注册时间
2020-5-6
 楼主| 发表于 2021-2-16 15:04 | 显示全部楼层

我理解你的意思是,支持24bit 96KHZ或者更高的DAC对于编码范围之内的带噪音文件处理压力很大,有可能无法正常处理,是这个意思吗?

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 16:05 | 显示全部楼层
icbcodc 发表于 2021-2-16 14:53
dsd2flac应该是不同于Sound Forge,Audio Gate和Foobar2000的,转码出来的声谱,有可能出现差异。

我认为这四种之间的差异之小不足以在频谱图片上量化分辨出来。
至于你主楼讨论的电平高低,软件的帮助文本就揭示得很清楚,Scale adjustment. Raw DSD has a modulation depth of approximately 0.5 so with no scaling the PCM peak level is approximately -6dB below 0dBFs,应该不是问题所在了。

4

主题

2

好友

65

积分

论坛游民 当前离线

Rank: 3Rank: 3

UID
877260
帖子
61
精华
0
经验
65 点
金钱
57 ¥
注册时间
2020-5-6
 楼主| 发表于 2021-2-16 16:32 | 显示全部楼层
LeonBernieniv 发表于 2021-2-16 16:05
我认为这四种之间的差异之小不足以在频谱图片上量化分辨出来。
至于你主楼讨论的电平高低,软件的帮助文 ...

我理解这英文是说:dsf2flac默认转出的PCM音频是用比最大音量小6dB的音量。

这样有可能转换出的FLAC音量明显小。一般声谱上可能真能看得出分别。

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 16:37 | 显示全部楼层
icbcodc 发表于 2021-2-16 15:04
我理解你的意思是,支持24bit 96KHZ或者更高的DAC对于编码范围之内的带噪音文件处理压力很大,有可能无法 ...

由高采样率的一比特转换成PCM,软件所附带的滤波器应该就是抽取滤波器,对应于过采样的内插滤波器,"抽取滤波器"的基本作用是滤除音频通带以外的噪声以防混叠到音频带。
滤除这部分噪声对于数字滤波芯片来说当然不算问题,前面的意思是我自己的认识有偏差。

4

主题

2

好友

65

积分

论坛游民 当前离线

Rank: 3Rank: 3

UID
877260
帖子
61
精华
0
经验
65 点
金钱
57 ¥
注册时间
2020-5-6
 楼主| 发表于 2021-2-16 16:59 | 显示全部楼层
从这张算是RCA经典的DSD ISO中抓的DSF文件。虽然是上世纪60年代的录音。


disc150k.jpg front-150k.jpg back1150k.jpg


默认音量声谱

DEFAULT DB.jpg

手动减小音量3dB后的声谱
-3db.jpg

手动再减小音量3dB,即比原始音量小了6dB。

-6db.jpg

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 17:13 | 显示全部楼层
icbcodc 发表于 2021-2-16 16:32
我理解这英文是说:dsf2flac默认转出的PCM音频是用比最大音量小6dB的音量。

这样有可能转换出的FLAC音 ...

通常一比特调制是按50%来的,不做电平调节转换得到的PCM电平是0dBFs的一半,回到第一页,根据描述是软件转换时默认加了6dB的增益。而这张SACD唱片是+3dB的SACD,差不多70%的调制深度,按软件默认的增益肯定削波。
然后这个增益选项都是可选的,dsf2pcm这个软件我也可以在编译前修改成默认+6dB(默认是+4dB),所以说音量不是问题。

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 17:25 | 显示全部楼层
icbcodc 发表于 2021-2-16 16:59
从这张算是RCA经典的DSD ISO中抓的DSF文件。虽然是上世纪60年代的录音。

恕俺粗鄙,看这种频谱图,犹如听霍洛维茨弹琴,象捉蚂蚁一样!

4

主题

2

好友

65

积分

论坛游民 当前离线

Rank: 3Rank: 3

UID
877260
帖子
61
精华
0
经验
65 点
金钱
57 ¥
注册时间
2020-5-6
 楼主| 发表于 2021-2-16 17:53 | 显示全部楼层

关于《Every Breath You Take - Classics》DSD数码文件质量的问题,特意对比了The Police 1983年的老经典SACD专辑《Synchronicity》,同样是DSF文件,同样有Every Breath You Take这首经典。


下面是83年的老专辑中未重新采样的声谱:

B1 Every Breath You Take 24BIT 352,800hz.jpg

88.2khz采样后的声谱:

B1 Every Breath You Take 24BIT 88.2khz.jpg

下面是2003年精选辑中的88.2khz重新采样的声谱:

The classics album 24bit 88.2Khz spectrum.jpg

都做了最大不失真音量放大。

4

主题

2

好友

65

积分

论坛游民 当前离线

Rank: 3Rank: 3

UID
877260
帖子
61
精华
0
经验
65 点
金钱
57 ¥
注册时间
2020-5-6
 楼主| 发表于 2021-2-16 17:56 | 显示全部楼层
LeonBernieniv 发表于 2021-2-16 17:25
恕俺粗鄙,看这种频谱图,犹如听霍洛维茨弹琴,象捉蚂蚁一样!

文件做了缩小到150K的处理,否则无法上传,清晰度差太多了。

论坛硬盘要扩容,放大对上传图像的限制。

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 18:25 | 显示全部楼层
icbcodc 发表于 2021-2-16 17:53
关于《Every Breath You Take - Classics》DSD数码文件质量的问题,特意对比了The Police 1983年的老经典 ...

第二张频谱图看起来比较完美,保留了88.2KHz该有的有用信息!滤波器没有选择在22.05K处切上一刀,弄清楚是什么动作机制就好了!

4

主题

2

好友

65

积分

论坛游民 当前离线

Rank: 3Rank: 3

UID
877260
帖子
61
精华
0
经验
65 点
金钱
57 ¥
注册时间
2020-5-6
 楼主| 发表于 2021-2-16 19:00 | 显示全部楼层
如果我们把24-Bit 352.8KHz(DXD-PCM)文件转换成1-Bit 2.822MHz (DSD) 文件,我们会损失近99.96% PCM格式支持的振幅信息,而我们只能得到12.5% DSD系统支持的时域信息。

如果我们把DSD文件转换成DXD文件,也就是把1-Bit at 2.822MHz转换为24-Bit at 352.8kHz,我们将会损失87.5% DSD文件的时域信息,尽管理论上我们可以把这些重新映射成振幅域。

所以实质上我们得到了两种格式的糟粕,而不是其中一种的精华。

    针对这个结论,做个小实验。

    手头刚好有些真24bit 88.2kHz真FLAC文件,先转换为1bit DSD 64的DSF文件,再转换回24bit 88.2kHz WAV文件,将FLAC与WAV声谱进行对比。

前者是源FLAC,后者是转换一圈之后的WAV。

原始flac声谱.jpg dsf2wav声谱.jpg

源FLAC文件信息:
原始flac文件信息.jpg

转换一圈之后的WAV文件信息:
dsf2wav文件信息.jpg

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 19:10 | 显示全部楼层
1bit调制后顶部那些噪声就是抹不掉的特征,我惊讶的是“The Police 1983年的老经典SACD专辑《Synchronicity》“这个,从未转换和转换后的频谱看起来倒象是DSD128!

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 19:22 来自手机端 | 显示全部楼层
这个专辑请用176.4转换成PCM,顶部的噪声带就会露出来。

4

主题

2

好友

65

积分

论坛游民 当前离线

Rank: 3Rank: 3

UID
877260
帖子
61
精华
0
经验
65 点
金钱
57 ¥
注册时间
2020-5-6
 楼主| 发表于 2021-2-16 19:24 | 显示全部楼层
LeonBernieniv 发表于 2021-2-16 18:25
第二张频谱图看起来比较完美,保留了88.2KHz该有的有用信息!滤波器没有选择在22.05K处切上一刀,弄清楚 ...

应该是不同年份版本的DSF文件本身不同,过程中没有加额外滤波器。

视觉上的声谱区别没有反应到听感上,暂时听不出分别。

36

主题

0

好友

3498

积分

罗宾汉 当前离线

Silenton Shutupov Speechlesski

Rank: 7Rank: 7Rank: 7

UID
238600
帖子
3614
精华
0
经验
3498 点
金钱
3418 ¥
注册时间
2010-9-9
发表于 2021-2-16 19:36 | 显示全部楼层
icbcodc 发表于 2021-2-16 19:24
应该是不同年份版本的DSF文件本身不同,过程中没有加额外滤波器。

视觉上的声谱区别没有反应到听感上 ...

滤波器是软件根据采样率自动选择的,它能选择在44.1那里切上一刀,就说明它判别音频文件是DSD128的。
与第一页的那张专辑比较,原盘分析频谱的采样率是96K,而这张83年老专辑分析采样率是192K,通带也是前者的两倍。

3

主题

0

好友

202

积分

业余侠客 当前离线

Rank: 4

UID
632039
帖子
204
精华
0
经验
202 点
金钱
196 ¥
注册时间
2013-10-26
发表于 2021-2-16 19:59 | 显示全部楼层
真不明白搞得这么复杂干嘛?

我用新版foobar + sacd插件这些都解决了,从没有任何问题。

你需要的是:
foobar2000 1.6.x

插件:
foo_dsd_converter 0.1.5 (SACD-ISO转DSF)
foo_input_sacd 1.2.7 (DSD解码播放,DSF转成24bit 176KHz WAV)
FLAC Encoder 1.3.3 (WAV转成FLAC)
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Powered by Discuz! X3.4

© 2001-2012 Comsenz Inc.

返回顶部