Hi-Res 音频是否比 CD 音质更好?

让我们讨论一下,当 CD 音质已经足够好时,是否还需要压缩音频数据。
225 位读者喜欢这篇文章。
Woman programming

WOCinTech Chat。由 Opensource.com 修改。CC BY-SA 4.0

针对最近的一篇文章,一位读者写道:

是否仍然需要压缩数据?据我所知,在双盲测试中,没有人能够识别出比 CD 音质无损音频更好的声音。MPEG 添加了一些可以通过练习识别的功能。理论上,FLAC 没有,但仅仅是解压缩的行为就可能导致抖动。既然在这个时代没有必要压缩 CD 音质,那又何必呢?在音频录制/处理方面,拥有更高的比特率和深度可能是有价值的,但对于聆听目的而言,CD 音质已经足够好,或者说是你能得到的最好的音质。

这些都是有趣的观点,值得考虑。让我们逐点分析。

我们需要压缩音频数据吗?

至少对我而言,答案是明确的“是”。我的日常工作主要是在我那台性能良好、优雅老化的 System76 Gazelle 笔记本电脑上完成的。几年前,我将 500GB 7200RPM 硬盘驱动器更换为 480GB SSD。就当时我所能确定的,就性能和可靠性而言,我最好的选择是 SanDisk ExtremePro,它特别吸引我,因为它包含 10 年保修。

我也经常旅行。外出时,我真的很喜欢听我的音乐收藏,其中大部分是 FLAC 格式,相当一部分是从 CD 翻录的,但也包括更高分辨率的东西,通常高达 24 位/96 kHz 脉冲编码调制 (PCM) 数据,以及少量 MP3 文件,这些文件是获取某些音乐的唯一选择。总的来说,这个收藏占用了

clh@avignon:~$ du -s --block-size=G Music
237G Music
clh@avignon:~$

因此,在我 SSD 提供的 480GB 空间中,音乐占用了 237GB。这为我留下了另外 200GB 用于系统和我的工作,还有一点缓冲空间。如果我从 FLAC 转换为 WAV,那将或多或少使所需的空间量增加一倍,这将使我没有工作空间(或更糟)。我可以购买 1TB SSD,或者我可以更换 CD/DVD ROM 驱动器,这样我就可以翻录偶尔的 CD 并创建偶尔的 DVD-RW 备份。因此,实际上,我现在将在我的笔记本电脑上使用 FLAC 文件。

最近,我从 Massdrop 购买了一款出色的独立数字音频播放器 xDuoo X3 II。这是一款音质出色的设备,围绕 AKM4490 DAC 芯片构建。在功能方面,它很基本——没有触摸屏,没有 WiFi,没有 Android——但它运行良好,声音出色。它可以播放高达 32 位/384 kHz 的 PCM(FLAC、WAV 等),以及高达 DSD128 的 DSD 流文件 (DSF),因此它完全满足我的需求。它使用 MicroSD 卡来存储音乐文件,我的笔记本电脑有一个 MicroSD 写入器,所以我一切就绪。我可以将我的音乐库从笔记本电脑复制到我的新 256GB MicroSD 卡上,享受我的音乐,而无需将其翻录为 MP3 或其他一些无损格式。但是那张 256GB MicroSD 卡已经非常满了,所以我很庆幸我正在使用压缩音频数据,即 FLAC 格式。

总而言之,我的音乐收藏需要大约 250GB 的存储空间,而 500GB SSD 和 256GB MicroSD 卡的价格都比较合理。所以,是的,压缩音频对我来说仍然很重要。

在双盲测试中,有人能识别出比 CD 音质更好的声音吗?

这里有两个问题。第一个问题是双盲测试是检测音频再现差异的终极方法。第二个问题是能够识别 CD 音质和更高分辨率之间的差异。让我们逐个讨论。

双盲测试

我理解双盲测试在一般情况下的重要性,但我也理解,在不一定意识到所有可变因素的情况下,很容易将其要求为检测可听差异(不同输入数据之间、不同设备之间、不同房间之间……)的黄金标准。

首先,让我们思考一下“音乐享受”的含义。显然,很多人通过 5 美元的耳塞和智能手机享受他们的音乐。另一方面,有些人花费数千美元来装备他们的聆听环境。我认为,这些人中没有一个人会花费大量时间进行双盲 A/B/X 测试,以确保他们的源文件或设备或聆听环境或月亮的相位对他们的愉悦感产生任何影响。相反,他们沉浸其中,可能是在乘坐公共汽车或锻炼或在背景音乐中烹饪,也可能是专心聆听音乐并避免其他干扰。

那么,双盲聆听的行为如何在任何有意义的方式中模仿享受音乐的行为呢?

反过来问这个问题,谁会感到安心,知道一个由不同和未指定教育水平、音乐兴趣、乐器声音熟悉度(无论是真实的、电子的还是其他)的人组成的专家组,对批判性聆听的兴趣以及“品味”(无论那是什么)能够在某种程度上告诉我们,组件 A 和 B 或文件 X 和 Y 之间存在(或不存在)有意义的差异?

Empanadas

随着年龄的增长,我发现我真的很讨厌背景音乐,除非我在做饭——如果没有 Violeta Parra 在厨房里播放,一个人怎么可能做出如此美味的肉馅卷饼呢?——或者当人们停下话头说“哇!我真的很喜欢你放的这首音乐。”相反,我把听音乐的时间留给我独自一人并且可以细细品味我所听到的音乐的时候。此外,我认识到我对音乐的欣赏过程已经改变,而且我对由那些在廉价耳塞上听 Spotify 或 MP3 的人组成的专家组是否能分辨出给定专辑的 CD 音质版本和高分辨率版本之间的区别几乎没有兴趣。这与我无关。

我从七岁开始弹吉他,现在快 63 岁了。我知道吉他的声音,因为我的头就悬在吉他上方,我听到我弹奏的声音。我知道在浴室里听起来很棒,在卧室里就没那么好了。当我听到录制精良的吉他时,无论是在 LP、CD 还是高分辨率数字格式上,我知道它是录制精良的。当它录制得不好时……毫不奇怪,它听起来不像吉他;它听起来像吉他的平庸录音。但我不知道大提琴、小提琴或 Moog XYZ 真正听起来像什么。我没有花太多时间听这些乐器,而且我当然没有批判性或仔细地听过它们的录音来检测差异。那些焦点小组是否进行了批判性和仔细的聆听,并具有大量的先前经验?谁知道呢?

除此之外,对于那些例如在没有非常用心的情况下制作的录音呢?24/96 格式的那些录音质量会比 16/44.1 格式好得多吗?高分辨率版本和 CD 版本的内容之间是否存在真正的差异?

最后,设备又如何呢?它真的能够重现双盲测试中可能检测到的差异吗?正如有些人所建议的那样,设备的带宽是否会使高分辨率录音听起来更糟(而不是相同或更好)?

所以,双盲测试。从我的角度来看,除非所有变量(包括我没有考虑到的变量)都得到仔细和适当的控制,否则谁知道呢?当有人想出一种双盲测试我使用音乐的方式时,也许我会更信服。

有人识别出差异吗?

在这里,我们有了更坚实的基础。显然,人们已经识别出了差异,正如 Joshua Reiss 的 AES 元分析所表明的那样。还有一篇题为“听不见的高频声音影响大脑活动:超声波效应”的文章,我发现这篇文章非常引人入胜,也许是因为它非常临床。

Reiss 的论文对我来说特别有趣,因为它(科学地)否定了一篇早期论文,该论文声称中高分辨率文件之间没有可听见的差异。它说,“[结果表明,测试对象在区分高分辨率内容方面具有微小但统计上显着的能力,并且当测试对象接受广泛培训时,这种效果显着增加。”换句话说,普通人可以听到差异,而那些投入精力仔细训练听力的人可以清楚地听到差异。

我们可能(或可能不会)听到所谓的高分辨率文件中的差异的原因

在我们能够确定我们是否可以听到同一录音的高分辨率、CD 和 MP3 版本之间的差异之前,我们需要问:“实际上存在差异吗”?

开源来救援!频谱分析仪 Spek 是我最喜欢的工具之一,用于检查我购买的所谓高分辨率音乐文件,以确保它们可以合法地称为高分辨率(是的,当我发现他们的高分辨率文件不尽如人意时,我曾向下载商店投诉)。我不知道 Spek 的傅里叶变换是否完美执行(虽然因为它是开源的,如果我想知道,我可以找到答案)。然而,Spek 讲述了一些有趣的故事。

这是 Orchestra Baobab 的 “Woulinewa”,24/96 格式

Audio graph of Orchestra Baobab's Woulinewa

看看那里高达 40kHz+ 的泛音。想想将这些泛音过滤以适应 16/44.1 PCM。现在想想可能——也可能不会——很好地处理 15kHz 到 25kHz 泛音的模数和数模转换。慢速滤波器(无法消除混叠错误)、快速滤波器(消除混叠错误但可能引入相移)……谁知道在制作此文件的 CD 音质版本时会发生什么?

但也有相反的问题。这是 Trentemøller 的 “One Eye Open”,24/96 格式

Trentemøller's One Eye Open audio graph

哇,看看正好在 20kHz 以上的那个截止点!肯定发生了一些严重的滤波,以使此音轨适合 16/44.1 CD 音质。

让我们再思考一下这个问题。首先,在这两个音乐文件中,泛音都处于相当低的水平:-80dB 或更低。我听到怀疑论者在那里抱怨“我们当然听不到那个”。但是我们需要查看高水平和低水平音乐之间的差异,以便将此置于上下文中。许多基频都在 -40dB 到 -45dB 范围内,因此较低水平的基频(在 -45dB 处)和较高水平的泛音(在 -80dB 处)之间的差异仅为 35dB(考虑到电压,每 6 dB 大致响亮两倍,因此 -45dB 和 -80dB 之间的差异约为一百倍——-80dB 是 -45 db 的 1/100)。

此外,我们习惯于以较低的水平听到更高的频率;看看“绿色部分”——它在 -60dB 到 -70dB 范围内,也就是说,仅比泛音响亮 10dB 到 15dB(同样,是安静或响亮两到三倍)。我们听到绿色部分吗?黄色部分?青色部分?我不知道。

我可以粘贴更多 Spek 屏幕截图,显示 20kHz 以上的内容,以及显示砖墙滤波器的内容。但我的主要观点是:不要期望你的 24/96(或更高)文件具有大量高分辨率内容——有时,它们没有!

根据这份 Drummer World 报告,铙钹频率超出听不见的范围。铙钹会产生音乐泛音,理论上只有蝙蝠才能听到。但我的观点不是超高频的东西是可听见的;而是我们为消除它所做的事情可能会产生许多糟糕的副作用。当然,理论上说不会。但那是理论。我可以相信所有 ADC 和 DAC 实现都能正确地做到这一点吗?嗯……

比较同一首歌曲的 CD 音质和高分辨率版本怎么样?

我没有很多 16/44.1 和高分辨率版本的音乐,但我确实有一些 Led Zeppelin 的重复文件。我使用 Spek 分析了专辑 Mothership 中的 “Immigrant Song” 的 16/44.1 版本,以及 Led Zeppelin III (Remastered) 中的 24/96 版本。我还拉伸了 24/96 版本的 Spek 窗口,使 20kHz 线条处于相同的垂直位置。这是它的样子

Led Zeppelin Immigrant song audio graph

在 24/96 版本中,20kHz 以上有很多内容,介于 -60dB 和 -70dB 之间,这并不是很低。为了使其低于奈奎斯特极限,16/44.1 版本中过滤掉了这些内容。

因此,使用 Spek 测试,此音轨看起来是比较 CD 音质和高分辨率的不错候选者。但是,这两个版本之间可能存在其他差异。

例如,一个版本可能比另一个版本压缩得更多,或者它的整体音量可能设置得更高。压缩(包括将信号电平差异化地移动到最大值——0dB——因此非常安静的段落更响亮,而响亮的段落正好在极限处)通常是为了使音轨在广播媒体上听起来更响亮,这被一些广播公司认为具有吸引力(请参阅 Wikipedia 上关于 响度战争 的条目)。这在 Mothership 上的 “Communication Breakdown” 版本中很明显,其中前奏期间的峰值出现在 -3dB 和 0dB 之间,而 Led Zeppelin I (Remastered) 上的峰值出现在 -6dB 和 -3dB 之间。换句话说,Mothership 上的前奏比 I 上的前奏响亮两倍。您可以使用具有电平表的出色开源音频播放器(如 Guayadeque)来看到这种差异。

另一个例子:较老的音乐通常在混音时会降低低音,因为在 1970 年代,廉价的唱片播放器无法播放重低音,当重新混音时,低音可能会被调高。这可以使用频谱分析仪进行测试,该分析仪显示给定瞬间的电平。Audacity 有一个插件,似乎可以提供这种测量。

或者,可能还有其他变化使两个歌曲版本听起来截然不同。Mothership 上的 “Communication Breakdown” 经过重新混音,因此前奏吉他 riff 牢固地位于立体声图像的中心,而不是像 I (Remastered) 那样偏向左侧。用我的耳朵来检测平衡重新配置相对简单且明确,但在比较一个版本与另一个版本时,它也可能被感知为通道之间的电平差异。

总而言之,要确保从不同来源以不同分辨率提取的“同一首歌曲”听起来不同,仅仅因为一个是 CD 音质,另一个是高分辨率,这将非常困难。更好的方法可能是从具有真正高分辨率内容的高分辨率音轨开始,然后对其进行滤波和降采样到 CD 音质。但这仅解决了“当我谈论具有真正高分辨率内容的高分辨率原始音轨时,我应该购买 CD 音质版本还是高分辨率版本?”这个问题。

我目前的结论…

至少从我的角度来看,没有一种简单的方法可以解决这个问题,但我更愿意谨慎:我宁愿在可能的情况下购买高分辨率文件(是的,我总是购买我的音乐)。我最喜欢的绝对组合是:1) 购买一张出色的 LP,以及 2) 在购买价格中找到一张内部优惠券,用于获得高分辨率数字副本(感谢 Nils Frahm 和其他人)。

然后,有一天,当我有很多空闲时间和高级设备时,也许我可以说服自己我可以听到其中的区别。与此同时,我知道我没有被剥夺表演的全部荣耀,因为我选择了 16/44.1 版本而不是 24/96 版本。

以及更多音乐

好了,关于高分辨率与 CD 与 MP3 的喋喋不休就到此为止。让我们来谈谈音乐,因为那才是真正重要的,对吧?

我过去曾提到过 Lenine,特别是他的专辑 O Dia Em Que Faremos Contato。我第一次接触 Lenine 是在星巴克买到的一张 CD “很久以前”(如果你还记得在咖啡店买 CD,你可能可以猜到那是多久以前的事了),其中包括另一张 Lenine 专辑 Na presão 中的一首曲目 “A rede”。听听这首歌;多么棒的曲目,多么棒的专辑!我的最初是在 CD 上,但从那时起我将其翻录为 FLAC 并将备份存储在地下室。

如果您(像我一样)对 Jimi Hendrix 有特殊的喜爱,您真的需要听听 Tangerine Dream 版本的 “Purple Haze”。哦,天哪,这太疯狂了!您可以在他们 1992 年的巡回演出专辑 Live in America 中找到它, 在 7digital 上,这是一个很棒的、对 Linux 友好的数字下载网站。

最后,在多年听了一张合辑专辑中的 “Sharing” 的广播编辑版本后,我从 7digital 上购买了 Bugge Wesseltoft 专辑 Sharing;虽然它似乎在加拿大消失了,但它仍然可用——至少在美国和新西兰。这不仅仅是美妙的音乐;我鼓励您查看 Bugge 的其余作品,因为任何提供 New Conception of Jazz 的人都值得认真研究。

Chris Hermansen portrait Temuco Chile
自从 1978 年毕业于不列颠哥伦比亚大学以来,我几乎从不离开电脑,自 2005 年以来一直是全职 Linux 用户,从 1986 年到 2005 年一直是全职 Solaris 和 SunOS 用户,在此之前是 UNIX System V 用户。

9 条评论

MP3 压缩向音乐添加了人们可以识别的功能——MP3 的双盲测试表明,人们可以分辨出 16 位和 24 位之间的区别。
没有人成功识别出 16 位及以上或 CD 和更高采样率的无损文件之间的差异。
如果我在录音棚里,我可能会使用更高的比特率和采样率,为我提供处理和减少效果中可能出现的特征的开销,但对于纯粹的聆听而言,CD 从未被超越。
如果您了解声音的数学原理,您就会意识到房间内简单的气流对声音的影响比额外的几位比特更大。

感谢您的评论,Tom Potts。但是,当您说“没有人成功识别出 16 位及以上或 CD 和更高采样率的无损文件之间的差异”时,您是不正确的。我向您推荐我在文章中提到的音频工程协会元研究。

关于以 24 位录制,我更喜欢以该位深度接收我的音乐,而不是被处理成 16 位。YMMV!

回复 ,作者 Tom Potts(未验证)

正如您所提到的,测试高分辨率音频的问题在于,它几乎永远不是相同的录音。当发布高分辨率内容时,它几乎总是经过重新混音/重新母带处理。这意味着任何尝试将其与原始 CD 版本进行比较的尝试都将比较混音/母带处理工作,这很可能会掩盖分辨率带来的任何差异。

一个更好的测试(我不太常见到)是从高质量的高分辨率源开始。然后降采样到 16/44。这样,您就有两个录音(原始版本和降采样版本),它们的混音完全相同,唯一的区别是分辨率。现在您可以在两者之间执行 ABX 测试,并有理由相信任何差异都是分辨率差异而不是录音其他方面造成的。

当然,如果您执行此 ABX 测试,您必须确保您设备的模拟部分(放大器、扬声器等)能够重现超声波频率——否则任何差异都不会被听到。并且电平必须匹配——如果一个源甚至比另一个源稍微响亮一点,人们就会认为它听起来更好。

但即便如此,也不能保证,因为这两个数字源将使用不同的 DAC——一个高分辨率 DAC 和一个 CD 音质 DAC。即使两个源都播放到同一个物理盒中,DAC 芯片也可能会为不同的分辨率采用不同的电路路径。可能无法完全区分分辨率差异造成的音频差异与使用不同 DAC 造成的音频差异。

换句话说,虽然我们应该能够执行比人们通常做的更好的测试,但尝试执行一个仅分辨率不同而其他所有方面都相同的比较将是一个极其困难的挑战。

感谢您的评论,David C. 我同意您的观点和结论。此外,如果所讨论的音乐是以 96/24 母带处理的,那么我更喜欢以这种方式接收它,而不是进一步 - 并且是无缘无故地 - 转换为 44.1/16。相反,如果我想要的专辑仅以 44.1/16 甚至 MP3 格式提供,那么我会接受它。

回复 ,作者 David C.

我强烈建议您阅读来自 http://www.realhd-audio.com/?cat=45 的帖子和/或订阅 Mark 的新闻通讯,了解有关此主题和其他高分辨率音频主题的信息。

感谢您的评论,Alex。Mark Waldrep 在高分辨率音频方面拥有丰富的经验,他的想法总是很有趣,有时也很有挑衅性。

回复 ,作者 alexsilvacz

我喜欢 FLAC 文件,并且尽可能喜欢无损和本地(即非流式)文件。我觉得有必要发表评论,因为多年前 xiph.org 上有一篇相关的文章,说服我远离了质量高得多的音频文件(和所需的设备)。我想在这里分享一下,因为我发现它们非常有用(而且那个视频是我迄今为止看过的最喜欢的技术视频/演示)。强烈推荐。

感谢您的撰写!

文章:https://people.xiph.org/~xiphmont/demo/neil-young.html
视频:https://xiph.org/video/vid2.shtml

感谢您的友好评论,Kyle。请谨慎对待,不要不加批判地接受 xiph.org 的评论。我在文章中提到的 AES 参考资料回顾了试验的已发布结果,并发现 xiph.org 文章中指出的关于高分辨率的结论是不正确的。就我个人而言,我发现 xiph.org 网站上提出的观点——我们应该避免积累高分辨率音乐,因为我们的播放设备可能难以很好地重现它——也有点奇怪——为什么不提倡购买没有高分辨率内容问题的设备呢?

总之,YMMV,正如他们所说!并感谢您的撰写!

回复 ,作者 K_REY_C

Creative Commons License本作品根据 Creative Commons Attribution-Share Alike 4.0 International License 许可。
© . All rights reserved.