高分辨率音频比 CD 音质更好吗?

让我们讨论一下,当 CD 音质已经足够好时,是否还需要压缩音频数据。
225 位读者喜欢这篇文章。
Woman programming

WOCinTech Chat。Opensource.com 修改。CC BY-SA 4.0

针对最近的一篇文章,一位读者写道:

还有必要使用压缩数据吗?据我所知,在双盲测试中,没有人能够分辨出比 CD 音质无损音频更好的音质。MPEG 添加了一些可以通过练习识别的功能。理论上,FLAC 没有,但仅仅是解压缩行为就可能导致抖动。既然在这个时代已经没有必要压缩 CD 音质,那又何必呢?在音频录制/处理方面,拥有更高的比特率和位深可能是有价值的,但对于聆听目的而言,CD 音质已经足够好,或者说是你能得到的最好音质。

这些都是有趣的观点,值得考虑。让我们逐点分析。

我们需要压缩音频数据吗?

至少对我而言,答案是肯定的。我日常的大部分工作都是在我的精致而优雅的老式 System76 Gazelle 笔记本电脑上完成的。几年前,我将 500GB 7200RPM 硬盘驱动器更换为 480GB SSD。就当时我所能确定的而言,就性能和可靠性而言,我最好的选择是 SanDisk ExtremePro,它特别吸引我,因为它包含 10 年保修。

我也经常出差。当我外出时,我真的很喜欢听我的音乐收藏,其中大部分是 FLAC 格式,相当一部分是从 CD 翻录的,但也包括更高分辨率的内容,通常高达 24 位/96 kHz 脉冲编码调制 (PCM) 数据,其中零星散布着一些 MP3 文件,这些文件是获取某些音乐的唯一选择。总的来说,这个收藏占据了

clh@avignon:~$ du -s --block-size=G Music
237G Music
clh@avignon:~$

因此,在我的 SSD 提供的 480GB 空间中,音乐占用了 237GB。这还剩下 200GB 用于系统和我的工作,还有一点缓冲区。如果我从 FLAC 切换到 WAV,那么所需的空间将或多或少翻倍,这将使我没有工作空间(或更糟)。我可以购买 1TB SSD,或者我可以更换 CD/DVD ROM 驱动器,这样我就可以翻录偶尔的 CD 并创建偶尔的 DVD-RW 备份。因此,实际上,我现在将在我的笔记本电脑上使用 FLAC 文件。

最近,我从 Massdrop 购买了一款出色的独立数字音频播放器 xDuoo X3 II。这是一款音质出色的设备,围绕 AKM4490 DAC 芯片构建。在功能方面,它很基本——没有触摸屏,没有 WiFi,没有 Android——但它运行良好,声音很棒。它可以播放高达 32 位/384 kHz 的 PCM(FLAC、WAV 等),以及高达 DSD128 的 DSD 流文件 (DSF),因此它完全满足我的需求。它使用 MicroSD 卡来存储音乐文件,我的笔记本电脑有 MicroSD 写入器,所以我一切就绪。我可以将我的音乐库从笔记本电脑复制到我的新 256GB MicroSD 卡上,享受我的音乐,而无需将其翻录为 MP3 或其他一些无损格式。但是那张 256GB MicroSD 卡已经相当满了,所以我很庆幸我正在使用压缩音频数据,即 FLAC 格式。

总而言之,我的音乐收藏需要大约 250GB 的存储空间,而 500GB SSD 和 256GB MicroSD 卡的价格都很合理。所以,是的,压缩音频对我来说仍然很重要。

在双盲测试中,有人能分辨出比 CD 音质更好的音质吗?

这里有两个问题。第一个问题是双盲测试是检测音频再现差异的终极方法的观点。第二个问题是能够识别 CD 音质和更高分辨率之间的差异。让我们一次解决一个问题。

双盲测试

我理解双盲测试在一般情况下的重要性,但我也理解,在不一定意识到所有变动部件的情况下,很容易将其作为检测可听差异(不同输入数据之间、不同设备之间、不同房间之间……)的黄金标准来要求。

首先,让我们思考一下“音乐享受”的含义。显然,很多人通过 5 美元的耳塞和智能手机来享受他们的音乐。在另一个极端,有些人花费数千美元来装备他们的聆听环境。我认为,这些人中没有一个人会花费大量时间进行双盲 A/B/X 测试,以确保他们的源文件或设备或聆听环境或月亮的相位对他们的愉悦感产生任何影响。相反,他们沉浸在其中,可能是在乘坐公共汽车或锻炼或烹饪时听背景音乐,也可能是专心聆听音乐并避免其他干扰。

那么,双盲聆听的行为如何在任何有意义的方式上模仿享受音乐的行为呢?

反过来问,谁会安心地知道,一组具有不同且未明确教育水平、音乐兴趣、乐器声音熟悉度(无论是真实的、电子的还是其他)的人,对批判性聆听的兴趣以及“品味”(无论是什么)可以以某种方式告诉我们,组件 A 和 B 或文件 X 和 Y 之间存在(或不存在)有意义的差异?

Empanadas

随着年龄的增长,我发现我真的很讨厌背景音乐,除非我在做饭时——如果没有 Violeta Parra 在厨房里播放音乐,一个人怎么可能做出如此美味的馅饼——或者当人们停下话语并说“哇!我真的很喜欢你正在播放的音乐。”相反,我把听音乐的时间留给自己独处的时候,可以细细品味我所听到的音乐。此外,我意识到我对音乐欣赏的过程已经改变,我对一组听 Spotify 或 MP3 耳机的人是否能分辨出给定专辑的 CD 音质版本和高分辨率版本之间的区别几乎没有兴趣。这对我来说根本不重要。

我从七岁开始弹吉他,现在快 63 岁了。我知道吉他的声音,因为我的头悬在吉他上方,我听到我正在演奏的声音。我知道在浴室里听起来很棒,在卧室里就没那么好听。当我听到录制精良的吉他声时,无论是在 LP、CD 还是高分辨率数字音频上,我都听得出录制得很好。当录制不佳时……毫不奇怪,它听起来不像吉他;它听起来像是吉他的平庸录音。但我不知道大提琴、小提琴或 Moog XYZ 真正听起来是什么样子。我没有花太多时间听这些乐器,我当然也没有批判性或仔细地听过它们的录音来分辨差异。那些焦点小组是否经过批判性和仔细的聆听,并拥有大量的先前经验?谁知道呢?

除此之外,对于那些不经意录制的录音呢?24/96 格式的这些录音的质量会比 16/44.1 格式的版本好很多吗?高分辨率版本和 CD 版本的内容之间是否存在真正的差异?

最后,设备又如何呢?它真的能够重现可能在双盲测试中检测到的差异吗?正如有些人建议的那样,设备的带宽是否会使高分辨率录音听起来更糟(而不是相同或更好)?

所以,双盲测试。从我的角度来看,除非所有变量(包括我尚未考虑的变量)都得到仔细和适当的控制,否则谁知道呢?当有人想出一种双盲测试我使用音乐的方式时,也许我会更信服。

有人识别出差异吗?

在这里,我们有了更坚实的基础。显然,人们已经识别出差异,正如 Joshua Reiss 的 AES 元分析所表明的那样。还有一篇名为“人耳听不见的高频声音影响大脑活动:超声波效应”的文章,我发现这篇文章非常有趣,也许是因为它非常临床化。

Reiss 的论文对我来说特别有趣,因为它(科学地)否定了一篇早期论文,该论文声称中高分辨率文件没有可听见的差异。它说,“[结果表明,测试对象在区分高分辨率内容方面具有微小但具有统计学意义的能力,并且当测试对象接受广泛的培训时,这种效果会急剧增加。”换句话说,普通人可以听到差异,而那些投入精力仔细训练听力的人可以清楚地听到差异。

为什么我们可能(或可能不会)听到所谓的 Hi-Res 文件中的差异

在我们能够确定我们是否可以听到同一录音的高分辨率、CD 和 MP3 版本之间的差异之前,我们需要问:“实际上存在差异吗”?

开源来救援!频谱分析仪 Spek 是我最喜欢的工具之一,用于检查我购买的所谓高分辨率音乐文件,以确保它们可以合法地称为高分辨率(是的,当我发现他们的高分辨率文件不符合要求时,我曾向下载商店投诉)。我不知道 Spek 的傅里叶变换是否完美执行(虽然因为它是开源的,如果我想知道,我可以查明)。尽管如此,Spek 讲述了一些有趣的故事。

这是 Orchestra Baobab 的“Woulinewa” 24/96 版本

Audio graph of Orchestra Baobab's Woulinewa

看看高达 40kHz+ 的泛音。想想将这些泛音过滤以适应 16/44.1 PCM。现在想想可能——也可能没有——很好地应对 15kHz 到 25kHz 泛音的模数和数模转换。慢速滤波器(无法消除混叠误差)、快速滤波器(消除混叠误差但可能引入相移)……谁知道在制作此文件的 CD 音质版本时会发生什么?

但也有相反的问题。这是 Trentemøller 的“One Eye Open” 24/96 版本

Trentemøller's One Eye Open audio graph

哇,看看刚好在 20kHz 以上的截止频率!一定有一些严重的滤波正在发生,以使此音轨适合 16/44.1 CD 音质。

让我们再思考一下这个问题。首先,在这两个音乐文件中,泛音都处于非常低的水平:-80dB 或更低。我听到怀疑论者在那里抱怨“我们当然听不到那个”。但是我们需要查看高音和低音音乐之间的差异,以便将此置于上下文中。许多基音都在 -40dB 到 -45dB 范围内,因此较低水平基音(-45dB)和较高水平泛音(-80dB)之间的差异仅为 35dB(考虑到电压,每 6 dB 或多或少是两倍响亮,因此 -45dB 和 -80dB 之间的差异约为一百倍 - -80dB 是 -45 db 的 1/100)。

此外,我们习惯于在较低水平听到更高的频率;看看“绿色部分”——它在 -60dB 到 -70dB 范围内,即仅比泛音响亮 10dB 到 15dB(同样,安静或响亮两到三倍)。我们能听到绿色部分吗?黄色部分?青色部分?我不知道。

我可以粘贴更多 Spek 屏幕截图,这些截图显示了 20kHz 以上的内容,以及显示砖墙滤波器的屏幕截图。但我的主要观点是:不要期望你的 24/96(或更高)文件具有大量高分辨率内容——有时,它们没有!

根据这份 Drummer World 报告,铙钹频率远远超出人耳可听范围。铙钹产生音乐泛音——理论上——只有蝙蝠才能听到。但我的重点不是超高频声音是可听见的;而是我们为消除它所做的事情可能会产生许多不良副作用。当然,理论上说不会。但那是理论。我可以相信所有 ADC 和 DAC 实现都能正确做到这一点吗?嗯……

将同一首歌曲的 CD 音质版本和高分辨率版本进行比较怎么样?

我没有很多 16/44.1 和高分辨率版本的音乐,但我确实有一些 Led Zeppelin 的副本。我使用 Spek 分析了专辑 Mothership 中的“Immigrant Song”的 16/44.1 版本和 Led Zeppelin III (Remastered) 的 24/96 版本。我还拉伸了 24/96 版本的 Spek 窗口,使 20kHz 线条位于相同的垂直位置。这是它的样子

Led Zeppelin Immigrant song audio graph

在 24/96 版本中,20kHz 以上有很多内容,介于 -60dB 和 -70dB 之间,这并不是很低。为了使其低于奈奎斯特极限,16/44.1 版本中过滤掉了该内容。

因此,使用 Spek 测试,此音轨看起来像是比较 CD 音质和高分辨率的不错候选者。但是,这两个版本之间可能存在其他差异。

例如,一个版本可能比另一个版本压缩得更多,或者其整体电平可能设置得更高。压缩(涉及将信号电平差异化地移动到最大值 - 0dB - 附近,因此非常安静的段落更响亮,而响亮的段落正好在限制范围内)通常是为了使音轨在广播媒体上听起来更响亮而完成的,一些广播公司认为这很有吸引力(请参阅 Wikipedia 上关于 响度战争 的条目)。这在 Mothership 上的“Communication Breakdown”版本中很明显,其中前奏期间的峰值出现在 -3dB 和 0dB 之间,而 Led Zeppelin I (Remastered) 上的峰值出现在 -6dB 和 -3dB 之间。换句话说,Mothership 上的前奏比 I 上的前奏响亮两倍。您可以使用出色的开源音频播放器(如 Guayadeque)来查看这种差异,该播放器具有电平表。

另一个例子:较早的音乐通常在混音时降低了低音,因为在 1970 年代的廉价唱机上无法播放重低音,而当重新混音时,低音可能会被调回。这可以使用频谱分析仪进行测试,该分析仪显示给定时刻的电平。Audacity 有一个插件,似乎可以提供这种测量。

或者,可能还有其他更改使两个歌曲版本听起来截然不同。Mothership 上的“Communication Breakdown”经过重新混音,因此前奏吉他 riff 牢固地位于立体声图像的中心,而不是像 I (Remastered) 上那样偏左。用我的耳朵相对简单且明确地检测到平衡重新配置,但在比较一个版本与另一个版本时,它也可以被感知为通道之间的电平差异。

总而言之,很难确保从不同来源以不同分辨率提取的“同一首歌曲”听起来不同,因为一个是 CD 音质,另一个是高分辨率。更好的方法可能是从具有真正高分辨率内容的高分辨率音轨开始,然后对其进行滤波和降采样到 CD 音质。但这仅解决了“当您谈论具有真正高分辨率内容的原始高分辨率音轨,并且该音轨已被滤波和降采样到 CD 音质时,我应该购买 CD 音质版本还是高分辨率版本?”这个问题。

我目前的结论是……

至少从我的角度来看,没有简单的方法可以解决这个问题,但我宁愿谨慎:我更愿意在可能的情况下购买高分辨率文件(是的,我总是购买我的音乐)。我最喜欢的绝对组合是:1) 购买一张出色的 LP,以及 2) 在购买价格中找到一张包含高分辨率数字副本的优惠券(感谢 Nils Frahm 和其他人)。

然后,有一天当我有很多空闲时间和精良设备时,也许我可以说服自己我可以听到差异。与此同时,我知道我并没有被剥夺表演的全部辉煌,因为我选择了 16/44.1 而不是 24/96 版本。

以及更多音乐

好的,关于高分辨率与 CD 与 MP3 的长篇大论就到此为止。让我们来谈谈音乐,因为这才是真正重要的,对吧?

我过去曾提到过 Lenine,特别是他的专辑 O Dia Em Que Faremos Contato。我第一次接触 Lenine 是我在星巴克买到的一张 CD,“很久以前”(如果你还记得在咖啡店买 CD,你可能可以弄清楚那是多久以前的事了),其中包括另一张 Lenine 专辑 Na presão 中的一首曲目,“A rede”。听听这首;多么精彩的曲目,多么棒的专辑!我的最初是 CD 格式,但我后来将其翻录为 FLAC 格式,并将备份存储在地下室。

如果您(像我一样)对 Jimi Hendrix 情有独钟,您真的需要听听 Tangerine Dream 版本的“Purple Haze”。哦,天哪,这太疯狂了!您可以在他们 1992 年的巡回演出专辑 Live in America 中找到它, 在 7digital 上,这是一个很棒的、对 Linux 友好的数字下载站点。

最后,在听了多年合辑专辑中“Sharing”的广播编辑版后,我在 7digital 上购买了 Bugge Wesseltoft 专辑 Sharing;尽管它似乎在加拿大消失了,但至少在美国和新西兰仍然可用。这不仅仅是美妙的音乐;我鼓励您查看 Bugge 的其他作品,因为任何提供 New Conception of Jazz 的人都值得认真研究。

Chris Hermansen portrait Temuco Chile
自从 1978 年从不列颠哥伦比亚大学毕业以来,我几乎离不开电脑。我从 2005 年开始成为全职 Linux 用户,从 1986 年到 2005 年成为全职 Solaris 和 SunOS 用户,在此之前是 UNIX System V 用户。

9 条评论

MP3 压缩向音乐添加了人们可以识别的功能 - MP3 的双盲测试表明,人们可以分辨出 16 位和 24 位之间的区别。
没有人成功识别出 16 位及以上或 CD 和更高采样率的无损文件之间的差异。
如果我在录音棚里,我可能会使用更高的比特率和采样率,以便为处理和减少效果中的可能特征提供开销,但对于纯粹的聆听,CD 从未被超越。
如果您了解声音的数学原理,您就会意识到房间里的简单通风对声音的影响比额外的几位比特更大。

感谢您的评论,Tom Potts。但是,当您说“没有人成功识别出 16 位及以上或 CD 和更高采样率的无损文件之间的差异”时,您是不正确的。我向您推荐我在文章中提到的音频工程学会元研究。

关于以 24 位录音,我更喜欢以该位深接收我的音乐,而不是被压缩成 16 位。YMMV!

回复 作者:Tom Potts (未验证)

正如您所提到的,高分辨率音频测试的问题在于它几乎从来都不是相同的录音。当发布高分辨率内容时,它几乎总是经过重新混音/重新母带处理。这意味着任何尝试将其与原始 CD 版本进行比较的尝试都将比较混音/母带处理工作,这很可能会淹没分辨率造成的任何差异。

一个更好的测试(我不太常见到)是从高质量的高分辨率源开始。然后降采样到 16/44。这样,您就有了两个录音(原始版本和降采样版本),它们的混音完全相同,唯一的区别是分辨率。现在您可以在两者之间执行 ABX 测试,并有理由相信任何差异都是分辨率差异的结果,而不是录音的其他方面。

当然,如果您执行此 ABX 测试,则必须确保您的设备(放大器、扬声器等)的模拟部分能够重现超声波频率 - 否则任何差异都将是听不见的。并且电平必须匹配 - 如果一个源甚至比另一个源稍响,人们会认为它听起来更好。

但即使如此,也不能保证,因为这两个数字源将使用不同的 DAC - 一个高分辨率 DAC 和一个 CD 音质 DAC。即使两个源都播放到同一个物理盒中,DAC 芯片也可能会为不同的分辨率采用不同的电路路径。可能无法完全区分分辨率差异导致的音频差异与使用不同 DAC 导致的音频差异。

换句话说,尽管我们应该能够执行比人们通常做的更好的测试,但尝试执行一个只有分辨率不同而其他一切都相同的比较将是一个极其困难的挑战。

感谢您的评论,David C.。我同意您的观点和结论。此外,如果所讨论的音乐是以 96/24 混音的,那么我更喜欢以这种方式接收它,而不是进一步 - 并且不必要地 - 转换为 44.1/16。相反,如果我想要的专辑仅以 44.1/16 甚至 MP3 格式提供,那么我会接受它现在的样子。

回复 作者:David C.

我强烈建议您阅读 http://www.realhd-audio.com/?cat=45 中的帖子和/或订阅 Mark 的新闻通讯,了解有关此主题和其他高分辨率音频主题的信息。

感谢您的评论,Alex。Mark Waldrep 在高分辨率音频方面拥有丰富的经验,他的想法总是很有趣,有时甚至具有挑衅性。

回复 作者:alexsilvacz

我喜欢 FLAC 文件,并且尽可能喜欢无损和本地(即非流媒体)文件。我感到有必要发表评论,因为几年前 xiph.org 上有一篇相关的文章说服我远离了质量更高的音频文件(和所需的设备)。我想在这里分享一下,因为我发现它们非常有用(而且那个视频是我迄今为止看过的最喜欢的技术视频/演示)。强烈推荐。

感谢您的撰写!

文章:https://people.xiph.org/~xiphmont/demo/neil-young.html
视频:https://xiph.org/video/vid2.shtml

感谢您的友好评论,Kyle。请谨慎对待,不要不加批判地接受 xiph.org 的评论。我在文章中提到的 AES 参考资料回顾了试验的已发表结果,并发现 xiph.org 文章中关于高分辨率的结论是不正确的。就我个人而言,我发现 xiph.org 网站上提出的观点,即我们应该避免积累高分辨率音乐,因为我们的播放设备可能难以很好地重现它,也有点奇怪 - 为什么不提倡购买不会在高分辨率内容方面出现问题的设备呢?

无论如何,YMMV,正如他们所说!并感谢您的撰写!

回复 作者:K_REY_C

Creative Commons License本作品根据 Creative Commons Attribution-Share Alike 4.0 International License 许可。
© . All rights reserved.