Hi-Res 音频是否比 CD 音质更好?

让我们讨论一下,当 CD 音质已经足够好时,是否还需要压缩音频数据。
225 位读者喜欢这篇文章。
Woman programming

WOCinTech Chat。由 Opensource.com 修改。CC BY-SA 4.0

针对最近的一篇文章,一位读者写道:

是否仍然需要压缩数据?据我所知,在双盲测试中,没有人能够识别出比 CD 音质无损音频更好的音质。MPEG 添加了一些可以通过练习来识别的特征。理论上,FLAC 不会,但仅仅是解压缩行为就可能导致抖动。既然在今天这个时代,没有必要压缩 CD 音质,那么为什么要费心呢?在音频录制/处理方面,可能值得拥有更高的比特率和位深,但对于聆听目的而言,CD 音质已经足够好,或者实际上是你所能得到的最好的音质。

这些都是有趣的观点,值得认真考虑。让我们逐点分析。

我们需要压缩音频数据吗?

至少对我而言,答案是肯定的。我的日常工作主要是在我那台性能良好、优雅老化的 System76 Gazelle 笔记本电脑上完成的。几年前,我将 500GB 7200RPM 硬盘驱动器更换为 480GB SSD。就当时我所能确定的而言,就性能和可靠性而言,我最好的选择是 SanDisk ExtremePro,它特别吸引我,因为它提供了 10 年的保修期。

我也经常旅行。外出时,我真的很喜欢听我的音乐收藏,其中大部分是 FLAC 格式,相当一部分是从 CD 中翻录的,但也包括更高分辨率的素材,通常高达 24 位/96 kHz 脉冲编码调制 (PCM) 数据,以及少量 MP3 文件,这些文件是获取某些音乐的唯一选择。总的来说,这个收藏占用了

clh@avignon:~$ du -s --block-size=G Music
237G Music
clh@avignon:~$

因此,在我的 SSD 提供的 480GB 空间中,237GB 被音乐占用。这还剩下 200GB 用于系统和我的工作,还有一点缓冲空间。如果我从 FLAC 转换为 WAV,那么所需的空间大致会增加一倍,这将使我没有工作空间(或更糟)。我可以购买 1TB SSD,或者我可以更换 CD/DVD ROM 驱动器,这样我就可以翻录偶尔的 CD 并创建偶尔的 DVD-RW 备份。因此,实际上,我现在将在我的笔记本电脑上使用 FLAC 文件。

最近,我从 Massdrop 购买了一款出色的独立数字音频播放器 xDuoo X3 II。这是一款音质出色的设备,围绕 AKM4490 DAC 芯片构建。在功能方面,它很基础——没有触摸屏,没有 WiFi,没有 Android——但它工作良好,声音也很棒。它可以播放高达 32 位/384 kHz 的 PCM(FLAC、WAV 等),以及高达 DSD128 的 DSD 流文件 (DSF),因此它完全满足我的需求。它使用 MicroSD 卡 来存储音乐文件,我的笔记本电脑有一个 MicroSD 写入器,所以我一切就绪。我可以将我的音乐库从笔记本电脑复制到新的 256GB MicroSD 卡上,享受我的音乐,而无需将其翻录为 MP3 或其他有损格式。但是那张 256GB MicroSD 卡已经非常满了,所以幸好我正在使用压缩音频数据,即 FLAC 格式。

总而言之,我的音乐收藏需要大约 250GB 的存储空间,而 500GB SSD 和 256GB MicroSD 卡的价格都非常合理。所以,是的,压缩音频对我来说仍然很重要。

在双盲测试中,有人能识别出比 CD 音质更好的音质吗?

这里有两个问题。第一个是双盲测试是检测音频再现差异的终极方法的观点。第二个是能够识别 CD 音质和更高分辨率之间的差异。让我们逐一讨论。

双盲测试

我理解双盲测试总体上的重要性,但我也理解,很容易将其作为检测可听差异(不同输入数据之间、不同设备之间、不同房间之间……)的黄金标准来要求,而没有必要意识到所有变动的部分。

首先,让我们思考一下“音乐享受”的含义。显然,很多人通过 5 美元的耳塞和智能手机享受他们的音乐。另一方面,有些人花费数千美元来装备他们的聆听环境。我认为,这些人中没有一个人会花费大量时间进行双盲 A/B/X 测试,以确保他们的源文件或设备或聆听环境或月亮的相位对他们的愉悦感产生任何影响。相反,他们处于一种状态,可能是在乘坐公共汽车或锻炼或在背景音乐中做饭,也可能是专心聆听音乐并避免其他干扰。

那么,双盲聆听的行为如何在任何有意义的方式上模仿享受音乐的行为呢?

反过来思考这个问题,谁会感到安心,知道一个由不同且未指明的教育水平、音乐兴趣、乐器声音(无论是真实的、电子的还是其他)的熟悉程度、对批判性聆听的兴趣以及“品味”(无论是什么)的人组成的小组,能够以某种方式告诉我们,组件 A 和 B 或文件 X 和 Y 之间存在(或不存在)有意义的差异?

Empanadas

随着年龄的增长,我发现我真的很讨厌背景音乐,除非我在做饭时——一个人怎么可能在没有厨房里播放 Violeta Parra 的情况下做出如此美味的馅饼——或者当人们停下话语,说出类似“哇!我真的很喜欢你正在播放的音乐。”的话。相反,我把听音乐的时间留给自己独处的时候,可以细细品味我听到的内容。此外,我意识到我对音乐欣赏的过程已经改变,我几乎不关心由在廉价耳塞上听 Spotify 或 MP3 的人组成的小组是否能分辨出给定专辑的 CD 音质版本和高分辨率版本之间的区别。这对我来说根本不重要。

我从七岁开始弹吉他,现在快 63 岁了。我知道吉他的声音是什么样的,因为我的头悬在吉他上方,我听到了我正在演奏的声音。我知道在浴室里听起来很棒,在卧室里就没那么好了。当我听到录制精良的吉他时,无论是在 LP、CD 还是高分辨率数字音频上,我都听得出来它录制得很好。当它录制得不好时……毫不奇怪,它听起来不像吉他;它听起来像吉他的平庸录音。但我不知道大提琴、小提琴或 Moog XYZ 到底听起来像什么。我没有花太多时间听这些乐器,当然也没有批判性地或仔细地聆听它们的录音来检测差异。那些焦点小组是否批判性地、仔细地、并结合大量的先前经验进行了聆听?谁知道呢?

除此之外,对于那些制作粗糙的录音呢?24/96 格式的这些录音质量会比 16/44.1 版本好很多吗?高分辨率版本和 CD 版本的内容之间是否存在真正的差异?

最后,设备怎么样?它真的能够重现双盲测试中可能检测到的差异吗?正如有些人建议的那样,设备的带宽是否会使高分辨率录音听起来更差(而不是相同或更好)?

所以,双盲测试。从我的角度来看,除非所有变量(包括我没有考虑到的变量)都得到仔细和适当的控制,否则谁知道呢?当有人想出一种双盲测试我使用音乐的方式时,也许我会更信服。

有人识别出差异吗?

在这里,我们有了更坚实的基础。显然,人们已经识别出了差异,正如 Joshua Reiss 的 AES 元分析 所表明的那样。还有一篇名为“听不见的高频声音影响大脑活动:超声波效应”的文章,我发现它非常引人入胜,也许是因为它非常临床。

Reiss 的论文对我来说尤其有趣,因为它(科学地)否定了一篇早期论文,该论文声称中高分辨率文件之间没有可听到的差异。它说,“[结果表明,测试对象在区分高分辨率内容方面具有微小但统计上显着的能力,并且当测试对象接受广泛培训时,这种效果会显着增加。”换句话说,普通人可以听到差异,而那些投入精力认真训练听力的人可以清楚地听到差异。

为什么我们可能(或可能不会)听到所谓的高分辨率文件中的差异

在我们能够确定我们是否可以听到同一录音的高分辨率、CD 和 MP3 版本之间的差异之前,我们需要问:“实际上存在差异吗?”

开源来救援!频谱分析仪 Spek 是我最喜欢的工具之一,用于检查我购买的所谓高分辨率音乐文件,以确保它们可以合法地称为高分辨率(是的,当我发现他们的高分辨率文件不合格时,我曾向下载商店投诉)。我不知道 Spek 的傅里叶变换是否完美执行(虽然因为它是开源的,如果我想知道,我可以找到答案)。尽管如此,Spek 讲述了一些有趣的故事。

这是 Orchestra Baobab 的“Woulinewa”的 24/96 版本

Audio graph of Orchestra Baobab's Woulinewa

看看高达 40kHz+ 的泛音。想想将这些泛音过滤以适应 16/44.1 PCM。现在想想可能——或可能不会——很好地处理 15kHz 到 25kHz 范围内的泛音的模数和数模转换。慢速滤波器(不会消除混叠误差),快速滤波器(消除混叠误差但可能引入相移)……谁知道在制作此文件的 CD 音质版本时会发生什么?

但也有相反的问题。这是 Trentemøller 的“One Eye Open”的 24/96 版本

Trentemøller's One Eye Open audio graph

哇,看看 20kHz 以上的截止!肯定一些严重的滤波正在发生,以使此音轨适合 16/44.1 CD 音质。

让我们再深入思考一下。首先,在这两个音乐文件中,泛音都处于非常低的水平:-80dB 或更低。我听到怀疑论者在那里抱怨“我们当然听不到”。但我们需要查看高电平和低电平音乐之间的差异,以便将此置于上下文中。许多基频都在 -40dB 到 -45dB 范围内,因此较低电平基频(-45dB)和较高电平泛音(-80dB)之间的差异仅为 35dB(考虑到电压,每 6dB 或多或少响度增加一倍,因此 -45dB 和 -80dB 之间的差异约为一百倍 - -80dB 是 -45 db 的 1/100)。

此外,我们习惯于以较低的水平听到更高的频率;看看“绿色区域”——它在 -60dB 到 -70dB 范围内,也就是说,仅比泛音响 10dB 到 15dB(同样,安静或响亮两到三倍)。我们能听到绿色区域吗?黄色区域?青色区域?我不知道。

我可以粘贴更多 Spek 屏幕截图,显示 20kHz 以上的内容,以及显示砖墙滤波器的屏幕截图。但我的主要观点是:不要期望你的 24/96(或更高)文件有大量高分辨率内容——有时,它们没有!

根据这份 Drummer World 报告,镲的频率超出人耳可听范围。镲片会产生音乐泛音,理论上只有蝙蝠才能听到。但我的重点不是超高频素材是可听的;而是我们为消除它所做的事情可能会产生许多不良副作用。当然,理论上说不会。但那是理论。我可以相信所有 ADC 和 DAC 实现都做对了吗?嗯……

比较同一首歌曲的 CD 音质版本和高分辨率版本怎么样?

我没有很多 16/44.1 和高分辨率版本的音乐,但我确实有一些 Led Zeppelin 的重复曲目。我使用 Spek 分析了专辑 Mothership 中的“Immigrant Song”的 16/44.1 版本和 Led Zeppelin III (Remastered) 的 24/96 版本。我还拉伸了 24/96 版本的 Spek 窗口,使 20kHz 线条处于相同的垂直位置。这是它的样子

Led Zeppelin Immigrant song audio graph

在 24/96 版本中,有很多高于 20kHz 的内容,介于 -60dB 和 -70dB 之间,这并没有太低。为了使其低于奈奎斯特极限,这些内容在 16/44.1 版本中被过滤掉了。

因此,使用 Spek 测试,这首音轨看起来是比较 CD 音质和高分辨率的不错候选者。但是,这两个版本之间可能存在其他差异。

例如,一个版本可能比另一个版本压缩得更多,或者其整体电平可能设置得更高。压缩(涉及将信号电平差异化地移近最大值 - 0dB - 因此非常安静的段落会更响亮,而响亮的段落恰好在极限处)通常是为了使音轨在广播媒体上听起来更响亮,一些广播公司认为这很有吸引力(请参阅维基百科关于 响度战争 的条目)。这在 Mothership 上的“Communication Breakdown”版本中很明显,其中前奏期间的峰值出现在 -3dB 和 0dB 之间,而 Led Zeppelin I (Remastered) 上的峰值出现在 -6dB 和 -3dB 之间。换句话说,Mothership 上的前奏比 I 上的前奏响两倍。您可以通过使用具有电平表的出色开源音频播放器(如 Guayadeque)来看到这种差异。

另一个例子:较老的音乐通常在母带制作时会降低低音,因为在 1970 年代,廉价唱机无法播放重低音,而当重新制作时,低音可能会被调高。这可以使用频谱分析仪进行测试,该分析仪显示给定时刻的电平。Audacity 有一个插件,似乎可以提供这种测量。

或者,可能存在其他变化,使两个歌曲版本听起来截然不同。Mothership 上的“Communication Breakdown”经过重新混音,因此前奏吉他 riff 稳固地位于立体声图像的中心,而不是像 I (Remastered) 那样偏左。用我的耳朵相对简单且明确地检测到平衡重新配置,但在比较一个版本与另一个版本时,它也可以被感知为声道之间的电平差异。

总而言之,要确保从不同来源以不同分辨率提取的“同一首歌曲”听起来不同,仅仅因为一个是 CD 音质,另一个是高分辨率,这将非常困难。更好的方法可能是从具有真正高分辨率内容的高分辨率音轨开始,然后对其进行滤波和降采样为 CD 音质。但这仅解决了“当我谈论具有真正高分辨率内容的高分辨率原始文件,并且该文件已被滤波和降采样为 CD 音质时,我应该购买 CD 音质版本还是高分辨率版本?”这个问题。

我的结论,目前是……

至少从我的角度来看,没有一种简单的方法可以理清这个问题,但我更喜欢谨慎:我宁愿在可能的情况下购买高分辨率文件(是的,我总是购买我的音乐)。我最喜欢的绝对组合是 1) 购买一张优秀的 LP,以及 2) 在购买价格中找到一张高分辨率数字副本的优惠券(谢谢你,Nils Frahm 和其他人)。

然后,有一天当我有很多空闲时间和精良设备时,也许我就能说服自己,我能听到差异。与此同时,我知道我没有被剥夺表演的全部辉煌,因为我选择了 16/44.1 版本而不是 24/96 版本。

更多音乐

好了,关于高分辨率与 CD 与 MP3 的咆哮就到此为止。让我们谈谈音乐,因为那才是真正重要的,对吧?

我过去曾提到过 Lenine,特别是他的专辑 O Dia Em Que Faremos Contato。我第一次接触 Lenine 是在星巴克购买的 CD,那是“很久以前”的事了(如果你还记得在咖啡店购买 CD,你可能会知道那是多久以前的事了),其中包括另一张 Lenine 专辑 Na presão 中的一首曲目“A rede”。听听这首歌;多么棒的曲目,多么优秀的专辑!我的最初是 CD,但我后来将其翻录为 FLAC,并将备份存储在地下室。

如果你(像我一样)对 Jimi Hendrix 有特别的喜爱,你真的需要听听 Tangerine Dream 版本的“Purple Haze”。哦,天哪,这太疯狂了!你可以在他们 1992 年的巡回专辑 Live in America 中找到它, 在 7digital 上,这是一个很棒的、对 Linux 友好的数字下载网站。

最后,在听了多年汇编专辑中的 “Sharing” 的广播剪辑版后,我在 7digital 上购买了 Bugge Wesseltoft 专辑 Sharing;虽然它似乎在加拿大消失了,但至少在美国和新西兰仍然可用。这不仅仅是优秀的音乐;我鼓励你查看 Bugge 的其他作品,因为任何提供 New Conception of Jazz 的人都值得认真研究。

Chris Hermansen portrait Temuco Chile
自从 1978 年从不列颠哥伦比亚大学毕业以来,我几乎没有离开过电脑,从 2005 年开始成为全职 Linux 用户,从 1986 年到 2005 年是全职 Solaris 和 SunOS 用户,在此之前是 UNIX System V 用户。

9 条评论

MP3 压缩向音乐添加了人们可以识别的特征 - MP3 的双盲测试表明,人们可以分辨出 16 位和 24 位之间的区别。
没有人成功识别出 16 位及以上或 CD 和更高采样率的无损文件之间的差异。
如果我在录音室里,我可能会使用更高的比特率和采样率,为我提供处理和减少效果中可能出现的特征的开销,但对于纯粹的聆听而言,CD 从未被超越。
如果你了解声音的数学原理,你就会意识到房间里简单的气流对声音的影响比额外的几个比特更大。

感谢您的评论,Tom Potts。但是,当您声明“没有人成功识别出 16 位及以上或 CD 和更高采样率的无损文件之间的差异”时,您是不正确的。我向您推荐我在文章中提到的音频工程协会元研究。

关于以 24 位录音,我更喜欢以这种位深接收我的音乐,而不是被大量处理成 16 位。YMMV!

回复 ,作者:Tom Potts (未验证)

正如您所提到的,测试高分辨率音频的问题在于,它几乎永远不是同一个录音。当发布高分辨率内容时,它几乎总是经过重新母带处理/重新混音。这意味着任何将其与原始 CD 版本进行比较的尝试都将比较混音/母带处理工作,这很可能会压倒分辨率带来的任何差异。

一个更好的测试方法(我不太常见到)是从高质量的高分辨率源开始。然后降采样到 16/44。这样,您就有两个录音(原始版本和降采样版本),它们的混音相同,唯一的区别是分辨率。现在,您可以在两者之间执行 ABX 测试,并且有理由相信任何差异都是分辨率差异而不是录音的其他方面造成的。

当然,如果您执行此 ABX 测试,您必须确保您设备的模拟部分(放大器、扬声器等)能够再现超声波频率 - 否则,任何差异都将是听不见的。并且电平必须匹配 - 如果一个源甚至比另一个源稍微响亮一点,人们就会认为它听起来更好。

但即便如此,也不能保证,因为这两个数字源将使用不同的 DAC - 一个高分辨率 DAC 和一个 CD 音质 DAC。即使两个源都播放到同一个物理盒子上,DAC 芯片也可能会为不同的分辨率采用不同的电路路径。可能无法完全区分分辨率差异导致的音频差异与使用不同 DAC 导致的音频差异。

换句话说,虽然我们应该能够执行比人们通常做的更好的测试,但尝试进行比较,其中只有分辨率不同,而其他一切都相同,这将是一个极其困难的挑战。

感谢您的评论,David C.。我同意您的观点和结论。此外,如果所讨论的音乐是以 96/24 格式母带制作的,那么我更喜欢以这种方式接收它,而不是进一步 - 并且不必要地 - 转换为 44.1/16。相反,如果我想要的专辑仅以 44.1/16 甚至 MP3 格式提供,那么我会按原样接受它。

回复 ,作者:David C.

我强烈建议您阅读来自 http://www.realhd-audio.com/?cat=45 的帖子和/或订阅 Mark 的新闻通讯,了解有关此主题和其他高分辨率音频主题的信息。

感谢您的评论,Alex。Mark Waldrep 在高分辨率音频方面拥有丰富的经验,他的想法总是很有趣,有时也很挑衅。

回复 ,作者:alexsilvacz

我喜欢 FLAC 文件,并且尽可能喜欢无损和本地(即非流媒体)文件。我觉得有必要评论一下,因为多年前 xiph.org 上有一篇相关的文章,让我相信我应该放弃质量极高的音频文件(和所需的设备)。我想在这里分享一下,因为我发现它们非常有用(而且那个视频是我迄今为止看过的最喜欢的技术视频/演示)。强烈推荐。

感谢您的撰写!

文章:https://people.xiph.org/~xiphmont/demo/neil-young.html
视频:https://xiph.org/video/vid2.shtml

感谢您的友好评论,Kyle。请谨慎对待,不要不加批判地接受 xiph.org 的评论。我在文章中提到的 AES 参考回顾了试验的已发布结果,并发现 xiph.org 文章中关于高分辨率的结论是不正确的。就我个人而言,我发现 xiph.org 网站上提出的观点,即我们应该避免积累高分辨率音乐,因为我们的播放设备可能难以很好地再现它,也有点奇怪 - 为什么不提倡购买不会在高分辨率内容方面出现问题的设备呢?

无论如何,YMMV,正如他们所说!并感谢您的撰写!

回复 ,作者:K_REY_C

Creative Commons License本作品根据 Creative Commons Attribution-Share Alike 4.0 International License 许可。
© . All rights reserved.