我为什么选择 FLAC 作为音频格式

图片来源：

Jen Wike Huger 拍摄

在本文中，我将重点关注数字格式的音乐。此外，由于我是一个 Linux 爱好者，我将从 Linux 的角度来探讨这个话题。

大多数人都听说过 MP3 格式。它是两个方面的例子：首先，它不是开放格式，因为许多组织声称拥有其专利。其次，它是一种“有损”格式。有损格式通过丢弃一些信号成分来压缩原始信号。这种压缩的最初理由是为了使音乐文件更小且更易于分发。相比之下，还有“无损”格式，可以压缩（不丢弃原始信号）或不压缩。光盘 (CD) 上呈现的数字音乐是无损格式的一个例子（假设它是音频 CD，而不是保存了 MP3 的数据 CD）。

还值得一提的是，编码数字音乐主要有两种方式：脉冲编码调制 (PCM) 和 Δ-Σ 调制 (DSM)。直到最近，大多数数字音乐都是使用 PCM 编码的；但索尼和飞利浦建立了一个基于 DSM 的标准，称为 DSD，并在超级音频 CD (SACD) 光盘上实现了它。现在有少量但数量不断增长的音乐可以以这种标准下载。关于更详细的差异，我们将留给维基百科来解释。

我们这些关心软件自由的人应该更喜欢完全自由的格式，例如 Ogg Vorbis (有损) 和 FLAC (无损，压缩)。我们尤其应该避免包含数字版权管理 (DRM) 选项的文件格式。理论上，人们可能会认为 DRM 只是一种防止未经授权使用（盗窃？）他人知识产权的机制。然而，某些供应商使用 DRM 来迫使其客户使用他们的软件，有时甚至是硬件。再次，维基百科对整个格式业务有一篇很好的详细文章。

但是决定格式不是——或者至少不应该是——首要考虑的因素。相反，我们每个人对于音乐的使用都有不同的目标。我将解释我的目标，然后进一步解释这些目标如何影响我对文件格式的决定。

首先，并且为了强调，我非常支持软件自由。这意味着我更喜欢 Ogg 或 FLAC 格式的数字音乐。任何由于专利或商业秘密而限制访问的格式对我来说几乎或根本没有吸引力。

其次，我的音乐收藏可以追溯到 20 世纪 60 年代。我仍然保留着多年前购买的大部分 LP 唱片（有时会让我感到尴尬），其中一件让我非常高兴的事情是，在现代模拟播放设备上，这些旧 LP 唱片听起来仍然非常棒。我认为像戴夫·布鲁贝克 (Dave Brubeck) 的 Time Out 这样音质出色的 LP 唱片，最初录制于 1959 年，至今听起来仍然非常新鲜和清晰，部分原因是录制它的人员使用他们的设备做了出色而细致的工作。因此，我现在购买音乐时，无论是 LP 唱片还是音乐下载，我都尽量获得尽可能好的录音质量。

因此，我强烈偏好购买数字无损音乐而不是有损音乐。事实上，如果某样东西只有有损格式，我通常不会费心购买。而且我不仅购买无损音乐，而且在有更高分辨率的情况下，我会购买比“CD 标准”更高的分辨率。当然，我首选的无损格式是 FLAC！

让我们花一点时间谈谈分辨率。CD 上的音乐以 44.1kHz 的采样率和 16 位的字长呈现。理论上，这意味着 CD 上录制的最响亮的声音是最柔和的声音的 2¹⁶ 倍，即 65,536 倍。这意味着，如果您的录音显示了完整的动态范围，并将音量调高到刚好能听到最安静部分的位置，那么最响亮的部分将非常响亮，以至于会超过听觉疼痛阈值。

此外，奈奎斯特-香农采样定理告诉我们，44.1kHz 的采样率完全足以保留高达 20kHz 的声音频率（“kHz”是“千赫兹”的缩写，即每秒周期数），据说这是听力极佳的人类听觉的上限。

那么，我为什么认为我需要比 CD 标准更高的分辨率呢？

很简单。以 96kHz 的采样率和 24 位的字长呈现的录音比 44.1/16 版本提供了更大的“空间”来容纳原始模拟信号——不仅仅是最响亮的声音和最柔和的声音。这意味着录音不必达到如此接近最大值的水平，以至于偶尔会超过它。（超过最大值的信号被称为“削波”，削波会引入原始录音中不存在的各种难听的声音。）此外，音乐中的安静声音有更多的位来表示它们。

例如，Marconi Union 的 Breathing Retake 通常低于最大值 25dB。dB 或分贝是实际电平（在本例中为 -25dB）与参考电平 0dB 之间的比率。低于参考电平 -25dB 的信号将其四个最高有效位设置为零。因此，在 -25dB 的 16 位字长音乐中，只有 12 位信号，而在 24 位字长中，它有 19 位信号。埃里克·惠特克 (Eric Whitacre) 的 Sainte-Chapelle，由塔利斯学者 (Tallis Scholars) 演奏，以 -35dB 至 -40dB 的水平运行，这在 16 位字长的情况下为信号提供了 10 位或更少的位。24 位字长使录音工程师有更大的自由度来录制播放的音乐，而无需压缩音乐以使其适应 16 位动态范围。

至于采样率，96kHz 的采样率可用于高达 45kHz 左右的音频频率，而 192kHz 可用于高达 90kHz 左右的频率，远远超出人们认为的人类能力的上限。但是，拥有额外的带宽意味着在数字化之前必须应用于模拟信号的滤波可以比 44.1kHz 采样率的情况温和得多。对于它们的音频特性，温和的滤波器通常比更突兀的滤波器更受欢迎。《The Well Tempered Computer》在这个主题上发表了几篇不错的文章。

还有一个购买高分辨率音乐的原因：我的经验告诉我，当音乐以高分辨率格式发布时，它通常在制作链中得到很好的照顾，并保留了原始动态范围（响亮就是响亮，安静就是...）和音乐的生命力，而不会在音乐中引入一堆伪影——噪音！

总之：当我购买数字音乐下载时，我以 FLAC 格式购买，并尝试获得 24 位文件和 88.2kHz 或 96kHz 采样率。我的音乐文件要花钱。我为什么要愿意接受质量差的有损文件？我为什么要愿意让供应商将我锁定在特定的软件和硬件平台上？

标签

音频和音乐