在本文中,我将重点关注数字格式的音乐。此外,因为我是一个 Linux 爱好者,所以我将从 Linux 的角度来探讨这个话题。
大多数人都听说过 MP3 格式。它是两个方面的例子:首先,它不是一个开放格式,因为许多组织声称拥有其专利。其次,它是一种“有损”格式。有损格式通过丢弃一些信号分量来压缩原始信号。这种压缩的最初理由是为了使音乐文件更小,更易于分发。相比之下,还有“无损”格式,它可以被压缩(不丢弃原始信号)或不压缩。光盘 (CD) 上呈现的数字音乐是无损格式的一个例子(假设它是音频 CD,而不是保存了 MP3 的数据 CD)。
还值得一提的是,编码数字音乐主要有两种方式:脉冲编码调制 (PCM) 和 Δ-Σ 调制 (DSM)。直到最近,大多数数字音乐都是使用 PCM 编码的;但是索尼和飞利浦建立了一个基于 DSM 的标准,称为 DSD,并在超级音频 CD (SACD) 光盘上实现了它。少量但越来越多的音乐可以以这种标准下载。关于更详细的差异,我们将留给 维基百科 来解释。
我们这些关心软件自由的人应该更喜欢完全自由的格式,例如 Ogg Vorbis (有损)和 FLAC(无损,压缩)。我们尤其应该避免包含数字版权管理 (DRM) 选项的文件格式。理论上,人们可能会认为 DRM 只是一种防止未经授权使用(盗窃?)某人知识产权的机制。然而,某些供应商使用 DRM 来强迫他们的客户使用他们的软件,有时甚至是硬件。再次,维基百科 有一篇关于整个格式业务的很好的详细文章。
但是,决定格式不是——或者至少不应该是——首要考虑的问题。相反,我们每个人对于音乐的使用都有不同的目标。我将解释我的目标,然后进一步解释这些目标如何影响我对文件格式的决定。
首先,并且为了强调,我是一个软件自由的坚定支持者。这意味着我更喜欢 Ogg 或 FLAC 格式用于数字音乐。任何由于专利或商业秘密而限制访问的格式对我来说几乎没有或根本没有吸引力。
其次,我的音乐收藏可以追溯到 20 世纪 60 年代。我仍然保留着多年前购买的大部分 LP(有时甚至让我感到尴尬),其中一件让我非常高兴的事情是,其中一些老 LP 在现代模拟播放设备上仍然听起来非常好。我喜欢认为,像戴夫·布鲁贝克 (Dave Brubeck) 的 《Time Out》 这样的音质良好的 LP,最初录制于 1959 年,至今听起来仍然令人难以置信地清新和清晰,部分原因是录制它的人们在使用他们的设备方面做得非常出色和细致。因此,当我现在购买音乐时,无论是在 LP 上还是作为音乐下载,我都 চেষ্টা 获得尽可能最好的录音质量。
因此,我强烈偏好购买数字无损格式而不是有损格式。事实上,如果某些东西仅以有损格式提供,我通常不会费心购买它。而且我不仅购买无损格式,而且在有更高分辨率的情况下,我还会购买比“CD 标准”更高的分辨率。当然,我首选的无损格式是 FLAC!
让我们谈谈分辨率。CD 上的音乐以 44.1kHz 的采样率和 16 位的字长呈现。理论上,这意味着 CD 上录制的最响的声音是软声音的 216 倍,即 65,536 倍。这意味着,如果您有一个显示完整动态范围的录音,并将音量调高到刚好能听到最安静部分的位置,那么最响的部分将非常响亮,以至于会超过听觉疼痛阈值。
此外,奈奎斯特-香农采样定理 告诉我们,44.1kHz 的采样率足以保留高达 20kHz 的声音频率(“kHz”是“千赫兹”或每秒周期的缩写),据说这是听力极佳的人类听觉上限。
那么,为什么我认为我需要比 CD 标准更高的分辨率呢?
很简单。以 96kHz 的采样率和 24 位的字长呈现的录音,比 44.1/16 版本提供了更多的“空间”来容纳原始模拟信号——不仅是最响的声音和最软的声音。这意味着录音不必接近最大值,以至于偶尔超过它。(超过最大值的信号被称为“削波”,削波会引入原始录音中不存在的各种令人不悦的声音。)此外,音乐中的安静声音有更多的位来表示它们。
例如,马可尼联盟 (Marconi Union) 的 《Breathing Retake》 通常低于最大值 25dB。dB 或分贝是实际电平(在本例中为 -25dB)与参考电平 0dB 之间的比率。低于参考电平 -25dB 的信号将其四个最高有效位设置为零。因此,在 -25dB 的 16 位字长音乐中,只有 12 位的信号值,而在 24 位字长中,它有 19 位的信号值。埃里克·惠特克 (Eric Whitacre) 的 塔利斯学者 (Tallis Scholars) 演奏的《圣礼拜堂》(Sainte-Chapelle) 以 -35dB 至 -40dB 的速度进行,这在 16 位字长的情况下,为信号提供了 10 位或更少的位。24 位字长为录音工程师提供了更大的自由度来录制播放的音乐,而无需压缩音乐以使其适合 16 位动态范围。
至于采样率,96kHz 采样率可用于高达 45kHz 左右的音频频率,而 192kHz 可用于高达 90kHz 左右的频率,远远超出人们认为的人类能力的上限。然而,拥有额外的带宽意味着,在数字化之前必须应用于模拟信号的滤波可以比 44.1kHz 采样率的情况温和得多。通常,温和的滤波器比更突兀的滤波器更受欢迎,因为它们的音频特性更好。温驯的电脑 (The Well Tempered Computer) 在这个主题上有 几篇不错的文章。
购买高分辨率素材的另一个理由:我的经验告诉我,当音乐以高分辨率格式发布时,它通常在生产链中得到很好的照顾,并保留了原始的动态范围(响亮就是响亮,安静就是...),以及音乐的生命力,而不会在音乐中引入一堆伪影——噪音!
总之:当我购买数字音乐下载时,我以 FLAC 格式购买,并尝试获得 24 位文件和 88.2kHz 或 96kHz 采样率。我的音乐文件要花钱。我为什么要愿意接受质量差的有损文件?我为什么要愿意让供应商将我锁定在特定的软硬件平台上?
40 条评论