除了 HTML 之外,PDF 文件可能是网络上最流行的文档格式。不幸的是,它们并不紧凑。例如,我喜欢下载免费的电子书。快速浏览我的电子书目录显示,其 75 个 PDF 文件占用了大约 500 兆字节。平均而言,每个 PDF 文件超过 6.6 MB。
我能否通过压缩这些文件来节省一些存储空间?如果我想通过电子邮件发送一捆文件呢?或者将它们托管在网站上供下载?如果这些文件变得更小,传输速度会更快。本文展示了一种简单的方法来减小 PDF 文件的大小。它的好处是可以透明地缩小 PDF 文件,而不会以任何方式更改数据内容。此外,您还可以使用单个命令压缩多个 PDF 文件。
将其与替代方案进行比较。您可以将 PDF 文件上传到许多在线文件压缩网站之一。其中一些是免费的,但您冒着将文档上传到未知网站的隐私风险。更重要的是,大多数网站通过篡改 PDF 文件中包含的图像来缩小 PDF 文件。他们要么更改分辨率,要么更改大小。因此,您牺牲较低的图像质量来获得较小的 PDF 文件。这与您使用 LibreOffice 等交互式应用程序或 gs
和 ps2pdf
等 Ghostscript 命令行面临的权衡相同。我们在本文中演示的技术压缩 PDF 文件,而不会更改它们包含的图像或其数据内容。而且您可以使用单个命令行减少许多 PDF 文件。让我们开始吧。
在 Linux 上识别和删除大的未使用的 PDF 文件
在您花费时间和精力压缩 PDF 文件之前,请识别最大的文件并删除您不需要的文件。此命令列出其目录树中最大的 50 个 PDF 文件,按降序排列大小
$ find -type f -exec du -Sh {} + | grep .pdf | sort -rh | head -n 50
从输出中,您可以轻松识别和删除重复项。您还可以删除过时的文件。摆脱这些空间占用大户可以带来巨大的好处。现在您知道哪些 PDF 是我们将要介绍的压缩技术的高回报候选对象。
透明地压缩 PDF
我们将使用开源 Minuimus 程序来压缩 PDF。Minuimus 是一个通用的命令行实用程序,可以执行各种有用的文件转换和压缩。为了缩小 PDF 文件,Minuimus 会卸载然后重建它们,从而获得许多效率。它以透明的方式执行此操作,而不会以任何方式更改您的数据。
要使用 Minuimus,请下载其 zip 文件。 然后按照其文档中的说明使用以下命令安装它
$ make deps # Installs all required supporting packages
$ make all # Compiles helper binaries
$ make install # Copies all needed files to /usr/bin
Minuimus 是一个 Perl 脚本,因此您可以这样运行它
$ minuimus.pl input_file.pdf # replaces the input file with compressed output
运行时,Minuimus 会立即备份您的原始输入文件。只有在通过比较代表数据的前后位图完全验证数据准确性后,它才会用压缩版本替换输入文件。
Minuimus 的一个很大的好处是它可以验证它处理的任何 PDF 文件。我发现如果遇到任何问题,它会给出智能的、有帮助的错误消息。例如,在我的其中一台计算机上,Minuimus 说它无法正确调用它使用的名为 leanify
的实用程序。然而,它仍然缩小了 PDF 并成功完成。
以下是如何在一个命令中压缩多个文件。这将压缩目录中的所有 PDF 文件
$ minuimus.pl *.pdf
如果您有很多 PDF 要转换,Minuimus 可能会处理一段时间。因此,例如,如果您要转换数百个 PDF,您可能希望将 Minuimus 作为后台作业运行。通过您的 GUI 调度程序或作为 Cron 作业,将其安排在非工作时间进行。
请务必将其输出从终端重定向到文件,以便您可以稍后轻松查看它
$ minuimus.pl *.pdf 1>output_messages.txt 2>error_messages.txt
您将回收多少空间?
不幸的是,无法预测 Minuimus 可以节省多少空间。这是因为 PDF 包含从文本到各种不同图像的任何内容。它们差异很大。我在我的 PDF 书籍下载目录上运行了 Minuimus。该目录包含 75 个 PDF,占用了大约 500 MB。Minuimus 将其减少了大约 11%,约为 445 MB。对于一种不改变数据的算法来说,这令人印象深刻。
在大量 PDF 文件中,尺寸减少 10% 到 20% 似乎很常见。最大的文件通常缩小最多。处理大型 PDF 集合通常比处理许多小型 PDF 回收更多的空间。一些 PDF 文件显示出非常显着的空间节省。这是因为某些应用程序创建了绝对可怕的 PDF。我称这些文件为“PDF 怪兽”。您可以使用单个 Minuimus 命令来消灭它们。
例如,在撰写本文时,Minuimus 将一个 85 兆字节的 PDF 缩小到 32 兆字节。这仅是其原始大小的 38%。该程序还缩小了其他几个怪兽 50%,恢复了数十兆字节。这就是为什么我一开始就介绍了一个命令来列出您最大的 PDF 文件。如果 Minuimus 识别出一些你可以消灭的怪兽,你可以免费回收大量的磁盘空间。
使用 Minuimus 压缩 PDF
PDF 文件非常有用且无处不在。但它们通常会占用大量的存储空间。Minuimus 可以轻松地将 PDF 存储空间减少 10% 到 20%,而无需更改数据。也许它最大的好处是识别并将畸形的“PDF 怪兽”转换为更小、更易于管理的文件。
评论已关闭。