使用这款 Linux 工具压缩 PDF

Minuimus 是一款开源程序,用于在不更改数据的情况下将 PDF 存储空间减少 10% 到 20%。
5 位读者喜欢此文。
Filing cabinet for organization

除了 HTML 之外,PDF 文件可能是网络上最流行的文档格式。不幸的是,它们并不紧凑。例如,我喜欢下载免费的电子书。快速浏览我的电子书目录显示,其 75 个 PDF 文件占用了大约 500 兆字节。平均而言,每个 PDF 文件超过 6.6 MB。

我能否通过压缩这些文件来节省一些存储空间?如果我想通过电子邮件发送一捆文件呢?或者将它们托管在网站上供下载?如果这些文件变得更小,传输速度会更快。本文展示了一种简单的方法来减小 PDF 文件的大小。它的好处是可以透明地缩小 PDF 文件,而不会以任何方式更改数据内容。此外,您还可以使用单个命令压缩多个 PDF 文件。

将其与替代方案进行比较。您可以将 PDF 文件上传到许多在线文件压缩网站之一。其中一些是免费的,但您冒着将文档上传到未知网站的隐私风险。更重要的是,大多数网站通过篡改 PDF 文件中包含的图像来缩小 PDF 文件。他们要么更改分辨率,要么更改大小。因此,您牺牲较低的图像质量来获得较小的 PDF 文件。这与您使用 LibreOffice 等交互式应用程序或 gsps2pdf 等 Ghostscript 命令行面临的权衡相同。我们在本文中演示的技术压缩 PDF 文件,而不会更改它们包含的图像或其数据内容。而且您可以使用单个命令行减少许多 PDF 文件。让我们开始吧。

在 Linux 上识别和删除大的未使用的 PDF 文件

在您花费时间和精力压缩 PDF 文件之前,请识别最大的文件并删除您不需要的文件。此命令列出其目录树中最大的 50 个 PDF 文件,按降序排列大小

$ find  -type f  -exec  du -Sh {} +  |  grep .pdf | sort -rh  |  head -n 50

从输出中,您可以轻松识别和删除重复项。您还可以删除过时的文件。摆脱这些空间占用大户可以带来巨大的好处。现在您知道哪些 PDF 是我们将要介绍的压缩技术的高回报候选对象。

透明地压缩 PDF

我们将使用开源 Minuimus 程序来压缩 PDF。Minuimus 是一个通用的命令行实用程序,可以执行各种有用的文件转换和压缩。为了缩小 PDF 文件,Minuimus 会卸载然后重建它们,从而获得许多效率。它以透明的方式执行此操作,而不会以任何方式更改您的数据。

要使用 Minuimus,请下载其 zip 文件。 然后按照其文档中的说明使用以下命令安装它

$ make deps      # Installs all required supporting packages
$ make all       # Compiles helper binaries
$ make install   # Copies all needed files to /usr/bin

Minuimus 是一个 Perl 脚本,因此您可以这样运行它

$ minuimus.pl  input_file.pdf    # replaces the input file with compressed output

运行时,Minuimus 会立即备份您的原始输入文件。只有在通过比较代表数据的前后位图完全验证数据准确性后,它才会用压缩版本替换输入文件。

Minuimus 的一个很大的好处是它可以验证它处理的任何 PDF 文件。我发现如果遇到任何问题,它会给出智能的、有帮助的错误消息。例如,在我的其中一台计算机上,Minuimus 说它无法正确调用它使用的名为 leanify 的实用程序。然而,它仍然缩小了 PDF 并成功完成。

以下是如何在一个命令中压缩多个文件。这将压缩目录中的所有 PDF 文件

$ minuimus.pl *.pdf

如果您有很多 PDF 要转换,Minuimus 可能会处理一段时间。因此,例如,如果您要转换数百个 PDF,您可能希望将 Minuimus 作为后台作业运行。通过您的 GUI 调度程序或作为 Cron 作业,将其安排在非工作时间进行。

请务必将其输出从终端重定向到文件,以便您可以稍后轻松查看它

$ minuimus.pl *.pdf  1>output_messages.txt  2>error_messages.txt

您将回收多少空间?

不幸的是,无法预测 Minuimus 可以节省多少空间。这是因为 PDF 包含从文本到各种不同图像的任何内容。它们差异很大。我在我的 PDF 书籍下载目录上运行了 Minuimus。该目录包含 75 个 PDF,占用了大约 500 MB。Minuimus 将其减少了大约 11%,约为 445 MB。对于一种不改变数据的算法来说,这令人印象深刻。

在大量 PDF 文件中,尺寸减少 10% 到 20% 似乎很常见。最大的文件通常缩小最多。处理大型 PDF 集合通常比处理许多小型 PDF 回收更多的空间。一些 PDF 文件显示出非常显着的空间节省。这是因为某些应用程序创建了绝对可怕的 PDF。我称这些文件为“PDF 怪兽”。您可以使用单个 Minuimus 命令来消灭它们。

例如,在撰写本文时,Minuimus 将一个 85 兆字节的 PDF 缩小到 32 兆字节。这仅是其原始大小的 38%。该程序还缩小了其他几个怪兽 50%,恢复了数十兆字节。这就是为什么我一开始就介绍了一个命令来列出您最大的 PDF 文件。如果 Minuimus 识别出一些你可以消灭的怪兽,你可以免费回收大量的磁盘空间。

使用 Minuimus 压缩 PDF

PDF 文件非常有用且无处不在。但它们通常会占用大量的存储空间。Minuimus 可以轻松地将 PDF 存储空间减少 10% 到 20%,而无需更改数据。也许它最大的好处是识别并将畸形的“PDF 怪兽”转换为更小、更易于管理的文件。

接下来阅读什么
标签
User profile image.
Howard Fosdick 是一位独立顾问,他以 DBA/SA 的身份亲力亲为。他撰写了几本技术书籍、许多文章,并且是一位受欢迎的会议演讲者。

评论已关闭。

Creative Commons License此作品根据 Creative Commons Attribution-Share Alike 4.0 International License 获得许可。
© . All rights reserved.