Linux 的 3 个命令行文件转换工具

591 位读者喜欢这篇文章。
How to upgrade your Fedora Linux system with DNF

Opensource.com

最近,一位朋友天真地问我文件格式有多少种。我半开玩笑地回答说:“想象一下一个装满沙滩沙子的汤碗。”

好吧,文件格式并没有那么多 文件格式。即便如此,您可能从未听说过许多常用格式,这些格式足以在维基百科上列出。您很可能永远不会看到,也永远不会使用它们中的大多数。但是,如果您想要或需要转换文件格式,那么有很多应用程序可以完成这项工作。

让我们来看看 Linux 命令行下的三个可靠的文件转换工具。

Pandoc

我认识的每个使用标记语言的人都说 Pandoc 是标记语言之间转换的首选实用程序。这是有充分理由的:Pandoc 不仅可以进行一些非常出色的转换,而且速度也很快。

有一个使用 Markdown 格式化的文件,您想将其转换为 LibreOffice Writer 文档吗?想把 LaTeX 文档转换成 EPUB 格式吗?或者,您可能有一个 HTML 文件,想要将其转换为幻灯片演示文稿。Pandoc 可以胜任所有这些任务。甚至更多。

以下是如何使用 Pandoc 进行简单转换(在本例中,从 HTML 转换为 reStructuredText

pandoc -t rst myFile.html -o myFile.rst

您不仅限于直接转换。例如,您可以向结果文件添加目录、印刷引号、自定义标题和语法高亮。请查看 Pandoc 的文档 以了解详细信息。

但是,Pandoc 仅处理基于文本的文件。如果您有一个二进制文件,例如文字处理器文档,该怎么办?命令行帮助来自一个意想不到的来源。

LibreOffice

您可能会想:“等等!LibreOffice 是一个 GUI 应用程序。” 是的,没错。但很多人不知道的是,您可以从命令行运行 LibreOffice,以快速转换一个或多个文件。

如何操作?例如,要将 LibreOffice Impress 幻灯片演示文稿转换为 PDF,您需要键入以下内容

soffice --headless --convert-to pdf mySlides.odp

您只需将 pdf 替换为您要转换成的任何文件格式的扩展名。如果您想知道,--headless 选项会阻止在您的桌面上打开一个空的 LibreOffice 窗口。

使用命令行下的 LibreOffice 转换单个文件有点大材小用。但是,转向命令行是同时转换多个文件的好方法。例如,如果您想将文件夹中的所有 Microsoft Word 文档转换为 LibreOffice Writer 格式,您需要键入

soffice --headless --convert-to odt *.docx

转换所花费的时间比在 LibreOffice Writer 中打开所有这些文件并手动进行转换要少得多。

FFmpeg

Pandoc 是标记语言之间转换的瑞士军刀,而 FFmpeg 则是 Pandoc 在音频和视频格式方面的对应物。

FFmpeg 是一组库和可执行文件,使您能够在几乎任何格式之间无缝转换。

这是一个将视频从 AVI 转换为 Ogg Theora 的简单转换示例

ffmpeg -i myVideo.avi myvideo.ogg

FFmpeg 可以做的远不止这些。您可以设置视频的 帧速率 并为其添加字幕,更改 宽高比,更改音频质量等等。

如果您选择使用多个选项,命令行可能会变得非常拥挤。很容易忘记这些选项,特别是如果您只是偶尔使用 FFmpeg。听一位老技术作家的劝告:阅读文档 并不丢人。

您是否有最喜欢的命令行文件转换工具?欢迎通过在下方留言分享。

标签
That idiot Scott Nesbitt ...
我是一位自由/开源软件的长期用户,为乐趣和利益撰写各种文章。我并没有把自己看得那么严肃,我所有的特技都是自己完成的。

21 条评论

Scott,很棒的 LibreOffice 技巧!我通常启动 GUI,但对于将一些文件转换为 .pdf 来说,这更容易。

我也是。我想我在某个时候听说过这个功能,但我已经忘记了。我倾向于通过 SSH 连接完成很多工作,因此能够在不进行 X 转发的情况下做更多事情让我很高兴。

回复 作者:robinmuilwijk

在讨论转换工具时,最好包括 ImageMagick 工具套件附带的 `convert` 命令。:) 我发现自己经常使用它。

convert 非常有用。我有一个小脚本,它使用 convert 将 Creative Commons 徽标和我的网站徽标添加到我发布到网站的图片中。

回复 作者:Jason van Gumster

Scott,文章写得很棒。我知道 “ffmpeg” 转换,但不知道其他两个。命令行上还有 “pdftotext”。

与 Libre/OpenOffice 相关的是 unoconv。

我相信功能是相似的,但可能没有完整 “soffice” 实例的开销?

Pandoc 万岁。

当我写这篇文章的 pandoc 部分的介绍时,我确实想到了您...

回复 作者:bbehrens

很棒的文章!我选择 Pandoc!我一直在寻找类似这样的文章!

我想是因为我没有从事合适的工作领域?但我不知道我什么时候需要将大量文件从一种格式重命名为另一种格式?我能想到的唯一需要这样做的情况是,如果我在音频/视频制作/工程等领域工作。在那里,您可能会有一堆音频文件,它们的格式对于压缩等来说是不正确的,或者可能有一堆需要在节目中批量重命名的艺术作品。但作为家庭用户,我基本上从网上收集了很多 PDF,并且喜欢在阅读时听流媒体爵士乐,我不认为我会使用这些工具中的任何一个。

虽然当您处于内容创建方面(而不是消费内容)时,使用此类工具肯定更常见。但是,当您拥有大量文件库(电子书、音乐、视频等)时,很多人都喜欢将其文件同质化,以便它们都采用相同的格式。例如,如果您有各种电子书,并且它们混合了 PDF、EPUB、MOBI 和纯文本,您可能会在某些设备上阅读这些电子书时遇到问题。但是,如果您将所有这些书都转换为 EPUB,那么您至少拥有了一个可靠且一致的工作基线。

回复 作者:Eddie G. (未验证)

数据迁移的绝佳工具!我曾多次希望有这样的工具。感谢您的提示,在工作服务器上安装了 LibreOffice 并进行了测试,它将非常适合我们的一些工作流程,其中包括大量数据格式转换。这将使很多人非常高兴。

回复 作者:Eddie G. (未验证)

绝佳的时机!我正准备开始一个需要从网络上抓取数据的项目,
pandoc 将使它变得更加容易。

我经常使用的另一个文件转换工具是 openssl。当处理
需要多种格式的证书时,它非常宝贵。

我使用一个名为 sox 的实用程序来转换音频文件格式。从它的手册页

SoX 可以读取和写入大多数流行格式的音频文件,并且可以选择性地应用
效果。它可以组合多个输入源,合成音频,并且在
许多系统上,充当通用音频播放器或多轨录音机。
它还具有将输入拆分为多个输出文件的有限能力。

不错。我以前从没看过 Pandoc,所以感谢你

这是一篇很棒的文章,谢谢你 Scott!也许不相关,但让我想到命令行 PDF 操作工具,如 PDFtk 和 QPDF。

Creative Commons License本作品根据 Creative Commons 署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.