Linux 的 3 个命令行文件转换工具

591 位读者喜欢这篇文章。
How to upgrade your Fedora Linux system with DNF

Opensource.com

最近,一位朋友天真地问我文件格式有多少种。我的半开玩笑的回答是:“想象一下一个装满沙滩沙子的汤碗。”

好吧,文件格式并没有那么多文件格式。也就是说,你可能从未听说过许多常用到足以在维基百科上列出的格式。你很可能永远不会看到也永远不会使用它们中的大多数。但是,如果你想要或需要转换文件格式,那么有很多应用程序可以完成这项工作。

让我们看看 Linux 命令行下的三个可靠的文件转换工具。

Pandoc

我认识的每个使用标记语言的人都说 Pandoc 是在这些语言之间进行转换的首选实用程序。这是有充分理由的:Pandoc 不仅可以进行一些非常出色的转换,而且速度也很快。

有一个使用 Markdown 格式化的文件,你想将其转换为 LibreOffice Writer 文档吗?你想把 LaTeX 文档转换成 EPUB 吗?或者,也许你有一个 HTML 文件,你想将其转换为幻灯片。Pandoc 可以胜任所有这些任务。甚至更多。

以下是如何使用 Pandoc 进行简单转换(在本例中,从 HTML 转换为 reStructuredText

pandoc -t rst myFile.html -o myFile.rst

你不仅限于直接转换。例如,你可以向结果文件添加目录、印刷引号、自定义标题和语法高亮。请查看 Pandoc 的文档 以了解详细信息。

但是,Pandoc 只处理基于文本的文件。如果你有一个二进制文件,例如文字处理器文档,会发生什么情况?命令行上的帮助来自一个意想不到的来源。

LibreOffice

你可能会想,“等等!LibreOffice 是一个 GUI 应用程序。” 是的,它是。但很多人不知道的是,你可以从命令行运行 LibreOffice 来快速转换一个或多个文件。

如何操作?例如,要将 LibreOffice Impress 幻灯片转换为 PDF,你可以输入以下内容

soffice --headless --convert-to pdf mySlides.odp

你只需将 pdf 替换为你想要转换成的文件格式的扩展名。--headless 选项,如果你想知道的话,可以阻止在你的桌面上打开一个空的 LibreOffice 窗口。

使用 LibreOffice 在命令行转换单个文件有点杀鸡用牛刀。但是,求助于命令行是同时转换多个文件的好方法。例如,如果你想将文件夹中的所有 Microsoft Word 文档转换为 LibreOffice Writer 格式,你可以输入

soffice --headless --convert-to odt *.docx

转换所需的时间比在 LibreOffice Writer 中打开所有这些文件并手动进行转换要少得多。

FFmpeg

Pandoc 是标记语言之间转换的瑞士军刀,而 FFmpeg 则是音频和视频格式方面与 Pandoc 相对应的工具。

FFmpeg 是一组库和可执行文件,使你能够在几乎任何格式之间无缝转换。

这是一个将视频从 AVI 转换为 Ogg Theora 的简单示例

ffmpeg -i myVideo.avi myvideo.ogg

FFmpeg 可以做的事情远不止这些。你可以设置视频的帧率并为其添加字幕,更改宽高比,更改音频质量等等。

如果选择使用多个选项,命令行可能会变得非常拥挤。很容易忘记这些选项,尤其是当你只是偶尔使用 FFmpeg 时。听取一位老技术作家的建议:阅读文档 并不丢人。

你是否有最喜欢的命令行文件转换工具?欢迎在下方留言分享。

标签
That idiot Scott Nesbitt ...
我长期使用免费/开源软件,并为乐趣和利益撰写各种文章。我不太把自己当回事,我所有的特技都是自己完成的。

21 条评论

很棒的 LibreOffice 技巧,Scott!我通常启动 GUI,但这种方法更简单,可以将一些文件转换为 .pdf。

我也是。我想我曾在某个时候听说过这个功能,但我已经忘记了。我倾向于通过 SSH 连接完成大量工作,因此能够无需 X 转发即可完成更多工作让我很高兴。

回复 作者:robinmuilwijk

在讨论转换工具时,最好包括 ImageMagick 工具套件附带的 `convert` 命令。:) 我发现自己经常使用这个命令。

convert 非常有用。我有一个小脚本,它使用 convert 将 Creative Commons 徽标和我的网站徽标添加到我发布到网站的图片中。

回复 作者:Jason van Gumster

很棒的文章,Scott。我知道 “ffmpeg” 转换,但不知道另外两个。命令行上还有 “pdftotext”。

与 Libre/OpenOffice 相关的是 unoconv。

我相信其功能类似,但可能没有完整 “soffice” 实例的开销?

Pandoc 万岁。

我在写文章的 pandoc 部分的介绍时,确实想到了你...

回复 作者:bbehrens

很棒的文章!我选择 Pandoc!我一直在寻找类似这样的文章!

我想是因为我没有从事合适的工作领域?但我不知道什么时候我需要将大量文件从一种格式重命名为另一种格式?我能想到的唯一需要这样做的情况是,如果我从事音频/视频制作/工程等领域。在那里,你可能会有一堆音频文件格式错误,无法进行压缩等等,或者可能有一堆需要批量重命名的艺术作品用于演出。但作为家庭用户,我基本上从网络上收集大量 PDF,并且喜欢在阅读时听流媒体爵士乐,我不知道我会使用这些工具中的任何一个。

虽然当你处于内容创作方面(而不是消费内容)时,使用此类工具肯定更常见。但是,当你拥有大量文件库(电子书、音乐、视频等)时,很多人喜欢对其文件进行同质化处理,以便它们都采用相同的格式。例如,如果你有各种电子书,并且它们混合了 PDF、EPUB、MOBI 和纯文本,你可能会在某些设备上阅读这些电子书时遇到问题。但是,如果你将所有这些书籍转换为 EPUB,那么你至少拥有了一个可靠且一致的基线,可以从中开始工作。

回复 作者:Eddie G. (未验证)

数据迁移的绝佳工具!我已经希望有这样的工具好几次了。感谢你的提示,在工作服务器上安装了 LibreOffice 并进行了测试,它将非常适合我们的一些工作流程,其中包括大量数据格式转换。这将使一些人非常高兴。

回复 作者:Eddie G. (未验证)

绝佳的时机!我正准备开始一个需要从网络上抓取数据的项目,
而 pandoc 将使其变得更容易。

我经常使用的另一个文件转换工具是 openssl。当处理
需要各种格式的证书时,它非常宝贵。

我使用一个名为 sox 的实用程序来转换音频文件格式。从它的手册页上

SoX 可以读取和写入大多数流行格式的音频文件,并且可以选择将
效果应用于它们。它可以组合多个输入源,合成音频,并且在
许多系统上,可以充当通用音频播放器或多轨录音机。
它还具有将输入拆分为多个输出文件的有限能力。

不错。我以前从没看过 Pandoc,所以感谢这篇文章

这是一篇很棒的文章,谢谢你 Scott!可能不相关,但让我想到了命令行 PDF 操作工具,如 PDFtk 和 QPDF。

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.