为什么国际特赦组织使用 Booktype 2.0 发布报告

还没有读者喜欢这个。
A pile of books in different colors

Opensource.com

人权非政府组织国际特赦组织,一个由七百多万人组成的运动,在二月底发布了其2014-15 年度报告。这本 500 多页的印刷书籍同时以英语、法语、西班牙语和阿拉伯语出版,并由当地团队翻译成其他 12 种语言。它由 160 个详细章节组成,这些章节由区域专家撰写,内容涉及世界上大多数国家的人权状况。

国际特赦组织伦敦国际秘书处全球制作服务经理理查德·斯温格勒知道,传统的出版工作流程无法扩展以应对世界的需求,在这个世界中,需要各种各样的阅读和交换格式。这一因素与不断确保国际特赦组织的报告准确、一致和最新的要求相结合。在 2014-15 年北半球的冬季,作者和翻译人员必须在压缩的时间表内工作,同时制作新的输出格式,包括用于 Adobe InDesign 的 XML 和用于国际特赦组织网站的 XHTML。

斯温格勒领导了对一种工具的搜索,该工具可以处理结构化的、基于 XML 的工作流程,尽可能实现自动化,同时对书籍贡献者来说仍然易于使用。由于国际特赦组织已经决定从 Quark XPress 切换到 Adobe InDesign 来制作杂志风格的版式,Adobe InCopy 是一个选择;然而,贡献者习惯于在 Microsoft Word 中工作,并且不热衷于在短期内放弃它,特别是考虑到今年压缩的出版时间表。所选择的工具还需要在短时间内进行扩展,以涵盖在新工作流程采用过程中出现的需求。

这些挑战导致国际特赦组织选择 Booktype 2.0,并在 2014 年底在生产中部署该软件。Booktype是由非营利组织 Sourcefabric 根据 GNU AGPL v3 许可发布的开源软件,旨在用于 Web 服务。Booktype 是一个 Django 应用程序,运行在典型的 Web 堆栈上,包括 Linux、Apache、PostgreSQL 和 Python,最初是为Flossmanuals文档社区托管的书籍冲刺而编写的。

English book cover and the Booktype software

书籍冲刺的概念在出版业中是激进的,它借鉴了编码团队的经验,这些团队并行协作,使用密集的爆发来交付产品。这种基于自动化服务器端出版和分布式贡献者之间实时通信的快速书籍生产模式,非常适合国际特赦组织工作的时效性和全球性。

Booktype 开发团队扩展了他们的基于浏览器的软件,以满足国际特赦组织的复杂需求,培训了编辑和翻译人员,并在书籍生产过程中提供即时增强和错误修复。许多其他开源项目被集成到 Booktype 系统中,以提供关键功能,包括用于文档处理的 LXML、用于 EPUB3 处理的 EbookLib 以及带有 WebKitwkhtmltopdf 用于 PDF 校样渲染。

由于需要整合来自世界各地贡献者的如此多的信息,并且需要如此多的语言和格式,因此基于 XML 章节模板和书籍骨架的结构化出版系统有助于组织数据并确保输出之间的一致性。部署了一个自定义界面,以便国际特赦组织的项目经理可以为章节编辑启用上传访问权限,并一目了然地查看每本书和章节的状态。

Booktype Web 界面使编辑能够查看从上传的 Microsoft Word 文档自动导入的章节的最新更正和评论,使用 Aloha 内联编辑器更正文本和标记格式,并通过单击一下导出为 InDesign XML、EPUB、PDF 校样和网站 XHTML 格式。

一些最简单的代码更改对国际特赦组织的作者和翻译人员产生了最大的影响。书籍历史记录功能使用弹出窗口来启用章节修订的并排比较,但在生产使用中很快发现,所需的垂直浏览器滚动量是不切实际的。尽管弹出功能在演示中看起来很漂亮,但它是一个生产力杀手,并且损害了用户体验。Booktype 开发人员 Helmy Giacoman 添加了一个按钮,该按钮在新全尺寸浏览器选项卡中打开章节修订,在几分钟之内,书籍贡献者就能够再次开始写作。

作为对习惯于使用 Microsoft Word 的贡献者支持的一部分,Booktype 团队开发并发布了一个新的开源软件库 Python-OOXML。该库处理 .docx 导入和转换为 HTML,包括传输在 Word 中所做的评论。与 Booktype 本身一样,Python-OOXML 可以从 GitHub 免费下载,供其他软件开发人员集成到他们的出版解决方案中。以拉取请求的形式积极鼓励来自 Python 社区的代码改进。

为了确保高印刷标准和对国际特赦组织最重要的出版物的完全设计控制,XML 从 Booktype 导出并导入到 Adobe InDesign 模板中以进行版式批准。Booktype 的 HTML 在 Word 文档中的 XML 格式和 InDesign 期望的方言之间架起了一座桥梁,自动映射样式并修复了不兼容性,包括在同一行上的双向英语和阿拉伯语文本。

Word 文档中 XML 的质量对出版物的贡献差异很大,从易于解析到几乎无法读取,并且在使用专有翻译工具运行后,格式尤其糟糕。在调查一个格式有问题、字数略低于 5,100 字的翻译章节时,Booktype 团队发现它在主文档文件中只有两行 XML,但第二行有超过 380,000 列。这相当于每个单词 75 个字符;对于作者键入的每个字符,软件又添加了 10 个字符。Booktype 首席开发人员 Aleksandar Erkalović 实施了一个后处理过滤器,该过滤器整理了 HTML 输出并使其再次可读。这种清理后的 HTML 使编辑可以修复书籍源中的格式错误,而不是返回 Word 并重新上传 XML。

Booktype 团队现在正在研究使用 mPDF 改进自动化文档渲染,mPDF 是一个开源 PHP 项目,支持印前功能,包括 CMYK 或专色,以及背景边缘到边缘打印所需的出血和裁切标记。最近发布的 mPDF 6.0 可以使用 OpenType 布局表来完善复杂脚本的显示,包括阿拉伯语、高棉语、泰语、越南语和希伯来语。Booktype 和 mPDF 的这种组合有可能自动为全球语言生成高质量的设计文档,而无需导出到 InDesign 进行手动调整。

在书籍发布登上新闻后,理查德·斯温格勒评论道:“我们已经能够对国际特赦组织的年度报告制作工作流程进行非常显着的改进。Booktype 直观且易于使用,对于一个在不同地点有许多不同利益相关者的组织来说,它完全有意义。我的目标是在已建立的坚实基础上再接再厉,探索我们如何进一步协作。”

标签
Daniel James
丹尼尔·詹姆斯是 64 Studio Ltd 的主管,该公司为 OEM 和研发实验室开发 GNU/Linux 产品。他是 linuxaudio.org 联盟的创始人之一,该联盟旨在促进 GNU/Linux 和自由软件在专业音频领域的应用。

评论已关闭。

© . All rights reserved.