DAISY:Linux 兼容的视障人士文本格式

尚无读者喜欢此内容。
Book stack

图片来源:Kate Ter Haar。由 Opensource.com 修改。CC BY-SA 2.0。

如果您像我一样是盲人或视障人士,您通常需要各种级别的硬件或软件来完成视力正常的人认为理所当然的事情。其中之一是用于阅读印刷书籍的专用格式:盲文(如果您知道如何阅读)或专用文本格式,例如 DAISY。

什么是 DAISY?

DAISY 代表数字无障碍信息系统。它是一种开放标准,几乎完全由盲人使用,用于阅读教科书、期刊、报纸、小说,以及您能想到的任何东西。它于 90 年代中期由 DAISY 联盟创立,该联盟是由多个组织组成的团体,致力于制定一套标准,使文本能够以易于阅读、跳跃浏览、注释以及像视力正常的用户一样操作文本的方式进行标记。

DAISY 3.0 的当前版本于 2005 年中期发布,是对该标准的完全重写。它的创建目标是使编写符合该标准的书籍变得更加容易。值得注意的是,DAISY 可以仅支持纯文本、仅支持音频录音(PCM Wave 或 MPEG Layer III 格式),或者文本和音频的组合。专用软件可以读取这些书籍,并允许用户设置书签并像视力正常的人使用印刷书籍一样轻松地浏览书籍。

DAISY 如何工作?

无论具体版本如何,DAISY 的工作方式都有些类似:您有一个主导航文件(DAISY 2.02 中的 ncc.html),其中包含有关书籍的元数据,例如作者姓名、版权日期、书籍页数等。在 DAISY 3.0 中,此文件是有效的 XML 文档,强烈建议每个书籍都包含 DTD(文档类型定义)文件。

在导航控制文件中,标记描述了精确的位置——在文本导航的情况下是文本插入符偏移量,在音频录音的情况下是精确到毫秒的时间——这使得软件可以跳转到书籍中的确切位置,就像视力正常的人会翻到章节页一样。值得注意的是,此导航控制文件仅包含书籍的主要和最大元素的定位。

较小的元素由 SMIL(同步多媒体集成语言)文件处理。这些文件包含书中每个章节的位置点。导航级别在很大程度上取决于书籍的标记质量。可以这样想:如果一本印刷书籍没有章节标题,您将很难弄清楚您在哪个章节中。如果 DAISY 书籍标记不佳,您可能只能导航到书籍的开头,或者可能只能导航到目录。如果一本书的标记非常糟糕(或完全缺少标记),您的 DAISY 阅读软件很可能会直接忽略它。

为什么需要专用软件?

您可能想知道,如果 DAISY 无非是 HTML、XML 和音频文件,为什么您需要专用软件来读取和操作它。从技术上讲,您不需要。专用软件主要是为了方便。例如,在 Linux 中,可以使用简单的 Web 浏览器打开书籍并阅读它们。如果您单击 DAISY 3 书籍中的 XML 文件,所有软件通常只会读取您授予其访问权限的书籍的书脊,并创建一个您可以单击以打开它们的列表。如果书籍标记不佳,它将不会出现在此列表中。

制作 DAISY 完全是另一回事,通常需要专用软件或足够的规范知识来修改通用软件以解析它。

结论

幸运的是,DAISY 是一种正在消亡的标准。虽然它在它所做的事情上非常出色,但制作它需要专用软件这一事实使我们与正常的视力正常的世界区分开来,在正常世界中,读者使用各种格式来电子阅读他们的书籍。这就是为什么 DAISY 联盟已将 DAISY 成功地替换为 EPUB 版本 3,后者支持所谓的媒体叠加层。这基本上是一本带有可选音频或视频的 EPUB 书籍。由于 EPUB 与 DAISY 的 XML 标记有很多共同之处,因此一些可以读取 DAISY 的软件可以看到 EPUB 书籍,但通常无法读取它们。这意味着,一旦为我们提供书籍的网站切换到这种开放格式,我们将有更多的软件可供阅读我们的书籍。

标签
Avatar
肯德尔·克拉克是一位开源倡导者和 Fedora 用户,自 2011 年 8 月以来一直使用 Gnu/Linux。我爱我的妻子梅丽莎、我的狗泰格和 gnu/linux,尤其是与无障碍性相关的任何事物

5 条评论

肯德尔,非常有趣的文章!当我帮助特殊教育教师和学生使用 Bookshare 计划时,我见过 DAISY,https://www.bookshare.org/

很高兴看到 DAISY 实际上仍在被使用。我曾是联盟早期阶段技术团队的一员,实际上在为瑞典视障人士协会工作时录制并制作了第一本 DAISY 书籍。这是我仍然非常自豪的一项成就,在当时我们为获得全球标准所做的事情非常了不起。可悲的是,它不是开源的。首字母缩略词是后来构建的,早期称为 Daisy,指的是另一台著名的计算机和电影...

感谢所有积极的评论。文案编辑删减了一些技术细节,这些细节实际上详细介绍了 DAISY 的工作原理。如果有人感兴趣,我可以将包含这些细节的原始开放文档文件通过电子邮件发送给他们。特别是,该文件详细介绍了美国国家图书馆服务 (nls) 用于其有声读物的混合格式。这是一种 DAISY 3 和一些专有加密方案的混合,该方案使用 aes 256 位算法来加密 amr wb 格式的音频,以便只有“授权”播放器才能解码它们。我一直想要一个可以在 Linux 上播放这些书籍的应用程序,但我最想要的是 Linux 能够在文件管理器中遇到 DAISY 书籍时正确识别它。DAISY 书籍是一个包含文件的文件夹,因此应该不会太难。有人有兴趣帮助我做到这一点吗?

很久以前,我强烈主张在开放平台上发布格式和播放器。但对于很多人来说,这太早了,90 年代中期,我被视为异类。

回复 ,作者:肯德尔·克拉克

我非常同意格式和标准应该是开放的。我想 DAISY 在某种程度上是半开放的,尽管他们积极鼓励使用专利音频格式。他们支持的唯一音频格式是 nls 数字书籍的 amrwb,以及 DAISY 2 和 DAISY 3 有声读物的 mp3 或 wave。我记得阅读过 DAISY 2 和 DAISY 3 的一些标准文档,在这两种情况下,都有来自 riaa 和 mpaa 的人提供帮助,所以还能期望什么呢。我迫不及待地希望 Bookshare、rfb&d、现在的 Learning Ally 等盲人网站切换到 epub。DAISY 背后的组织已转而支持它。但由于所有 Windows 和 Mac 用户,他们可能会花时间。我这样说的意思是,在这些平台上,阅读 DAISY 书籍的软件比 epub 和其他开放格式的软件更多。Calibre 在除了 Linux 之外的任何系统上都不够无障碍,无法使用。尽管如此,DAISY 已经过时了。它是一种复杂的格式,只有 Windows 和 Mac 以及现在的 Android 才能很好地支持它。虽然这实际上不是 DAISY 联盟的错。Linux 中启动了一些程序来处理这种格式,但它们都在某个时候被放弃了。

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.