DAISY:Linux 兼容的视障人士文本格式

尚无读者喜欢这个。
Book stack

图片来源:Kate Ter Haar。由 Opensource.com 修改。CC BY-SA 2.0。

如果您像我一样是盲人或视障人士,您通常需要各种级别的硬件或软件来完成视力正常的人认为理所当然的事情。其中之一是阅读印刷书籍的专用格式:盲文(如果您知道如何阅读)或专用文本格式,例如 DAISY。

什么是 DAISY?

DAISY 代表数字无障碍信息系统。它是一个开放标准,几乎完全被盲人用来阅读教科书、期刊、报纸、小说,以及任何你能想到的东西。它于 90 年代中期由 DAISY 联盟 创立,该联盟是一个致力于制定一套标准的组织,这些标准将允许以一种使其易于阅读、跳过、注释以及以与视力正常的用户大致相同的方式操作文本的方式来标记文本。

DAISY 3.0 的当前版本于 2005 年中期发布,是对该标准的完全重写。它的创建目标是使编写符合该标准的书籍更加容易。值得注意的是,DAISY 可以仅支持纯文本、仅支持录音(PCM Wave 或 MPEG Layer III 格式),或文本和音频的组合。专用软件可以读取这些书籍,并允许用户设置书签并像视力正常的人使用印刷书籍一样轻松地浏览书籍。

DAISY 如何工作?

无论具体版本如何,DAISY 的工作方式都有些类似:您有一个主导航文件(DAISY 2.02 中的 ncc.html),其中包含有关该书的元数据,例如作者姓名、版权日期、本书有多少页等。在 DAISY 3.0 的情况下,此文件是一个有效的 XML 文档,强烈建议每个书籍都包含 DTD(文档类型定义)文件。

在导航控制文件中,标记描述了精确的位置——在文本导航的情况下是文本插入符偏移量,在录音的情况下是精确到毫秒的时间——这允许软件跳到书中那个精确的点,就像视力正常的人会翻到章节页一样。值得注意的是,此导航控制文件仅包含本书主要和最大元素的位置。

较小的元素由 SMIL(同步多媒体集成语言)文件处理。这些文件包含书中每个章节的位置点。导航级别在很大程度上取决于书籍的标记程度。可以这样想:如果一本印刷书籍没有章节标题,您将很难弄清楚您在哪个章节中。如果一本 DAISY 书籍标记得很差,您可能只能导航到书的开头,或者可能只能导航到目录。如果一本书的标记足够差(或完全缺少标记),您的 DAISY 阅读软件很可能会直接忽略它。

为什么需要专用软件?

您可能想知道,如果 DAISY 无非是 HTML、XML 和音频文件,为什么您需要专用软件来读取和操作它。从技术上讲,您不需要。专用软件主要是为了方便。例如,在 Linux 中,可以使用简单的 Web 浏览器打开书籍并阅读它们。如果您单击 DAISY 3 书籍中的 XML 文件,该软件通常所做的只是读取您授予其访问权限的书籍的书脊,并创建一个列表,您单击该列表即可打开。如果一本书标记得很差,它将不会在此列表中显示。

制作 DAISY 完全是另一回事,通常需要专用软件或足够的规范知识来修改通用软件以解析它。

结论

幸运的是,DAISY 正在成为一种过时的标准。虽然它在它所做的事情上非常出色,但生产它需要专用软件使我们与正常的视力正常的世界区分开来,在正常的视力正常的世界中,读者使用各种格式来电子阅读他们的书籍。这就是为什么 DAISY 联盟已成功地用 EPUB 版本 3 取代了 DAISY,版本 3 支持所谓的媒体叠加。这基本上是一本带有可选音频或视频的 EPUB 书籍。由于 EPUB 与 DAISY 的 XML 标记有很多共同之处,因此一些可以读取 DAISY 的软件可以看到 EPUB 书籍,但通常无法读取它们。这意味着,一旦为我们提供书籍的网站切换到这种开放格式,我们将有更多种软件来阅读我们的书籍。

标签
Avatar
Kendell Clark 是一位开源倡导者和 Fedora 用户,自 2011 年 8 月以来一直使用 Gnu/Linux。我爱我的妻子梅丽莎、我的狗泰格和小斑点狗以及 gnu/linux,特别是如果它与无障碍功能有关

5 条评论

非常有趣的文章,Kendall!当我帮助特殊教育教师和学生使用 Bookshare 计划时,我见过 DAISY,https://www.bookshare.org/

很高兴看到 DAISY 实际上仍在使用。我曾是联盟早期阶段技术团队的一员,实际上在为瑞典视障人士协会工作时录制并制作了第一本 DAISY 书籍。这是我仍然非常自豪的一项成就,在当时我们为获得全球标准所做的事情非常了不起。可悲的是,它不是开源的。这个首字母缩写词是后来构建的,它早期被称为 Daisy,指的是另一台著名的计算机和电影...

感谢所有积极的评论。文案编辑删减了一些技术细节,这些细节实际上详细介绍了 daisy 的工作原理。如果有人感兴趣,我可以将包含这些细节的原始开放文档文件通过电子邮件发送给他们。特别是,该文件详细介绍了美国国家图书馆服务 (NLS) 在其有声读物中使用的混合格式。这是一种 daisy 3 和一些专有加密方案的混合,该方案使用 aes 256 位算法加密 amr wb 格式的音频,以便只有“授权”播放器才能解码它们。我一直想要一个可以在 linux 上播放这些书籍的应用程序,但我最想要的是 linux 能够在您在文件管理器中遇到 daisy 书籍时正确识别它。daisy 书籍是一个包含文件的文件夹,所以这不应该太难。有人有兴趣帮助我做这件事吗?

在过去,我强烈主张在开放平台上发布格式和播放器。但对很多人来说,这太早了,90 年代中期,我被人们奇怪地看着。

回复 ,作者:kendell clark

我非常同意格式和标准应该开放。我想 Daisy 是半开放的,尽管他们积极鼓励使用专利音频格式。他们唯一支持的音频格式是 nls 数字图书的 amrwb,以及 daisy 2 和 daisy 3 有声读物的 mp3 或 wave。我记得阅读过 daisy 2 和 daisy 3 的一些标准文档,在这两种情况下,都有来自 riaa 和 mpaa 的人员提供帮助,所以还能期望什么呢。我迫不及待地想看到 bookshare、rfb&d 等盲人网站,现在是学习盟友 (Learning Ally) 等切换到 epub。daisy 背后的组织已经转向支持它。但由于所有 Windows 和 Mac 用户,他们可能会慢慢来。我的意思是,在这些平台上阅读 daisy 书籍的软件比 epub 和其他开放格式的软件更多。除了 linux 之外,Calibre 在任何平台上都无法访问到可用程度。尽管如此,daisy 已经过时了。它是一种复杂的格式,只有 Windows、Mac 和现在的 Android 才能很好地支持它。虽然这真的不是 daisy 联盟的错。linux 中启动了一些程序来处理这种格式,但它们都在某个时候被放弃了。

Creative Commons License本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.