Linux 和开源软件中的辅助功能状态

还没有读者喜欢这篇文章。
Open field

Opensource.com

Spencer Hunley 是一位患有自闭症的专业人士,曾任 堪萨斯城长官残疾人委员会副主席,现任 Heartland 自闭症协会和 ASAN 堪萨斯城分会理事会成员。8 月,Spencer 将在 芝加哥 LinuxCon 上发表演讲,Universal Tux:为了我们未来的自我而实现的辅助功能。他还曾在 2013 年北美 LinuxCon 上发表过题为 最大化辅助功能:让残疾人参与 Linux 社区 的演讲。

在本次采访中,Spencer 介绍了 Linux 和开源软件中辅助功能的最新状态。

自从去年夏天在 LinuxCon 上看到您演讲后,您在辅助功能领域做了哪些工作?

去年 LinuxCon 之后不久,Carla Schroder 创建了一个名为 Universal Tux 的 Google+ 社区,我一直非常积极地担任版主,与另外三人和 Carla 一起工作。我们创建并更新了一个关于辅助功能的 优先事项列表,其中包括一些相对容易修复的问题,以及一些更崇高的目标。

Spencer Hunley我们开始关注文档,因为许多发行版可能内置了辅助功能,但关于如何使用它的信息很快就会因应用程序和内核更新而过时。这也适用于辅助功能应用程序和程序,原因大致相同。幸运的是,文档是一个许多人都可以参与的领域,即使他们不熟悉编程或代码。我认为 Universal Tux 正在获得一些关注,我们正在被注意到。Daniel Fore,来自 Elementary OS,积极参与讨论,其他发行版的几位人士也加入了进来。

就我个人而言,我有一段时间在换工作。谢天谢地,情况似乎正在稳定下来。我一直在尝试一些不同的发行版:Jonathan NadeauSONAR 发行版Vinux。保持对辅助功能的关注并不容易,但是当你看到事情朝着正确的方向快速发展时,感觉真好。

我最近还加入了 堪萨斯城分会自闭症自我倡导网络,并且是 Heartland 自闭症协会的现任理事会成员。

哪些开源辅助功能项目和人物是目前“值得关注的”,为什么?

Dasher,一个应用程序,允许通过各种方式使用文本预测的界面进行文本输入——他们称之为概率预测模型。它适用于 Linux 和 Windows,并且易于使用,有时几乎像玩电子游戏一样。这是一个很棒的程序,它正在扩展输入设备的种类,例如,使用呼吸或倾斜平台来操作界面,并且通过练习有时可以超过传统的键盘打字速度。期待 Dasher 继续创新,尤其是在作为跨平台应用程序方面。

Orca 屏幕阅读器/放大镜仍然是许多不错功能的首选。由于其他应用程序之间的各种开发周期,它的老化程度并不好,但由项目负责人 Joanmarie Diggs 领导的开发团队正在努力修复错误并提高 Orca 的通用性。一个更突出的争议点是 Orca 无法使不可访问的软件可访问;有时这只是实现辅助功能支持或仅仅更新几行代码的简单情况。然而,这个项目已经存在很长时间了,并且是视力障碍人士的主力。

还有 Andy Lin 关于 将 Google Glass 作为辅助技术的工作和推广。使 Google Glass 可访问并将其用作辅助技术是一个绝妙的想法,对残疾人具有重大意义。对于听力障碍人士,它可以提供对他人所说内容的实时文本翻译。对于视力障碍人士,它可以转录某人周围的环境以及他们面前的事物。通过使用语音控制,行动不便的人可以使用它来操作智能手机、计算机等。并且它可以补充其他辅助技术设备,提供反馈,所有这些成本都比当今市场上销售的许多辅助技术设备便宜得令人惊讶。此外,由于 Google Glass 相对主流,并且被各种能力的人使用,因此它摆脱了许多辅助技术设备所带有的污名,从而促进了残疾人在社会中的融合。

Enable Viacam (eViacam),类似于 GNOME 的 MouseTrap 应用程序,允许仅通过移动头部来使用鼠标。与计算机和网络摄像头配合使用,对于行动不便的人来说,它是许多更昂贵的 FOSS 替代方案。Eviacam 结合 Dasher,为专有的辅助技术软件提供了有吸引力的替代方案。

James McClain,Palaver 和 VoxForge:语音识别一直是身心和发育障碍人士的首要需求,但似乎总是达不到预期。去年,James McClain 发布了一个新颖想法的公开测试版:在后端使用 Google Voice API。凭借一些出色的功能和持续的开发,Palaver 和 VoxForge 可以为 Linux 桌面带来高质量的语音识别。与此同脉相承的是 LiSpeak,一个基于 Palaver 构建的 Linux 发行版的语音命令系统。

开放假肢项目:随着 3D 打印机变得更便宜,它们的潜在用途也得到了扩展;开放假肢项目的 Jonathan Kuniholm 也是今年北美 LinuxCon 的主题演讲人,他致力于为高效且具有成本效益的假肢提供设计,人们可以独立组装和使用。吸引我眼球的是他们的座右铭:“假肢不应该花费一条胳膊和一条腿。”

开源操作系统中仍然缺少哪些辅助功能或服务?

对于主流发行版和残疾用户来说,语音转文本和文本转语音界面首当其冲。对于许多人来说,Dragon Naturally Speaking 是他们通往 Linux 的道路上剩下的唯一障碍。具体来说,一个可以处理语音命令和听写,并且还可以与盲文显示器配合使用的核心框架将非常受欢迎。

文档,即使不是特定于残疾的问题,也非常重要。毕竟,许多残疾人对 Linux 或 FOSS 软件/操作系统一无所知,而最新的信息对于能够利用任何内置的辅助功能至关重要。辅助功能-HOWTO 急需完全替换其当前状态。好的一面是,这相对容易修复,并且不需要对代码进行重大修改。

在许多发行版中,内置的、易于使用和理解的辅助功能支持很难找到。你能告诉我激活 Ubuntu 中该支持的组合键吗?其他发行版呢?事实是,虽然它在那里,但可能不容易找到和/或使用。在解决这个问题时,关注独立性至关重要。没有人希望不得不求助于其他人来帮助他们安装新的操作系统,或使用应用程序。对于残疾人来说尤其如此;学习曲线可能几乎是不可能的,这使得在 FOSS 世界中几乎没有选择,这取决于你的能力。

找到辅助功能项目很容易,但找到持续开发的项目却很困难。这实际上不是任何人的错;坦率地说,其他项目变得更受欢迎、更重要,并且被更广泛的用户群更频繁地使用;然而,随着越来越多的辅助功能项目开始与未来技术(语音控制、语音、识别、家庭自动化等)的主流梦想相交,我乐观地认为它们将获得更多关注,并有望获得更多发展。


 

要与 Spencer Hunley 联系,您可以

  • 发送电子邮件至 spencer.hunley@gmail.com
  • 在 G+SpencerHunley 上联系他
  • 在他的个人资料 about.me/spencerhunley 上查看
标签
User profile image.
Rikki Endsley 是 Red Hat 的开发者项目管理编辑,也是 Opensource.com 的前社区架构师和编辑。

4 条评论

我曾试图说服我视力受损的朋友尝试 Linux,但没有成功。阻力的主要原因是文档匮乏,这使得学习变得困难,不稳定性(例如,orca 停止阅读屏幕)以及开发人员对新框架的渴望和“从头开始”重写一切。

Ubuntu/Vinux 有许多工具可以_某种程度上_与屏幕阅读器一起工作,但实际上非常难以使用。在 Gedit 和 Nautilus 中,并非所有控件都被 orca 读取。因此,用户无法确定哪个特定的窗口/选项卡被激活。通过 Firefox 的测试,我们发现 gmail 在 Windows 中比在 Linux 中读取得更好。可能通过努力学习,仅使用终端、w3m 和 vim 可以获得更好的成功。但再说一遍——你甚至不能在 gnome 终端中选择所有文本并复制,因为他们已经丢失了该操作的热键!

orca 的另一个问题是从一种语言切换到另一种语言。我开发了脚本,使用 expect 命令通过命令行传递必要的参数,但这是一种 hack。

主要的障碍是闭源程序 Skype,它在 Windows 上运行良好,但在 Linux 上,你甚至无法在没有有视力的人的帮助下安装它。即使你安装了它,你也无法使用 orca 正确使用它。

如果任何开源开发人员关心辅助功能,我建议为程序开发良好的命令行界面,或者至少仅通过监听 Orca 而不看屏幕来测试它。我敢打赌他会发现一些使用热键/标签键和方向键无法到达的地方。

[抱歉重复发帖 - 忘记了“回复”链接]

Valdis Vitolins,你提出了一个很好的观点。许多程序使用 Orca 进行辅助功能勉强及格,即使这样,它们也不是完全可用的。在许多方面,Linux 在盲人和行动不便人士的辅助功能方面有点落后。命令行界面在几十年前对于看不到屏幕的人来说很棒,因为屏幕阅读器所要做的就是读取文本,但现在他们必须应对当今可用的复杂和高级图形环境。我不认为我们应该阻止进步的潮流,但至少要维护和为最基本的界面添加一些功能和辅助功能。

回复 作者:Valdis Vitolins (未验证)

对我来说,辅助工具的最大问题是图形界面和口头/听觉界面之间的距离,而不是试图屏幕抓取或使用来自 gui 的剩余部分并使某些东西适合,而是使用 API 来驱动和读取应用程序的状态或内容。

在我使用语音用户界面的工作中,我无法告诉你有多少次我希望我拥有关于应用程序的内部信息以及它如何解释数据,这样我就可以编写适当的语法而不是黑客式的击键注入玩具

Brokenhands,这是一个绝妙的主意。我曾尝试使用屏幕阅读器和其他工具,但几乎没有成功,这似乎是主要的罪魁祸首 - 阅读器会尝试“读取”GUI 的某些部分,这些部分要么不可读,要么不打算被读取,从而带来噪音和不必要的信息,这可能会使用户感到困惑和糊涂。这就是我一直使用 Orca 和其他屏幕阅读器遇到的问题。
我同意视觉界面和听觉界面之间存在很大差异 - 使用视觉界面,你可以在紧凑的空间中塞入大量信息;听觉界面则不然。我认为这是最大的挑战:创建一个像我们当前的视觉界面一样有用和灵活的听觉界面。也许我们应该创建 AUI 而不是试图增强 GUI。

回复 作者:Brokenhands (未验证)

© . All rights reserved.