Linux 和开源软件中的辅助功能状态

还没有读者喜欢这篇文章。
Open field

Opensource.com

Spencer Hunley 是一位患有自闭症的专业人士,曾任 堪萨斯城市长残疾人委员会副主席,现任 Heartland 自闭症协会和 ASAN 堪萨斯城分会董事会成员。8 月,Spencer 将在 芝加哥 LinuxCon 上发表演讲,主题为通用 Tux:为了我们未来的自我而实现的辅助功能。他还曾在 2013 年北美 LinuxCon 上发表过题为 最大化辅助功能:吸引残疾人参与 Linux 社区的演讲。

在本次访谈中,Spencer 介绍了 Linux 和开源软件中辅助功能的最新状态。

自从去年夏天在 LinuxCon 上看到您演讲以来,您在辅助功能领域做了哪些工作?

去年 LinuxCon 之后不久,Carla Schroder 启动了一个名为 Universal Tux 的 Google+ 社区,我一直非常积极地担任版主,与另外三个人和 Carla 一起工作。我们创建并更新了一个关于辅助功能的 优先事项列表,其中包括一些相对容易修复的问题,以及一些更崇高的目标。

Spencer Hunley我们开始关注文档,因为许多发行版可能内置了辅助功能,但关于如何使用它的信息可能会因应用程序和内核更新而很快过时。这同样适用于辅助功能应用程序和程序,原因大致相同。文档是一个幸运的是许多人都可以参与的领域,即使他们不熟悉编程或代码。我认为 Universal Tux 正在获得一些关注,并且我们正在受到关注。Daniel Fore,来自 Elementary OS 正在积极参与讨论,来自其他发行版的其他人也在加入。

就我个人而言,我有一段时间处于待业状态。谢天谢地,这种情况似乎正在稳定下来。我一直在尝试一些不同的发行版:Jonathan Nadeau 的 SONAR 发行版Vinux。与辅助功能保持同步并不容易,但是当你看到事情朝着正确的方向快速发展时,感觉真是太棒了。

我最近还加入了当地的 堪萨斯城分会 自闭症人士权益倡导网络,并且是 Heartland 自闭症协会的现任董事会成员。

哪些开源辅助功能项目和人物是目前“值得关注的”,为什么?

Dasher,一个应用程序,允许通过各种方式使用通过文本预测来辅助用户的界面进行文本输入——他们称之为概率预测模型。它适用于 Linux 和 Windows,并且易于使用,有时几乎就像玩视频游戏一样。这是一个很棒的程序,它正在扩展输入设备的种类,例如,使用呼吸或倾斜平台来操作界面,并且通过练习,有时可以超过传统的键盘打字速度。期待 Dasher 继续创新,尤其是在作为跨平台应用程序方面。

Orca 屏幕阅读器/放大镜仍然是经久不衰的最爱,具有许多不错的功能。由于其他应用程序之间的各种开发周期,它并没有很好地适应时代,但是由项目负责人 Joanmarie Diggs 领导的开发团队正在努力修复错误并提高 Orca 的多功能性。一个更突出的争议点是 Orca 无法使无法访问的软件变得可访问;有时这只是一个简单的辅助功能支持实现问题,或者只是更新几行代码。然而,这个项目已经存在很长时间了,并且是那些有视觉障碍的人的主力。

还有 Andy Lin 关于 将 Google Glass 作为辅助技术 的工作和推广。使 Google Glass 具有辅助功能并将其用作辅助技术是一个绝妙的主意,对残疾人具有重大意义。对于有听力障碍的人,它可以提供对别人说的话的实时文本翻译。对于有视觉障碍的人,它可以转录某人周围的环境以及他们面前的东西。通过使用语音控制,行动不便的人可以使用它来操作智能手机、计算机等。并且它可以补充其他辅助技术设备,提供反馈,所有这些成本都比当今市场上销售的许多辅助技术设备便宜得多。此外,由于 Google Glass 相对主流,并且被不考虑其能力的人使用,因此它摆脱了许多辅助技术设备所背负的任何污名,从而促进了残疾人在社会中的融合。

Enable Viacam (eViacam),类似于 GNOME 的 MouseTrap 应用程序,允许仅通过移动头部来使用鼠标。与计算机和网络摄像头配合使用,对于行动不便的人来说,它是更昂贵的专有选项的 FOSS 替代方案。Eviacam 与 Dasher 结合使用,为专有辅助技术软件提供了有吸引力的替代方案。

James McClain,Palaver 和 VoxForge:语音识别一直是身体、精神和发育障碍人士的首要需求,但似乎总是达不到预期。去年,James McClain 发布了一个新颖想法的公开测试版:在后端使用 Google Voice API。凭借一些出色的功能和持续的开发,Palaver 和 VoxForge 可以为 Linux 桌面带来高质量的语音识别。与此同出一辙的是 LiSpeak,一个基于 Palaver 构建的 Linux 发行版的语音命令系统。

开放假肢项目:随着 3D 打印机变得更便宜,它们的潜在用途也得到了扩展;开放假肢项目的 Jonathan Kuniholm 也是今年北美 LinuxCon 的主题演讲人,致力于为高效且具有成本效益的假肢提供设计,人们可以独立组装和使用。让我眼前一亮的是他们的座右铭:“假肢不应该花费一条胳膊和一条腿。”

开源操作系统仍然缺少哪些辅助功能或服务?

对于主流发行版和残疾用户,首先想到的是语音转文本和文本转语音界面。对于许多人来说,Dragon Naturally Speaking 是他们通往 Linux 的道路上剩下的唯一障碍。具体来说,一个可以处理语音命令和听写,并且还可以与盲文显示器配合使用的核心框架将非常受欢迎。

文档,即使不是特定于残疾的问题,也非常重要。毕竟,许多残疾人对 Linux 或 FOSS 软件/操作系统一无所知,并且最新的信息对于能够利用任何内置辅助功能至关重要。Accessibility-HOWTO 迫切需要完全替换其当前状态。好的一面是,这相对容易修复,并且不需要对代码进行重大修改。

在许多发行版中,内置的、易于使用和理解的辅助功能支持很难找到。你能告诉我激活 Ubuntu 中该支持的组合键吗?其他发行版呢?事实是,虽然它在那里,但可能不容易找到和/或使用。在解决这个问题时,关注独立性至关重要。没有人希望不得不求助于其他人来帮助他们安装新的操作系统,或使用应用程序。对于残疾人来说尤其如此;学习曲线可能几乎是不可能的,这使得 FOSS 世界几乎没有选择,这取决于您的能力。

找到辅助功能项目很容易,但找到持续开发的项目却很困难。这实际上不是任何人的错;坦率地说,其他项目变得更受欢迎、更重要,并且被庞大的用户群更频繁地使用;然而,随着越来越多的辅助功能项目开始与未来技术(语音控制、语音、识别、家庭自动化等)的主流梦想相交,我乐观地认为它们将受到更多关注,并有望获得更多发展。


 

要与 Spencer Hunley 联系,您可以

  • 给他发送电子邮件,地址为 spencer.hunley@gmail.com
  • 在 G+SpencerHunley 上联系他
  • about.me/spencerhunley 查看他的个人资料
标签
User profile image.
Rikki Endsley 是 Red Hat 的开发者项目管理编辑,也是 Opensource.com 的前社区架构师和编辑。

4 条评论

我曾试图说服我的视障朋友尝试 Linux,但没有成功。阻力的主要原因是文档不足,这使得学习变得困难,不稳定性(例如,orca 停止阅读屏幕)以及开发者对新框架的渴望和“从头开始”重写一切。

Ubuntu/Vinux 有许多工具可以_在某种程度上_与屏幕阅读器一起工作,但实际上非常难以使用。在 Gedit 和 Nautilus 中,并非所有控件都由 orca 读取。因此,用户不能确定哪个特定的窗口/选项卡被激活。通过对 Firefox 的测试,我们发现 gmail 在 Windows 中比在 Linux 中读取效果更好。可能通过努力学习,可以更好地使用终端、w3m 和 vim 获得成功。但再说一次——你甚至不能在 gnome 终端中选择所有文本并复制,而无需鼠标,因为他们已经丢失了该操作的热键!

orca 的另一个问题是从一种语言切换到另一种语言。我已经开发了脚本,使用 expect 命令通过命令行传递必要的参数,但这是一种 hack。

主要的障碍是闭源程序 Skype,它在 Windows 上运行良好,但在 Linux 上,您甚至无法在没有有视力的人的帮助下安装它。即使您安装了它,您也无法使用 orca 正确使用它。

如果任何开源开发者关心辅助功能,我建议为程序开发良好的命令行界面,或者至少仅使用监听 Orca 进行测试,而无需查看屏幕。我敢打赌,他会发现使用热键/选项卡和箭头键无法到达的地方。

[抱歉重复发帖 - 忘记了“回复”链接]

Valdis Vitolins,您提出了一个很好的观点。许多程序使用 Orca 进行辅助功能时勉强合格,即使这样,它们也不是完全可用的。在许多方面,对于盲人和行动不便的人来说,Linux 在辅助功能方面有点落后。命令行界面在几十年前对于那些看不到屏幕的人来说很棒,因为屏幕阅读器所要做的就是读取文本,但现在他们必须应对当今可用的复杂和高级图形环境。我不认为我们应该逆转进步的潮流,但至少要维护并在最基本的界面中添加一些功能和辅助功能。

回复 作者 Valdis Vitolins (未验证)

对我来说,辅助功能工具的最大问题是图形界面和口头/听觉界面之间的距离,而不是试图屏幕抓取或使用 gui 的残余并使其适应,而是使用 API 来驱动和读取应用程序的状态或内容。

在我使用语音用户界面的工作中,我无法告诉您有多少次我希望拥有关于应用程序的内部信息以及它如何解释数据,以便我可以编写正确的语法而不是黑客式的按键注入玩具

Brokenhands,这是一个极好的想法。我曾尝试使用屏幕阅读器和其他工具,但收效甚微,这似乎是主要原因——阅读器会尝试“读取”GUI 的某些部分,这些部分要么不可读,要么不打算读取,从而带来噪音和不需要的信息,这些信息可能会让用户感到困惑和迷惑。这就是我使用 Orca 和其他屏幕阅读器时一直遇到的问题。
我同意视觉界面和听觉界面之间存在很大差异——使用视觉界面,您可以在紧凑的空间中塞入大量信息;听觉界面则不然。我认为这是最大的挑战:创建一个与我们当前的视觉界面一样有用和灵活的听觉界面。也许我们应该创建 AUI 而不是尝试增强 GUI。

回复 作者 Brokenhands (未验证)

© . All rights reserved.