Linux 和开源软件中的辅助功能状态

暂无读者喜欢这篇文章。
Open field

Opensource.com

Spencer Hunley 是一位自闭症专业人士,曾任 堪萨斯城市长残疾人委员会 副主席,现任 Heartland 自闭症协会和 ASAN 堪萨斯城分会的董事会成员。今年 8 月,Spencer 将在 芝加哥 LinuxCon 上发表题为 Universal Tux:为我们未来的自己实现辅助功能 的演讲。他还曾在 2013 年北美 LinuxCon 上发表题为 最大化辅助功能:让残疾人参与 Linux 社区 的演讲。

在本次采访中,Spencer 介绍了 Linux 和开源软件中辅助功能的最新状态。

自从去年夏天我在 LinuxCon 上看到您发表演讲以来,您在辅助功能领域做了哪些工作?

去年 LinuxCon 之后不久,Carla Schroder 创建了一个名为 Universal Tux 的 Google+ 社群,我一直非常积极地与另外三人和 Carla 一起担任版主。我们创建并更新了一份关于辅助功能的 优先事项列表,其中包括一些相对容易修复的问题,以及一些更崇高的目标。我们开始关注文档,因为许多发行版可能内置了辅助功能,但关于如何使用这些功能的信息可能会因应用程序和内核更新而迅速过时。这同样适用于辅助功能应用程序和程序,原因大致相同。幸运的是,文档是一个许多人都可以参与的领域,即使他们不熟悉编程或代码。我认为 Universal Tux 正在获得一些关注,我们正在受到关注。Daniel ForeElementary OS 正在积极参与讨论,其他发行版的一些人也加入了进来。

Spencer Hunley我们开始关注文档,因为许多发行版可能内置了辅助功能,但关于如何使用这些功能的信息可能会因应用程序和内核更新而迅速过时。这同样适用于辅助功能应用程序和程序,原因大致相同。幸运的是,文档是一个许多人都可以参与的领域,即使他们不熟悉编程或代码。我认为 Universal Tux 正在获得一些关注,我们正在受到关注。Daniel ForeElementary OS 正在积极参与讨论,其他发行版的一些人也加入了进来。

就我个人而言,我有一段时间处于待业状态。值得庆幸的是,情况似乎正在好转。我一直在尝试一些不同的发行版:Jonathan Nadeau 的 SONAR 发行版,以及 Vinux。保持对辅助功能的关注并不容易,但当你看到事情朝着正确的方向快速发展时,这是一种美好的感觉。

最近,我还加入了 自闭症自我倡导网络 的当地 堪萨斯城分会,并且目前担任 Heartland 自闭症协会 的董事会成员。

目前哪些开源辅助功能项目和人物是“值得关注的”,为什么?

Dasher 是一款应用程序,它允许通过各种方式进行文本输入,使用通过文本预测辅助用户的界面——他们称之为概率预测模型。它适用于 Linux 和 Windows,并且易于使用,有时几乎就像玩视频游戏一样。这是一个很棒的程序,它正在扩展输入设备的种类,例如,使用呼吸或倾斜平台来操作界面,并且通过练习,有时可以超过传统的键盘打字速度。期待 Dasher 继续创新,尤其是作为一款跨平台应用程序。

Orca 屏幕阅读器/放大镜仍然是广受欢迎的工具,具有许多不错的功能。由于其他应用程序的各种开发周期,它的老化程度相对较高,但由项目负责人 Joanmarie Diggs 领导的开发团队正在努力修复错误并提高 Orca 的通用性。一个更突出的争议点是 Orca 无法使不可访问的软件变得可访问;有时这只是实施辅助功能支持或仅更新几行代码的简单情况。然而,这个项目已经存在很长时间了,是视障人士的主要工具。

还有 Andy Lin 在 推广 Google Glass 作为辅助技术 方面的工作。使 Google Glass 具有辅助功能并将其用作辅助技术是一个绝妙的主意,对残疾人具有重大意义。对于听力障碍人士,它可以提供某人所说内容的实时文本翻译。对于视障人士,它可以转录某人周围的环境以及他们面前的事物。通过使用语音控制,行动不便的人可以使用它来操作智能手机、计算机等。它还可以通过提供反馈来补充其他辅助技术设备,而且所有这些成本都比当今市场上销售的许多辅助技术设备便宜得多。此外,由于 Google Glass 相对主流,并且被各种能力的人使用,因此它摆脱了许多辅助技术设备所背负的污名,从而促进了残疾人在社会中的融合。

Enable Viacam (eViacam) 类似于 GNOME 的 MouseTrap 应用程序,它允许仅通过移动头部来使用鼠标。与计算机和网络摄像头配合使用,对于行动不便的人来说,它是比昂贵得多的专有解决方案的 FOSS 替代方案。Eviacam 与 Dasher 结合使用,为专有辅助技术软件提供了有吸引力的替代方案。

James McClain,Palaver 和 VoxForge:语音识别一直是身心和发育障碍人士的首要需求,但似乎总是达不到预期。去年,James McClain 发布了一个新颖想法的公开测试版:在后端使用 Google Voice API。凭借一些出色的功能和持续的开发,Palaver 和 VoxForge 可能会将高质量的语音识别带到 Linux 桌面。与此类似的是 LiSpeak,这是一个基于 Palaver 构建的 Linux 发行版语音命令系统。

开放假肢项目:随着 3D 打印机变得越来越便宜,它们的潜在用途也得到了扩展;开放假肢项目的 Jonathan Kuniholm 也是今年北美 LinuxCon 的主题演讲人,他致力于为高效且经济高效的假肢提供设计,人们可以独立组装和使用这些假肢。吸引我眼球的是他们的座右铭:“假肢不应该花费一条胳膊和一条腿。”

开源操作系统仍然缺少哪些辅助功能或服务?

对于主流发行版和残疾用户来说,首先想到的是语音转文本和文本转语音界面。对于许多人来说,Dragon Naturally Speaking 是他们通往 Linux 之路的最后一个障碍。具体来说,一个可以处理语音命令和听写,并且还可以与盲文显示器配合使用的核心框架将非常受欢迎。

文档,即使不是一个特定于残疾的问题,也非常重要。毕竟,许多残疾人对 Linux 或 FOSS 软件/操作系统一无所知,而最新的信息对于能够利用任何内置的辅助功能至关重要。Accessibility-HOWTO 急需完全取代其当前状态。好的一面是,这相对容易修复,并且不需要对代码进行重大修改。

在许多发行版中,内置的、易于使用和理解的辅助功能支持很难找到。你能告诉我激活 Ubuntu 中辅助功能支持的组合键吗?其他发行版呢?事实是,虽然它存在,但可能不容易找到和/或使用。在解决这个问题时,关注独立性至关重要。没有人希望不得不求助于其他人来帮助他们安装新的操作系统或使用应用程序。对于残疾人来说尤其如此;学习曲线可能几乎是不可能的,这使得在 FOSS 世界中几乎没有选择,这取决于你的能力。

找到辅助功能项目很容易,但找到持续开发的项目却很困难。这并不是任何人的错;坦率地说,其他项目变得更受欢迎、更重要,并且被庞大的用户群更频繁地使用;然而,随着越来越多的辅助功能项目开始与未来技术(语音控制、语音识别、家庭自动化等)的主流梦想相交,我乐观地认为它们将获得更多关注,并有望获得更多发展。


 

要联系 Spencer Hunley,您可以通过

  • 发送电子邮件至 spencer.hunley@gmail.com
  • 在 G+SpencerHunley 上联系他
  • 查看他的个人资料:about.me/spencerhunley
标签
User profile image.
Rikki Endsley 是 Red Hat 的开发者项目管理编辑,也是 Opensource.com 的前社区架构师和编辑。

4 条评论

我曾试图说服我的视障朋友尝试 Linux,但没有成功。主要阻力是文档质量差,导致学习困难、不稳定(例如,orca 停止读取屏幕)以及开发者渴望新的框架并“从头开始”重写一切。

Ubuntu/Vinux 有许多工具可以 _在某种程度上_ 与屏幕阅读器一起工作,但实际上非常难以使用。在 Gedit 和 Nautilus 中,并非所有控件都能被 orca 读取。因此,用户无法确定哪个特定的窗口/选项卡被激活。通过使用 Firefox 进行的测试,我们发现 gmail 在 Windows 中比在 Linux 中读取效果更好。可能通过努力学习,仅使用终端、w3m 和 vim 可以获得更好的成功。但是再说一遍——你甚至不能在 gnome 终端中选择所有文本并复制,因为他们已经丢失了用于此操作的热键!

orca 的另一个问题是从一种语言切换到另一种语言。我已经开发了脚本,这些脚本使用 expect 命令通过命令行传递必要的参数,但这是一种 hack 方法。

主要的障碍是闭源程序 Skype,它在 Windows 上运行良好,但在 Linux 上,你甚至无法在没有视力正常的人的帮助下安装它。即使你安装了它,你也无法使用 orca 正确使用它。

如果任何开源开发者关心辅助功能,我建议为程序开发良好的命令行界面,或者至少在不看屏幕的情况下仅使用 Orca 监听来测试它。我敢打赌他会发现有些地方无法通过热键/选项卡和箭头键到达。

[对于重复发布表示歉意 - 忘记了“回复”链接]

Valdis Vitolins,您提出了一个非常好的观点。许多程序勉强可以通过 Orca 实现辅助功能,即使这样,它们也并非完全可用。在许多方面,对于盲人和行动不便的人来说,Linux 在辅助功能方面有点落后。命令行界面在几十年前对于看不到屏幕的人来说很棒,因为屏幕阅读器所要做的就是读取文本,但现在他们必须应对当今可用的复杂和高级图形环境。我不认为我们应该逆转进步的潮流,但至少应该维护和添加一些功能和辅助功能到最基本的界面。

回复 ,作者:Valdis Vitolins(未验证)

对我来说,辅助功能工具的最大问题是图形界面和口头/听觉界面之间的距离,而不是试图屏幕抓取或使用来自 gui 的残余并使其适应,而是使用 API 来驱动和读取应用程序的状态或内容。

在我使用语音用户界面的工作中,我无法告诉您有多少次我希望拥有关于应用程序及其如何解释数据的内部信息,这样我就可以编写适当的语法,而不是破解的击键注入玩具

Brokenhands,这是一个绝妙的主意。我曾尝试使用屏幕阅读器和其他工具,但收效甚微,这似乎是主要原因——阅读器会尝试“读取”GUI 的某些部分,这些部分要么不可读,要么不打算读取,从而带来噪音和不必要的信息,这些信息会使用户感到困惑。这是我使用 Orca 和其他屏幕阅读器时一直遇到的问题。
我同意视觉界面和听觉界面之间存在很大差异——使用视觉界面,你可以在紧凑的空间中塞入大量信息;而听觉界面则不然。我认为这是最大的挑战:创建一个像我们当前视觉界面一样有用和灵活的听觉界面。也许我们应该创建 AUI 而不是试图增强 GUI。

回复 ,作者:Brokenhands(未验证)

Creative Commons License本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.