英特尔为何将斯蒂芬·霍金的语音系统开源

还没有读者喜欢这篇文章。
Where are IT innovations coming from?

Opensource.com

英特尔宣布将斯蒂芬·霍金的语音系统开源,以鼓励创新和改进,从而为全世界的肢体残疾人士开放这项技术。

斯蒂芬·霍金可能是我们这个时代最伟大的科学头脑之一,他在 21 岁时被诊断出患有肌萎缩侧索硬化症 (ALS)。这种疾病逐渐使他瘫痪,并最终剥夺了他的说话能力,但在一个独特的语音系统的帮助下,他重新找到了自己的声音。

1997 年,英特尔设计了一个独特的语音系统,使霍金能够与世界交流。2004 年,NeoSpeech 提供的文本转语音功能赋予了他标志性的声音。

该语音系统是闭源的且拥有专有许可,这意味着只有英特尔的工程师可以进行改进。任何其他想要改进这项技术的人都必须从头开始构建自己的系统——直到现在。去年年底,英特尔宣布计划将霍金语音系统的所有代码开源。该公司于今年早些时候在 GitHub 上以 Apache License, version 2.0 许可发布了它。

斯蒂芬·霍金的语音系统如何工作

该语音系统由三个主要部分组成,它们的工作原理如下:

  1. 霍金眼镜上的红外传感器,用于感应他脸颊的运动。
  2. 来自红外传感器的信号随后被发送到一个软件平台,该平台允许霍金在不使用双手的情况下操作系统。这可以用于执行一系列任务,包括移动鼠标或使用虚拟键盘。
  3. 文本转语音功能,它将他写的文本转换成他标志性声音的语音。

为什么要将这项技术开源?

通过将这项技术开源,英特尔允许世界上任何人对这项技术进行改进。只要有一台电脑、一个想法和一些动力,你现在就可以进行改进。

在这项技术开源之前,任何英特尔以外的工程师都必须从头开始设计整个语音系统,才能进行一个小的改进。现在,随着英特尔的所有辛勤工作都公开,任何人都可以轻松地在已经设计好的技术之上进行构建。

这应该会大大提高软件的改进速度,从而带来更高质量和更易于访问的技术。

这项技术可以帮助谁?

遗憾的是,并非每个患有运动神经元疾病的人都能获得或有资金获得像这样的语音系统,这可能会使沟通变得不可能。但是随着这项技术开源,未来看起来一片光明。随着这项技术的改进速度和可访问性的提高,越来越多患有改变人生的肢体残疾的人将能够使用它并重新开始交流。

在当今世界,有超过 300 万人患有运动神经元疾病和四肢瘫痪,他们发现沟通困难或不可能。霍金教授的语音系统能够进行调整以适应每个人的身体能力。例如,这项技术可以开发成对眨眼、眉毛运动、触摸和其他细微动作做出反应。

了解更多

想要改进霍金教授的语音系统吗?

  • 这里找到源代码。
  • 有关该项目的更多信息,或要联系英特尔的首席工程师之一,请点击此处或查看此演示文稿
  • 这里了解更多关于英特尔语音系统的信息。
  • 点击此处了解更多关于霍金系统文本转语音功能的信息。
标签
Sarah Pratt, NeoSpeech
Sarah 热爱开源技术的理念,并很高兴看到因技术开源而取得的进步。Sarah 在领先的文本转语音公司 NeoSpeech 工作,并管理他们的博客 Text2Speech,该博客偶尔会发布关于开源语音技术的文章。

5 条评论

感谢发布这篇文章。
我的父亲最近去世了,在他生命的最后一周里无法沟通,尽管他显然是清醒的,我可以从他的眼睛里看到他因为无法沟通而感到的沮丧和恐惧。经历了这件事后,我意识到这种无法忍受的情况太普遍了。

从那时起,我一直在四处奔走,试图找到(或制作)一种经济上可行的解决方案来解决这种可怕的状况,因为在这方面似乎明显缺乏进展。虽然我可以找到许多有前景的零星部件,但似乎没有一种经济实惠的硬件/软件解决方案能够将各种文本转语音技术与经济实惠的控制界面结合起来。

无论如何,看到英特尔工程师采取的方法很有趣,但我更倾向于眼动追踪和一个简化的预制词语和短语菜单,这些菜单可以按上下文组织/导航。

所以谢谢你 Sarah,谢谢你英特尔。

嗨 Robert,

感谢你分享你的故事,听到你和你的父亲经历了这些,我感到很抱歉。我无法想象那一定有多么艰难。虽然我自己不是哑巴,但我经常看到这对哑巴以及他们的亲密朋友和家人造成的影响。我最近和一个年轻女士谈过话,她用文本转语音来宣读她的结婚誓言。这是一个非常动人的故事,它表明语音技术真的可以改变生活。

我非常兴奋地看到这项技术在开源后将如何发展——希望我们很快就能找到一种每个人都能负担得起的解决方案。祝你的项目好运,我很高兴听到已经有人在做这件事了!

回复 作者:Robert Lambert (not verified)

谢谢。

我也是。
;^)

回复 作者: sarahneo

> 我更倾向于眼动追踪和一个简化的预制词语和短语菜单,这些菜单可以按上下文组织/导航。

Robert,我认为我这周在 Reddit 上看到的东西会非常适合你。

https://www.reddit.com/r/software/comments/3kdghp/eye_tracking_software…

TL;DR: OptiKey 是一款适用于 Windows 的开源软件,旨在与价格约为 100 美元的商用眼动追踪硬件一起使用。一大堆 Reddit 用户立即下载并试用了它,并表示它运行良好。

回复 作者:Robert Lambert (not verified)

我在这个辅助技术领域工作了 15 年,我知道斯蒂芬·霍金使用了一款名为 EZ Keys 的软件,这款软件不是由英特尔开发的,而是一家名为 Words+ 的公司开发的。该软件也由他推广,语音启用版本的零售价在 900 英镑到 1,400 英镑之间。

无论如何,EZ Keys 在几年前变得不可用了,这可能是导致斯蒂芬需要英特尔帮助的原因,因为他也使用他们的硬件来运行 EZ Keys 软件。新的开源软件几乎是 EZ Keys 的精确副本,但是,许多非语音方面都被禁用了。

还有其他一些软件产品比 EZ Keys 或其新版本做得更好、更易于理解。是的,它们的价格约为 360 英镑,但它们更出色,即使我相信拥有声音是一项人权,但公司收取这笔钱使他们能够对他们的产品进行大量持续开发,从而为社会急需的一部分人提供高质量的产品。

我还想补充一点,如果人们能够提供开源、高质量的通信产品,那将是理想的,但到目前为止,他们还没有这样做。

Creative Commons License本作品根据 Creative Commons Attribution-Share Alike 4.0 International License 获得许可。
© . All rights reserved.