为什么英特尔将斯蒂芬·霍金的语音系统开源

还没有读者喜欢这个。
Where are IT innovations coming from?

Opensource.com

英特尔已宣布将斯蒂芬·霍金的语音系统开源,鼓励创新和改进,这可能会向全世界的肢体残疾人士开放这项技术。

斯蒂芬·霍金可能是我们这个时代最伟大的科学头脑之一,他在 21 岁时被诊断出患有肌萎缩性脊髓侧索硬化症(ALS)。这种疾病慢慢地使他瘫痪,并最终夺走了他的说话能力,但在一个独特的语音系统的帮助下,他重新找到了自己的声音。

1997 年,英特尔设计了一个独特的语音系统,使霍金能够与世界交流。2004 年,由 NeoSpeech 提供的文本到语音功能赋予了他标志性的声音。

该语音系统是闭源和专有许可的,这意味着只有英特尔工程师才能进行改进。其他任何想改进这项技术的人都必须从头开始构建自己的系统——直到现在。去年年底,英特尔宣布计划开源霍金语音系统的所有代码。该公司在今年早些时候在 GitHub 上以 Apache 许可证 2.0 版 发布了该系统。

斯蒂芬·霍金的语音系统如何工作

该语音系统由三个主要部分组成,其工作原理如下

  1. 霍金眼镜上的红外传感器,用于感应他脸颊的运动。
  2. 来自红外传感器的信号随后被发送到一个软件平台,该平台允许霍金在不使用双手的情况下导航系统。这可以用于执行一系列任务,包括移动鼠标或使用虚拟键盘。
  3. 文本到语音功能,将他写的文本转换成他标志性声音的语音。

为什么要将这项技术开源?

通过将这项技术作为开源发布,英特尔允许世界上任何人对这项技术进行改进。有了电脑、想法和一些动力,你现在就可以进行改进。

在该技术作为开源发布之前,任何英特尔以外的工程师都必须从头开始设计整个语音系统,才能进行一个小的改进。现在,随着英特尔的所有辛勤工作都公开,任何人都可以很容易地在已经设计好的技术基础上进行构建。

这应该会大大提高软件的改进速度,从而带来更高质量和更易于访问的技术。

这项技术可以帮助谁?

不幸的是,并非所有患有运动神经元疾病的人都能获得或有资金获得像这样的语音系统,这可能会使沟通变得不可能。但是,随着这项技术作为开源发布,未来看起来一片光明。随着这项技术的改进速度和可访问性的提高,越来越多的患有改变人生的肢体残疾的人将能够使用它并重新开始交流。

在今天的世界里,有超过 300 万人患有运动神经元疾病和四肢瘫痪,他们发现沟通困难或不可能。霍金教授的语音系统能够适应每个人的身体能力。例如,这项技术可以开发成对眨眼、眉毛运动、触摸和其他细微动作做出反应。

了解更多

想改进霍金教授的语音系统吗?

  • 在此处查找源代码 here
  • 有关该项目的更多信息,或联系英特尔的一位首席工程师,点击此处或查看这份演示文稿
  • 在此处了解更多关于英特尔语音系统的信息 here
  • 点击此处了解更多关于霍金系统的文本到语音功能。
标签
Sarah Pratt, NeoSpeech
Sarah 热爱开源技术的理念,并很高兴看到由于技术开源而取得的进步。Sarah 在领先的文本到语音公司 NeoSpeech 工作,并管理他们的博客 Text2Speech,该博客偶尔会发布关于开源语音技术的文章。

5 条评论

感谢发布这个。
我的父亲最近去世了,在他生命的最后一周无法沟通,尽管他显然是清醒的,我可以在他的眼睛里看到他因为无法沟通而感受到的沮丧和恐惧。在经历了这些之后,我意识到这种无法忍受的情况太普遍了。

从那时起,我一直在努力寻找(或制造)一种经济上可行的解决方案来解决这种可怕的状况,因为在这方面似乎明显缺乏进展。虽然我可以找到很多有希望的零星部件,但似乎没有一种经济实惠的硬件/软件解决方案可以将各种文本到语音技术与经济实惠的控制界面结合起来。

无论如何,很高兴看到英特尔工程师采取了什么方法,但我更倾向于眼球追踪和简化的预制单词和短语菜单,这些菜单可以在上下文中组织/导航。

所以谢谢你 Sarah,也谢谢你英特尔。

嗨 Robert,

感谢您分享您的故事,听到您和您的父亲经历了这些,我感到很抱歉。我无法想象那一定有多么艰难。虽然我自己不是哑巴,但我经常看到这对哑巴以及他们的亲密朋友和家人产生的影响。我最近和一个年轻女士交谈过,她用文本到语音来宣读她的结婚誓言。这是一个如此动人的故事,它表明语音技术确实可以改变生活。

我非常高兴看到这项技术在开源后将如何发展——希望我们很快就能找到每个人都能负担得起的解决方案。祝您的项目好运,我很高兴听到已经有人在从事这项工作!

回复 作者 Robert Lambert (未验证)

谢谢。

我也是。
;^)

回复 作者 sarahneo

> 我更倾向于眼球追踪和简化的预制单词和短语菜单,这些菜单可以在上下文中组织/导航。

Robert,我想这周我在 Reddit 上看到的东西会非常适合你。

https://www.reddit.com/r/software/comments/3kdghp/eye_tracking_software…

TL;DR:OptiKey 是一款适用于 Windows 的开源软件,旨在与价格约为 100 美元的商品眼球追踪硬件一起使用。一大群 Reddit 用户立即下载并试用了它,并表示它运行良好。

回复 作者 Robert Lambert (未验证)

我从事辅助技术领域已有 15 年了,我知道斯蒂芬·霍金使用了一款名为 EZ Keys 的软件,它不是由英特尔开发的,而是一家名为 Words+ 的公司开发的。该软件也由他推广,语音启用版的零售价在 900 英镑到 1,400 英镑之间。

无论如何,EZ Keys 几年前就无法使用了,这可能是推动斯蒂芬需要英特尔帮助的原因,因为他也使用他们的硬件来运行 EZ Keys 软件。新的开源软件几乎完全是 EZ Keys 的副本,但是,大部分非语音方面都被禁用了。

还有其他软件标题可用,它们比 EZ Keys 或其新版本做得更好、更易于理解。是的,它们的价格约为 360 英镑,但它们更优秀,即使我相信拥有声音是一项人权,但让公司收取这笔钱使他们能够对他们的产品进行大量的持续开发,从而为社会上非常需要的一部分人提供高质量的产品。

我还想补充一点,如果人们能够提供开源、高质量的通信产品,那就太理想了,但到目前为止,他们还没有。

© . All rights reserved.