为什么英特尔将斯蒂芬·霍金的语音系统开源

尚无读者喜欢这篇文章。
Where are IT innovations coming from?

Opensource.com

英特尔宣布将斯蒂芬·霍金的语音系统开源,鼓励创新和改进,这可能会为全世界的肢体残疾人士开放这项技术。

斯蒂芬·霍金可能是我们这个时代最杰出的科学头脑之一,他在 21 岁时被诊断出患有肌萎缩侧索硬化症(ALS)。这种疾病逐渐使他瘫痪,最终剥夺了他的说话能力,但在独特的语音系统的帮助下,他重新找到了自己的声音。

1997 年,英特尔设计了一个独特的语音系统,使霍金能够与世界交流。2004 年,NeoSpeech 提供的文本转语音功能赋予了他标志性的声音。

该语音系统是闭源和专有许可的,这意味着只有英特尔的工程师才能进行改进。任何其他想要改进这项技术的人都必须从头开始构建自己的系统——直到现在。去年年底,英特尔宣布计划将其为霍金语音系统编写的所有代码开源。该公司在今年早些时候在 GitHub 上以 Apache License 2.0 版 发布了该系统。

斯蒂芬·霍金的语音系统如何工作

该语音系统由三个主要部分组成,其工作方式如下:

  1. 霍金眼镜上的红外传感器,用于感应他脸颊的运动。
  2. 来自红外传感器的信号随后被发送到一个软件平台,该平台允许霍金在不使用双手的情况下导航系统。这可以用于执行一系列任务,包括移动鼠标或使用虚拟键盘。
  3. 文本转语音功能,将他输入的文本转换为他标志性声音的语音。

为什么要将这项技术开源?

通过将这项技术开源,英特尔允许世界上任何人对这项技术进行改进。有了计算机、想法和一些动力,你现在就可以进行改进。

在该技术开源发布之前,英特尔以外的任何工程师都必须从头开始设计整个语音系统,才能进行一项小的改进。现在,随着英特尔的所有辛勤工作公开,任何人都可以轻松地在已经设计的技术之上进行构建。

这应该会大大提高软件的改进速度,从而带来更高质量和更易于访问的技术。

这项技术可以帮助谁?

不幸的是,并非所有患有运动神经元疾病的人都能获得或有资金获得像这样的语音系统,这可能会使沟通变得不可能。但是随着这项技术开源发布,未来看起来一片光明。随着这项技术的改进速度和可访问性的提高,越来越多的患有改变人生的肢体残疾的人将能够使用它并重新开始交流。

在今天的世界里,有超过 300 万患有运动神经元疾病和四肢瘫痪的人发现沟通困难或不可能。霍金教授的语音系统能够适应每个人的身体能力。例如,这项技术可以开发成对眨眼、眉毛运动、触摸和其他细微之处做出反应。

了解更多

想改进霍金教授的语音系统吗?

  • 在此处查找源代码:这里
  • 有关该项目的更多信息,或联系英特尔的一位首席工程师,请点击这里或查看这份演示文稿
  • 在此处了解更多关于英特尔语音系统的信息:这里
  • 点击这里了解更多关于霍金系统文本转语音功能的信息。
标签
Sarah Pratt, NeoSpeech
莎拉热爱开源技术的理念,并很高兴看到由于技术开源而取得的进步。莎拉在 NeoSpeech 工作,这是一家领先的文本转语音公司,并管理他们的博客 Text2Speech,该博客偶尔发布关于开源语音技术的文章。

5 条评论

感谢发布这篇文章。
我的父亲最近去世了,在他生命的最后一周里,他无法沟通,尽管他显然是清醒的,我可以从他的眼神中看到他因无法沟通而感到的沮丧和恐惧。经历过这一切后,我意识到这种难以忍受的情况非常普遍。

从那时起,我就一直在努力寻找(或制造)一种经济上可行的解决方案来解决这种可怕的状况,因为在这方面似乎缺乏明显的进展。虽然我可以找到许多有希望的零散部件,但似乎没有一种经济实惠的硬件/软件解决方案可以将各种文本转语音技术与经济实惠的控制界面结合起来。

无论如何,看到英特尔工程师采取的方法很有趣,但我更倾向于眼动追踪和简化的预制单词和短语菜单,这些菜单可以按上下文组织/导航。

所以谢谢你,莎拉,谢谢你,英特尔。

嗨,罗伯特,

感谢您分享您的故事,听到您和您的父亲经历了这一切,我感到很抱歉。我无法想象这有多么艰难。虽然我自己不是哑巴,但我经常看到这对哑巴以及他们的亲密朋友和家人造成的影响。我最近与一位年轻女士交谈过,她使用文本转语音来宣读她的结婚誓词。这是一个如此动人的故事,展示了语音技术如何真正改变生活。

我非常兴奋地看到这项技术在开源后将如何发展——希望我们很快就会有一个每个人都能负担得起的解决方案。祝您的项目好运,我很高兴听到已经有人在研究这个了!

回复 作者:罗伯特·兰伯特(未验证)

谢谢。

我也是。
;^)

回复 作者:sarahneo

> 我更倾向于眼动追踪和简化的预制单词和短语菜单,这些菜单可以按上下文组织/导航。

罗伯特,我想我在本周 Reddit 上看到的一些东西会非常适合你。

https://www.reddit.com/r/software/comments/3kdghp/eye_tracking_software…

TL;DR:OptiKey 是一款适用于 Windows 的开源软件,旨在与价格约为 100 美元的商品眼动追踪硬件一起使用。一大堆 Reddit 用户立即下载并试用了它,并表示它运行良好。

回复 作者:罗伯特·兰伯特(未验证)

我从事辅助技术领域已有 15 年了,我知道斯蒂芬·霍金使用的名为 EZ Keys 的软件并非由英特尔开发,而是一家名为 Words+ 的公司。该软件也由他推广,语音启用版本的零售价在 900 英镑到 1,400 英镑之间。

无论如何,EZ Keys 几年前变得不可用了,这可能促使斯蒂芬需要英特尔的帮助,因为他还使用他们的硬件来运行 EZ Keys 软件。新的开源软件几乎是 EZ Keys 的精确副本,但是,大部分非语音方面都被禁用了。

还有其他一些软件标题比 EZ Keys 或其新版本做得更好、更易于理解。是的,它们的价格约为 360 英镑,但它们更出色,即使我相信拥有声音是一项人权,但让公司收取这笔钱使他们能够对其产品进行大量持续开发,从而为社会上急需的群体提供高质量的产品。

我还想补充一点,如果人们能够提供开源、高质量的通信产品,那将是理想的,但到目前为止,他们还没有这样做。

知识共享许可协议本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可。
© . All rights reserved.