英特尔宣布将斯蒂芬·霍金的语音系统开源,以鼓励创新和改进,从而为全世界的肢体残疾人士开放这项技术。
斯蒂芬·霍金可能是我们这个时代最伟大的科学头脑之一,他在 21 岁时被诊断出患有肌萎缩侧索硬化症 (ALS)。这种疾病逐渐使他瘫痪,并最终剥夺了他的说话能力,但在一个独特的语音系统的帮助下,他重新找到了自己的声音。
1997 年,英特尔设计了一个独特的语音系统,使霍金能够与世界交流。2004 年,NeoSpeech 提供的文本转语音功能赋予了他标志性的声音。
该语音系统是闭源的且拥有专有许可,这意味着只有英特尔的工程师可以进行改进。任何其他想要改进这项技术的人都必须从头开始构建自己的系统——直到现在。去年年底,英特尔宣布计划将霍金语音系统的所有代码开源。该公司于今年早些时候在 GitHub 上以 Apache License, version 2.0 许可发布了它。
斯蒂芬·霍金的语音系统如何工作
该语音系统由三个主要部分组成,它们的工作原理如下:
- 霍金眼镜上的红外传感器,用于感应他脸颊的运动。
- 来自红外传感器的信号随后被发送到一个软件平台,该平台允许霍金在不使用双手的情况下操作系统。这可以用于执行一系列任务,包括移动鼠标或使用虚拟键盘。
- 文本转语音功能,它将他写的文本转换成他标志性声音的语音。
为什么要将这项技术开源?
通过将这项技术开源,英特尔允许世界上任何人对这项技术进行改进。只要有一台电脑、一个想法和一些动力,你现在就可以进行改进。
在这项技术开源之前,任何英特尔以外的工程师都必须从头开始设计整个语音系统,才能进行一个小的改进。现在,随着英特尔的所有辛勤工作都公开,任何人都可以轻松地在已经设计好的技术之上进行构建。
这应该会大大提高软件的改进速度,从而带来更高质量和更易于访问的技术。
这项技术可以帮助谁?
遗憾的是,并非每个患有运动神经元疾病的人都能获得或有资金获得像这样的语音系统,这可能会使沟通变得不可能。但是随着这项技术开源,未来看起来一片光明。随着这项技术的改进速度和可访问性的提高,越来越多患有改变人生的肢体残疾的人将能够使用它并重新开始交流。
在当今世界,有超过 300 万人患有运动神经元疾病和四肢瘫痪,他们发现沟通困难或不可能。霍金教授的语音系统能够进行调整以适应每个人的身体能力。例如,这项技术可以开发成对眨眼、眉毛运动、触摸和其他细微动作做出反应。
了解更多
想要改进霍金教授的语音系统吗?
5 条评论