我在加拿大安大略省各地的农村小镇长大。我们并不特别富裕,虽然作为一个身处偏远地区的孩子,我并没有真正意识到我们的社会经济地位。我所意识到的是我父亲办公室里那台米色的电脑。爸爸在银行工作,对于他的工作来说,拥有一台电脑至关重要。因此,虽然我们从来没有最新的游戏机,但我们总有一台电脑。
可能正是因为如此,我与计算机相关的一切都建立了非常密切的关系。今天,我很幸运能在红帽工作,但那是另一个故事了。在 80 年代长大并在 90 年代中期度过我的青少年时期,我对计算机的变化有着生动的认识。我记得看着我爸爸第一次用我们的 9600 波特调制解调器上网。我记得我第一次能够为我最喜欢的游戏《模拟城市 2000》下载建筑物皮肤。
我提到所有这些是有原因的:我一生都在关注计算机的演变,从将神秘的命令输入 DOS(具有讽刺意味的是,有人说我多年后在红帽的角色中仍然执行相同的任务),到“胖”应用程序的 GUI,到 Web 应用程序和移动应用程序。突出显示的一个共同点是最终用户对与技术交互的不断简化的界面的需求。
从触摸到语音
几年来,能够戳你的设备屏幕并使其做出反应是很酷的事情。触摸屏风靡一时。如今,消费领域正朝着数字助理的方向发展。一些统计数据显示,到 2022 年,55% 的美国家庭将拥有语音助手。其他消息来源称,亚马逊每个季度销售大约 1400 万台这些设备,而谷歌以大约 1100 万台落后。如果您想要一个具体的市场价值,MarketWatch 估计到 2023 年,该行业的价值将达到 78 亿美元。这甚至没有考虑到每个人口袋里的手机!无论您使用什么指标,有一件事是明确的:语音助手变得越来越重要。
那么您唯一的选择是谷歌、亚马逊或苹果吗?当然不是!如果真是这样,我就不会写这篇文章了,在文章中我将向您介绍 Mycroft。
Mycroft:面向开发人员的开源语音助手
对我来说,Mycroft 的最大卖点是它是开源的。这意味着我可以参与其中,四处摸索并为该项目做出贡献。它主要基于 Python,这对我来说效果很好。
在我进一步讨论之前,我想提请您注意小标题:“面向开发人员”。这些是我的话,虽然我为该项目做出了贡献,但我并不代表它。但是,我想强调的是,该项目尚未达到可以大规模采用的状态。Mycroft 的 官方文档通常非常好,但存在一些粗糙的边缘,这些边缘一直在平滑。因此,如果您愿意付出一些努力,或许可以提交一些错误,并放眼长远,那么这个项目绝对值得您花时间。如果您正在寻找现成的项目,您可能需要一年左右的时间再回来。
以下是一些参与 Mycroft 项目的主要原因。
隐私
正如我所提到的,语音助手随处可见,而且还在不断增加。尽管它们经常被遗忘,但它们正在倾听一切。 Apple、 Google 和 Amazon 都被发现正在收听其语音助手捕获的录音。在某些情况下,这些录音甚至被用于法庭。
如果您在家里的办公室工作(甚至在世界因 COVID-19 而天翻地覆之前)怎么办?如何保护您的用户和客户的隐私,尤其是在大多数人甚至没有意识到旨在让他们生活更轻松的技术正在捕获他们的私人对话时?
即使您不担心暴露您的对话,您是否可以接受公司收集这些数据用于定向广告?Mycroft 将隐私放在首位。其默认的语音转文本 (STT) 后端是 Google 的 STT 服务,但您可以从各种提供商中进行选择,包括 Google、IBM 的 Watson、Mozilla、Kaldi、Microsoft Azure 等。此外,Mycroft 会代理通过其服务器的针对特定提供商(Google 也是其中之一)的所有 STT 请求。
安全
还记得我说 Mycroft 是为开发人员准备的吗?由于您可以自托管 Mycroft,这意味着其安全性与您能实现的安全性一样好。您可以(并且应该)实施 VLAN、路由规则、防火墙规则以及与您的环境相关的任何其他安全措施。
即使您的安全性不是一流的,但您从拥有如此小的占用空间而获得的混淆意味着,除了随机机会或有针对性的攻击之外,您的 Mycroft 实例相对免受外界侵害。如果它在您的网络上,您可以控制什么人以及谁可以访问您的语音助手。这是一件好事。
我提到过 Python 吗?
我喜欢 Python。这是我能够如此快速地参与其中的主要原因之一。我在日常生活中广泛使用 Python,既为了娱乐,也为了盈利。我向我的妻子介绍了 Mycroft,她立即开始将任务添加到我的待办事项清单中,以完成她希望她的语音助手能够完成的所有事情。
当我努力完成我的待办事项清单时,我注意到其中一个 Mycroft 意图解析器(我将在我的下一篇文章中讨论)没有正确处理撇号。因此,以真正的开源方式,我 Fork 了代码,对其进行了修复,并针对该项目创建了一个 Pull Request (PR)。经过一些小的来回,我的 PR 被提升到了项目标准,瞧!Mycroft 现在可以更好地处理撇号了。这有多酷?
不仅如此,包括 KDE Plasma on TV 在内的其他项目已经集成了 Mycroft,以使其项目更具吸引力。我很乐意听到更多利用 Mycroft 的项目,所以如果您知道任何项目,请在 Twitter 上联系或在下面发表评论。
科幻小说
作为一个孩子,我一直喜欢科幻小说;事实上,我现在仍然喜欢。我希望能够像让-吕克·皮卡尔那样说“计算机,格雷伯爵茶。热”,并让事情神奇地发生。虽然食品复制机还有很长的路要走,但借助 Mycroft 和一点诀窍,我可以像这样说“嘿,Mycroft,启动茶壶”或“嘿,Mycroft,将面包添加到我的购物清单”,Mycroft 会做到这一点。
我对 Mycroft 开发人员社区来说还是一个相对较新的成员,但我们是一个由紧密联系的人组成的小团体,他们希望生活在一个有 Alexa、Siri 和 Google 的开源竞争对手的世界中。请访问我们在 Mattermost 上的聊天室。
7 条评论