我在加拿大安大略省的各个乡村小镇长大。我们家境不算富裕,虽然作为一个身处偏远地区的孩子,我并没有真正意识到我们的社会经济地位。我意识到的是一个米色的盒子,叫做电脑,放在我爸爸的办公室里。爸爸在银行工作,对于他的工作来说,拥有一台电脑至关重要。所以,虽然我们从来没有最新的游戏机,但我们总是有电脑。
可能就是因为这个原因,我对所有与电脑相关的东西产生了非常浓厚的兴趣。今天,我很幸运在红帽公司工作,但那是另一个故事了。在 80 年代长大,并在 90 年代中期度过我的青少年时期,我对电脑的变化有着深刻的认识。我记得看着爸爸第一次用我们的 9600 波特调制解调器登录上网。我记得第一次能够为我最喜欢的游戏《模拟城市 2000》下载建筑皮肤。
我提到这一切是有原因的:我亲眼目睹了电脑的整个演变过程,从在 DOS 中输入神秘的命令(讽刺的是,有人说我在红帽公司的工作中多年后仍然执行相同的任务),到“胖”应用程序的 GUI,到 Web 应用程序和移动设备。其中一个突出的共同点是最终用户对与技术交互的界面日益简化的需求。
从触摸到语音
几年来,很酷的事情是能够戳一下设备的屏幕并让它做出反应。触摸屏风靡一时。如今,消费领域正朝着数字助手发展。一些统计数据显示,到 2022 年,55% 的美国家庭将拥有语音助手。其他消息来源称,亚马逊每季度销售约 1400 万台此类设备,而谷歌紧随其后,约为 1100 万台。如果你想要一个具体的市场价值,MarketWatch 估计到 2023 年,这个行业的价值将达到 78 亿美元。这甚至没有考虑到每个人口袋里的手机!无论你使用什么指标,有一点是明确的:语音助手正变得越来越重要。
那么你唯一的选择是 Google、Amazon 或 Apple 吗?当然不是!如果真是那样,我就不会写这篇文章了,在本文中,我将向您介绍 Mycroft。
Mycroft:面向开发人员的开源语音助手
对我来说,Mycroft 最大的卖点是它是开源的。这意味着我可以参与其中,进行调整并为项目做出贡献。它主要基于 Python,这对我来说很好。
在深入探讨之前,我想提请您注意副标题:“面向开发人员”。这些是我的话,虽然我为该项目做出了贡献,但我并不代表它发言。但是,我想强调的是,该项目尚未达到可以大规模采用的状态。Mycroft 的 官方文档 通常非常好,但仍然存在一些粗糙的地方,这些地方一直在不断完善。因此,如果您愿意付出一些努力,或许提交一些错误报告,并放眼长远,那么这个项目绝对值得您花费时间。如果您正在寻找一个现成的、开箱即用的项目,您可能需要一年左右后再回来看看。
以下是一些参与 Mycroft 项目的主要理由。
隐私
正如我所提到的,语音助手无处不在,而且这种情况还在增加。虽然它们经常被遗忘,但它们正在倾听一切。Apple、Google 和 Amazon 都被发现监听其语音助手捕获的录音。在 某些情况下,这些录音甚至被用于法庭。
如果您在家办公(即使在 COVID-19 让世界天翻地覆之前)怎么办?当大多数人甚至没有意识到旨在让他们的生活更轻松的技术正在捕获他们的私人对话时,您如何保护您的用户和客户的隐私?
即使您不担心泄露您的对话,您是否可以接受公司收集这些数据用于定向广告?Mycroft 将隐私置于首位。它的默认语音转文本 (STT) 后端是 Google 的 STT 服务,但您可以从各种提供商中选择,包括 Google、IBM 的 Watson、Mozilla、Kaldi、Microsoft Azure 等。此外,Mycroft 代理通过其服务器为特定提供商(包括 Google)的所有 STT 请求。
安全
还记得我说过 Mycroft 是为开发人员准备的吗?由于您是自行托管 Mycroft,这意味着它的安全性取决于您的水平。您可以(并且应该)实施 VLAN、路由规则、防火墙规则以及与您的环境相关的任何其他安全措施。
即使您的安全性不是一流的,但由于您的足迹非常小而获得的混淆意味着,除非是随机事件或有针对性的攻击,否则您的 Mycroft 实例相对于外部世界来说是安全的。如果它在您的网络上,您可以控制谁以及什么可以访问您的语音助手。这是一件好事。
我提到 Python 了吗?
我喜欢 Python。这是我能够如此快速地参与其中的主要原因之一。我在日常工作中广泛使用 Python,既为了乐趣也为了盈利。我向我的妻子介绍了 Mycroft,她立即开始将任务添加到我的待办事项列表中,列出所有她希望她的语音助手能够做的事情。
当我努力研究我的待办事项时,我注意到 Mycroft 意图解析器之一(我将在我的下一篇文章中讨论)无法正确处理撇号。因此,以真正的开源方式,我 fork 了代码,对其进行了修复,并针对该项目创建了一个拉取请求 (PR)。经过一些小的来回沟通,我的 PR 符合了项目标准,瞧!Mycroft 现在可以更好地处理撇号了。这不是很酷吗?
不仅如此,包括 KDE Plasma on TV 在内的其他项目也集成了 Mycroft,以使其项目更具吸引力。我很想听到更多利用 Mycroft 的项目,所以如果您知道任何项目,请在 Twitter 上联系我或在下面留言。
科幻非小说
小时候,我一直喜欢科幻小说;事实上,我现在仍然喜欢。我希望能够像让-卢克·皮卡德一样说:“电脑,伯爵茶。热的”,然后事情就会神奇地发生。虽然食物复制器还很遥远,但有了 Mycroft 和一点点诀窍,我可以说“嘿,Mycroft,启动烧水壶”或“嘿,Mycroft,将面包添加到我的购物清单”,Mycroft 就会让它实现。
我加入 Mycroft 开发人员社区的时间不长,但我们是一小群紧密团结的人,我们希望生活在一个存在 Alexa、Siri 和 Google 等产品的开源竞争对手的世界中。请访问 Mattermost 与我们聊天。
7 条评论