Grant Ingersoll 是 Lucidworks 的 CTO,Fusion 的提供商,但他对开源社区的贡献在于他对 Apache Lucene、Solr 和 Mahout 的贡献。(他于 2008 年共同创立了 Apache Mahout,目标是构建一个用于快速创建可扩展机器学习应用程序的环境。)今年,Grant 将在 OSCON 2015 上发表演讲,内容是关于使用开源工具构建下一代 QA 系统以及关于如何使用 Apache Solr 进行数据科学。
如果您对沃森如何击败所有《危险边缘》的参赛者感兴趣,请阅读这篇关于问答 (QA) 技术的访谈以了解更多信息。
目前有哪些特别创新的问答技术应用示例?有没有哪些项目让您觉得“真希望我先想到这个”?
我们可能已经认为这是理所当然的了,而且这只过了短短几年,但是当像 Siri 和 Google Now 这样的产品出现,并且能够在您的手机上直接给出答案时,我感到非常震惊,因为它结合并优雅地(在很大程度上)实现了在问答系统中获得良好用户体验所需的许多事情。
我认为目前大部分精力都集中在如何使这些系统更准确、更能够回答更广泛的问题。
OSCON 吸引了各种各样使用开源技术的人。哪些类型的参会者会对他们从您的演讲中获得的收获感到最兴奋?
我的两个演讲(“您有问题了”和“Solr 数据科学”)都面向没有 QA 或 Apache Solr 经验的技术人员。开发人员可能会从会议中获得最大的收益,但这两个演讲都旨在展示和讨论技术背后的概念以及它们在技术栈中的位置。
您将要谈论构建下一代 QA 系统。问答技术的“下一步”是什么?
更大、更好、更快,在很大程度上是这样的。我们仍然处于这些系统可以回答的问题类型的早期阶段,但鉴于机器学习和人工智能近期的进展,这些系统可以处理的任务的复杂性正在迅速增长。正如我上面提到的,我认为大部分精力都集中在提高它们的质量并使其能够处理更广泛的问题。目前,这些系统大多专注于不太复杂的答案(至少相对于我们人类回答问题的方式而言),但也许有一天它们将能够回答更复杂的问题,例如我们在高中时都非常喜欢的“比较和对比”类型的问题。
在不透露您全部演讲内容的情况下,请告诉我们更多关于您计划演示的能够回答真正的自然语言问题的系统的信息。
这次演讲主要基于我的书《驯服文本》中的示例。该系统使用 Solr、OpenNLP 和我们为本书编写的几百行代码(可在 GitHub 上找到)构建而成。它专注于回答基于事实的问题,例如“谁是美国总统?”它的设计旨在展示概念,而无需关注性能等细节。
演讲者访谈
本文是 OSCON 2015 演讲者访谈系列的一部分。OSCON 是关于开源的一切——完整的技术栈,包括您每天工作中使用的所有语言、工具、框架和最佳实践。OSCON 2015 将于 7 月 20 日至 24 日在俄勒冈州波特兰举行。.
评论已关闭。