Chris Mattmann 是 ApacheCon 北美的常客,在软件设计和大型数据密集型系统的构建方面拥有丰富的经验。他的工作影响了广泛的社区,从帮助 NASA 解锁其下一代地球科学系统卫星的数据,到协助南加州大学(他的母校)的研究生研究软件架构,一直到作为 Apache 软件基金会 (ASF) 的成员帮助行业和开源。当他不忙的时候,他会花时间陪伴他可爱的妻子和儿子,勇敢地面对南加州的险恶街道。
在本次采访中,Mattmann 预览了他在奥斯汀 ApacheCon 上将要讨论的内容。
您不是 Apache 软件基金会的长期成员。是什么促使您参与开源和 ASF?
自 2005 年我参与 Apache Nutch 项目以来,我就一直参与 ASF。当时我是 USC 的博士生,正在上搜索引擎课程,同时也在 NASA JPL 工作。我在课堂上的期末项目是一个 RSS 解析插件 (NUTCH-30),它被集成进来了。这是一个新兴的、很棒的社区,在我的补丁之后,我变得越来越兴奋,并开始在邮件列表上提供帮助。我还看到了 Nutch 以及最终成为 Hadoop 的东西在 NASA 的巨大用途。
您在奥斯汀 ApacheCon 的演讲之一名为“如果您有内容,那么 Apache 就有技术!” 这是一个大胆的声明。在不透露太多内容的情况下,您计划在演讲中涵盖哪些内容?
我计划概述可用的 Apache 内容技术堆栈:Tika、UIMA、Lucene、Nutch、Solr、ODFToolkit、cTAKES 等。
从 10 英里高空俯瞰,未来内容管理领域将由闭源还是开源主导?
正如我在 2013 年的《自然》杂志论文中概述的那样,我的目标是创建和推广“数字巴别鱼”技术。我认为我们需要开放所有格式,更重要的是,我们需要创建“调解器”技术,这些技术将提取文本、元数据、语言信息,并提供自动可靠地处理这些信息的方法。
当 Apache 的宗旨是“社区重于代码”时,为什么这次演讲的重点是“Apache 拥有技术”?
去问问 Nick Burch,他在许多 ApacheCon 上都做过这个演讲。我认为这更多的是为了好玩,但也为了突出 Apache 中不同的内容技术“社区”。
“如果您有内容,那么 Apache 就有技术!” 是 ApacheCon 的传统演讲之一。听众可以期待一些激动人心的消息吗?
如果我能抽出时间,我很乐意尝试做一个演示。在我的之前的演示之一中,我现场运行了 rm -rf 命令。我只希望这次也能取得同样的成功。
ApacheCon 北美 2015 将于 4 月 13 日至 16 日在德克萨斯州奥斯汀举行。观看 Chris 在 4 月 13 日星期一和 4 月 14 日星期二的演讲。
演讲者访谈
本文是 ApacheCon 2015 演讲者访谈系列的一部分。ApacheCon 北美汇集了开源社区,共同了解推动开源未来发展的技术和项目。会议于 2015 年 4 月 13 日至 16 日在德克萨斯州奥斯汀举行.
评论已关闭。