Leslie Hawthorn 是开源领域一位知名人物,您很可能听说过或参加过她的演讲。 仅举几例:
- 秘密守护者,在 FOSDEM 2013
- DevOps:为了更快乐、更高效的人们,在 Infrastructure Next 2014
- 为什么检查你的特权对你有好处,在 SCALE 12x 和 OSCON 2014
在今年 10 月即将举行的 All Things Open 会议上发表演讲之前,我向她询问了一些关于她对开源和社区管理的热情的问题。 在这次采访中,Leslie 讨论了大数据、Elasticsearch 等。
您能否谈谈您自己、您的背景,以及您是如何接触开源的?
我是 Elasticsearch Inc. 的开发者关系总监,该公司是开源 ELK 堆栈的幕后推手。 在过去的十年里,我一直积极投身于开源世界,包括创建 Google Code In 竞赛,管理其姊妹项目 Google Summer of Code 多年,并领导红帽的社区工程团队。 我甚至在俄勒冈州立大学真正杰出的开源实验室做过一段时间的学术研究。 在此期间,我还为许多开源项目和基金会做过志愿者,包括在开源倡议组织和 Sahana 软件基金会的董事会任职。
大约 15 年前,一位朋友向我介绍了开源,当时我问他屏幕保护程序上弹跳的那个脚状的东西是什么。 然后他解释了什么是 GNOME 以及什么是开源软件。 我立刻被迷住了; 这种理念和方法对我来说非常有意义。 花了一段时间才让它成为我职业生涯的重点,但这真是一条非常有意义的道路。
你的秘诀是什么? 您如何找到时间和精力来担任 Elasticsearch 的社区经理,环游全球参加开源活动并发表讲话,并在多个董事会任职?
这一切都源于爱!
不过说真的,我选择了我充满热情的项目和我热衷于合作的团队,然后我就抽出时间让事情发生。 值得注意的是,我的雇主重视我对社区的贡献,这意味着我可以轻松地在我的各种职责之间流畅地切换。 由于一切都在开源世界中,因此没有上下文切换。
我想我在这里最想说的是我从一位老朋友那里得到的明智建议:“如果你想完成某件事,就去找一个忙碌的人。” 我就是一个忙碌的人。
您从事开源社区管理已经将近十年了。 担任社区经理是什么感觉?“办公室”里的一天是什么样的?
这是一个棘手的问题。 我如此热爱这个角色的原因之一是每天的生活都如此多变。 在办公室里的日子通常是内容生成和执行社区外展计划的混合,期间穿插着通常的电话、会议和空中交通管制。 (我们是一个全球分布的组织,我喜欢帮助我们的团队了解正在发生的事情,以便我们最有效地协作。)
在路上的日子是发表演讲、与各种开源项目举行会议以及帮助在现实生活中培养 Elasticsearch 社区的混合。 有时是拜访用户组,或是为社区贡献送上衷心的感谢和拥抱。 也提供握手,无论您喜欢哪种方式。
正如您为 All Things Open 的演讲摘录中所说,您为什么认为开源技术对于大数据挑战至关重要?
我尽量长话短说,因为这个问题的答案可以填满好几次演讲。 简而言之,Amazon、Google 或 Facebook 等非常大型的数据驱动型公司,它们的成功建立在极其强大的分析引擎之上,使它们能够最好地了解用户的行为,并利用这些信息来改进他们的产品和业务流程。
随着开源大数据工具的普及,大数据的力量得到了普及; 任何组织都可以使用开源工具来深入了解其业务的各个方面,从用户在其网站上的每次点击到机器利用率指标。
我们现在正迎来激动人心的时刻,我们正在超越对这些大型组织最有用的大数据工具——我们不要忘记 Apache Hadoop 的创建是为了满足 Yahoo 的需求——转向可以满足小型初创公司需求的工具,但仍然可以有效扩展,并在该初创公司成长为大型企业时有效地发挥作用。
Elasticsearch ELK 堆栈如何应对当今大数据和分析领域的挑战?
我们显然为我们是一家开源公司而感到非常自豪。 我们为开发人员提供了多种 Elasticsearch 语言客户端选择,因此他们可以轻松地使用他们选择的语言与我们的搜索和分析引擎对话。 我们还拥有一个开放的 RESTful API,可以轻松地在我们的堆栈之上构建应用程序。 我们的堆栈可以处理结构化和非结构化数据,因此您可以从日志文件到推文再到普通的 CSV 文件中获得近乎实时的洞察力。 最棒的是,您可以轻松地将来自所有这些不同来源的数据摄取到 Logstash 中,然后使用 Elasticsearch 搜索和分析所有这些类型的数据,并使用 Kibana 可视化结果。 我们的堆栈通过 Kibana 的仪表板向您组织中的任何人提供这些见解,这些仪表板是可共享的,并且不需要编程方面的专业知识即可有效使用。
这些功能——以及更多功能——使 ELK 堆栈非常灵活,足以应对各种垂直领域的大数据挑战。 我们的一位客户是一家大型金融公司,他们使用 ELK 堆栈进行异常检测并找出信用卡欺诈行为。 我们的另一位客户使用 ELK 对社交媒体数据进行分析和情感分析。 还有一位客户使用 ELK 来检测其网络上的黑客攻击,还有一位客户使用 ELK 在包含数十亿条条目的电子商务网站上进行全文搜索。 可能性真的是无限的。
您已经看到了开源的发展,包括社区、采用率以及在企业中的普及。 您认为未来 5 年或 10 年开源会发展到什么程度?
“软件正在吞噬世界,而开源正在吞噬软件。”
现在参与项目社区的企业将深化对其竞争优势的投资。 越来越多的企业将开始向他们消费的开源项目贡献软件补丁、财政资源和人力。 不过,当甚至迪士尼都有一个 GitHub 页面时,我感觉这并不是什么新闻。
我认为,未来十年开源更有趣的影响将与源代码无关,而是与它对人类流程的影响有关。 随着越来越多的组织使用开源软件并与开源社区互动,我认为我们将看到更多企业内部默认开源,打破部门之间的壁垒,并鼓励更多的交叉合作。
您能否让我们的读者先睹为快您在 All Things Open 上的演讲? 也许您会为开源社区经理分享一些建议?
尽早且经常地庆祝和衡量您的成功。 衡量社区事务的 ROI 可能是一个困难的过程,但我将展示我们在 Elasticsearch 收集的一些数据,以衡量我们社区的健康状况以及我们的社区努力对我们业务的影响。
2 条评论