Cloudera 首席架构师谈 Hadoop 的发展

还没有读者喜欢这个。
People working together to build

Opensource.com

Doug Cutting,Cloudera 首席架构师Doug Cutting 是众多成功的开源项目的创始人,包括 Lucene 和 Hadoop,目前是 Cloudera 的首席架构师,并在 Apache 软件基金会董事会任职。

在这次采访中,他告诉我,从事开源工作更多的是常识而非信条,并深入探讨了企业中开源的采用情况。在他于 All Things Open 大会上发表主题演讲之前,我询问了他关于 Lucene 开源、他在 Apache 软件基金会董事会中的角色,以及开源之道对他意味着什么。

当你在 2000 年在 SourceForge 上以 GPL 许可证发布 Lucene 时,开源 Lucene 是什么样的体验?

这和今天的情况没有太大区别。长期以来,学术界和研究界的人们一直在共享软件,因此下载免费东西的概念并不新鲜,开源许可证也是如此。(我第一次接触 GPL 是在 1985 年,当时我为 GNU Emacs 贡献了一些代码。)工具是不同的。我们使用并发版本系统 (CVS),因为当时甚至 subversion 都还不可用。我们没有使用 bugtracker,只使用了邮件列表,但基本流程非常相似。人们通过沟通来协调他们在共享项目上的工作。

自从你创立的第一个项目 Lucene 以来,你一直遵循开源之道原则。你今天还在应用它们吗?为什么?

对我来说,这更多的是常识,而不是遵循任何特定的信条。我想帮助创建人们使用的、有用的软件。我喜欢与其他人一起做这件事。其余的自然而然地就来了。必须尊重合作者,否则他们就不想合作。同样,透明度和精英管理是建立健康、长期的协作社区所必需的。  在这个层面上,它与非软件项目没有太大区别。如果你在聚会后打扫卫生,那么有些人需要清理桌子,有些人洗碗,有些人收拾椅子等等。没有人是老板,每个人都在他们力所能及的地方贡献力量,以实现团队的目标,既要打扫干净房子,又要保持朋友关系。


查看完整的 All Things Open 演讲者访谈系列

你是 Apache 软件基金会董事会成员。你能否谈谈你的角色?

大部分情况下,Apache 董事会监控基金会中的所有项目,以确保每个项目都有一个健康的社区。我们需要确保项目不受一个人或公司的控制,每个人都以尊重的态度行事等等。150 多个 Apache 项目中的每个项目都会向董事会提交季度报告,因此我们在每次月度会议上审查大约 50 个项目。大多数项目运行顺利。  偶尔,我们必须推动项目朝着正确的方向发展。董事会还处理典型的行政事务,例如确保有人维护网站运行、收取捐款、报税等。

随着企业中开源的采用率越来越高,你认为未来 3 到 5 年开源和 Hadoop 的发展前景如何?

我倾向于开源,因为它适合我作为一名开发人员。它可以让很多人使用我开发的软件,这对我个人来说很有成就感。但它对软件用户也很有吸引力,因为他们可以减少对其他企业的依赖(“锁定”)。越来越多的开发人员正在创建开源替代方案来替代专有技术。如果有选择,用户更喜欢开源实现,因为它没有锁定。Hadoop 生态系统已经迈出了下一步,开源实现首先出现。很少有人有动力创建专有替代方案,因为人们可能更喜欢开源版本。我预计这种模式将持续多年。即使核心不断增长和变化,Hadoop 生态系统的核心组件仍将保持开源。一些专有工具在堆栈顶部幸存下来,但很少有在底部幸存下来。

你如何看待 TODO 小组的成立?

我和他们简短地交谈过,我认为这只是一个邮件列表,供运行企业开源项目的人们讨论最佳实践。他们似乎没有比这更多的议程。  许多公司发布了一些开源内容,并有共同的技术和法律问题。他们希望在方法上进行协作,或者至少是交流一下。


有关 Hadoop 的更多信息,请参阅我们的 Hadoop 简介

查看完整的 2014 年 All Things Open 演讲者访谈系列。

Avatar
前 Opensource.com 和 Open Organization 版主/大使。

评论已关闭。

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.