来自 Opensource.com 的大数据入门

还没有人喜欢这篇文章。
Server room

Cory Doctorow。由 Opensource.com 修改。CC BY-SA 2.0。

大数据。 近年来它无疑是一个流行词,但它究竟是什么? 组织如何利用开源工具将原始数据转化为可执行的见解?

在 Opensource.com,我们的核心使命是让你了解开源正在发挥作用的趋势和技术。 为了帮助你,我们创建了一个新的资源页面,让你了解大数据以及各种类型的企业、政府和组织正在利用的一些开源工具,以便理解海量的比特和字节。

如果你一直在想什么是大数据,如何利用它,以及它如何通过为我们带来前所未有的信息来改变我们看待世界的方式,我们随时为你提供帮助。 除了帮助理解大数据之外,我们还会看看:

  • 开源如何使大数据发现成为可能?
  • 什么是 MapReduce 算法,它如何使分布式计算成为可能?
  • 什么是 Apache Hadoop,它如何成为许多数据科学家处理需求的主要工具?
  • 什么是 Apache Spark,这个新秀,它如何适应数据处理的全局?

我们希望你会查看一下。 如果你觉得我们的资源有用,请随意与你的朋友、家人和同事分享。 如果你有大数据问题,请告诉我们,以便我们继续改进和构建此资源。

User profile image.
Opensource.com 发布关于创建、采用和共享开源解决方案的故事。 在 Twitter 上关注我们 @opensourceway。

1 条评论

大数据肯定是一件大事。 在考虑大数据策略时,我认为值得一提的是 LexisNexis 的 HPCC Systems。 HPCC Systems 由数据科学家设计,是一个开源的数据密集型超级计算平台,用于处理和解决大数据分析问题,可以帮助公司从他们的数据中获得可执行的见解。

HPCC Systems 提供了经过验证的解决方案来处理现在所谓的大数据问题,并且已经这样做了十多年。 与其他替代方案相比,主要优势在于数据查询的实时交付和极其强大的 ECL 语言编程模型。 更多信息请访问 http://hpccsystems.com

Creative Commons License本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可。
© . All rights reserved.