Apache Spark

Apache Spark 是一个开源集群计算框架，常用于大数据处理。

Spark 在 ApacheCon 上闪耀

ApacheCon 即将到来，在这个大型会议中将有一颗闪亮的宝石：一个专门讨论 Spark 的论坛。Reynold Xin 正在组织它，他分享了一些...

当我们首次开源 Spark 时，我们的目标是为通用编程语言（Java、Python、Scala）中的分布式数据处理提供一个简单的 API。Spark...

2014 年 10 月，Databricks 参加了排序基准测试，并创下了排序 100 太字节 (TB) 数据（或 1 万亿 100 字节记录）的新的世界纪录。该团队使用了...