
spark1-3-0
mach_learn
这个作者很懒,什么都没留下…
展开
-
Spark GraphX
GraphX是spark的一个新组件用于图和并行图计算。在一个高水平,GraphX通过引进一个新的图抽象扩展了spark RDD:带有顶点和边属性的有向多重图。为了支持图计算,GraphX 提供了很多基本的操作(像 subgraph, joinVertices, and aggregateMessages)和pregel的一个优化变种。除此之外,GraphX 包含了一个正在增长的图算法和图构造的集合来简化图的分析任务翻译 2015-06-15 10:51:17 · 4940 阅读 · 1 评论 -
spark streaming
Spark streaming是Spark核心API的一个扩展,它对实时流式数据的处理具有可扩展性、高吞吐量、可容错性等特点。我们可以从kafka、flume、Twitter、 ZeroMQ、Kinesis等源获取数据,也可以通过由 高阶函数map、reduce、join、window等组成的复杂算法计算出数据。最后,处理后的数据可以推送到文件系统、数据库、实时仪表盘中。事实上,你可以将处理后的数据应用到Spark的翻译 2015-06-12 19:01:59 · 3439 阅读 · 0 评论 -
spark 基础和spark sql翻译
Spark1.3.0 基础文档和spark1.3.0 sql 部分翻译翻译 2015-06-08 15:17:05 · 2062 阅读 · 0 评论