月落满江 2015-11-23 12:10 采纳率: 42.9%
浏览 4122
已采纳

关于spark RDD求平均的问题

hi,
假设我有一个spark RDD里面记录的是(时段,分数,次数)
我现在想求:每个时段的平均分数,即:同一个时段下,总分数 / 总次数
不知有什么好方法没有,因为我发现无论是action操作也好,转换成其他Rdd也好,
总没有满意方法,只能分成两个rdd然后关联处理

求大侠帮忙,谢谢

  • 写回答

1条回答 默认 最新

  • 云聪 2015-11-23 15:18
    关注

    先转化为pairrdd,以时段为键,分数次数为值,然后以键aggregate聚合,统计每个键下的值就行了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?