为了账号安全,请及时绑定邮箱和手机立即绑定

spark分组排序提取前N个值

spark分组排序提取前N个值

饮歌长啸 2018-07-10 15:27:16

求教各位大神:
本人用scalas+spark开发,用RDD实现以下需求时遇到困难!
数据:
用户 位置 天数
user1 L1 28
user1 L2 20
user1 L3 15
user2 L1 30
user2 L2 15
user3 L5 3
user3 L6 18
user4 L7 4
通过spark RDD怎样实现按用户分组提取每个用户天数最大的位置

希望数据结果:
RDD:
array((user1,L1,28),(user2,L1,30),(user3 , L6,18),(user4,,7 4))
这里主体是根据用户分组计算最大天数,并把位置带出来,研究半天无果,求大神指教


查看完整描述

1 回答

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信