为了账号安全,请及时绑定邮箱和手机立即绑定

Spark—累加器

标签:
Spark

spark累加器

累加器是一种共享变量,提供了将工作节点中的值聚合到驱动器程序中的简单语法。累加器的一个常见用途是在调试时对作业执行过程中的事件进行计数。

累加器计数

webp

pic-1.png

注意:只有在运行行动操作(pic-1之中的saveAsTextFile)之后累加器中才会有计数值,因为行动操作之前的转化操作是惰性的。

另外一点:工作节点上的任务不能访问累加器的值。从这些任务的角度来看,累加器是一个只写变量。在这种模式下,累加器的实现可以更加高效,不需要对每次更新操作进行复杂的通信。

在python中运用累加器进行错误计数

webp

pic-2.png



作者:LuciferTM
链接:https://www.jianshu.com/p/a3c21eb1612a


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消