为了账号安全,请及时绑定邮箱和手机立即绑定

Spark Sql 对 null 值多组测试用例分析

标签:
Spark

有很多种情况,spark sql语句中的某些字段是空的,想要知道sql中聚合函数对null的影响结果,下面做了几个测试用例。

webp

image.png

测试用例

准备三个case class

case class ChildLog(id:String,name:String)case class WifeLog(id:String,name:String,child:ChildLog)case class UserLog(id:String,name:String,wife:WifeLog)

准备三组数据

val list1 = Array(UserLog("1", "lake", null), UserLog("2", "admin", null))
val list2 = Array(UserLog("1", "lake", WifeLog(null,null,null)), UserLog("2", "admin", WifeLog("3", "coco",null)))
val list3 = Array(UserLog("1", "lake", WifeLog(null,null,ChildLog("hi","na"))), UserLog("2", "admin", WifeLog("3", "coco",null)))

初始化环境

val sparkConf = new SparkConf()
      .setMaster("local[1]")
      .setAppName("testNull")

    val spark = SparkSession
      .builder
      .config(sparkConf)
      .getOrCreate()

    val sc = spark.sparkContext

第一组

  1. 测试count对null值的结果

val list1 = Array(UserLog("1", "lake", null), UserLog("2", "admin", WifeLog("3", "coco",null)))
val listRdd = sc.parallelize(list3)

listRdd.toDS().createTempView("log")

spark.sql("select count(wife) from log").show

结果(对空值会忽略)

+-----------+|count(wife)|+-----------+|          1|+-----------+

结论(如下两个语句相等)

spark.sql("select count(wife) from log").showspark.sql("select count(wife) from log where wife IS NOT NULL").show
  1. 如何统计null

spark.sql("select count(wife IS NULL) from log where").show

结果

+---------------------+|count((wife IS NULL))|+---------------------+|                    1|+---------------------+

第二组

  1. 测试子类case

spark.sql("select count(wife.id) from log").show

结果

+----------------------+|count(wife.id AS `id`)|+----------------------+|                     1|+----------------------+

结论(对子类case的空值也会忽略,对空的子类也会忽略)

第三组

测试多级子case的影响

spark.sql("select count(wife.child.id) from log").show

结果

+----------------------------+|count(wife.child.id AS `id`)|+----------------------------+|                           1|+----------------------------+

结论(不论子级多深,只统计非空值的数据)



作者:dounine
链接:https://www.jianshu.com/p/38e85cbf0498


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号

举报

0/150
提交
取消