为了账号安全,请及时绑定邮箱和手机立即绑定

打印 pyspark 数据框列中的所有类别

打印 pyspark 数据框列中的所有类别

芜湖不芜 2021-08-17 16:39:19
我有一个大型数据框,其中一列名为location,只有少数城市,例如:["New York", "London", "Paris", "Berlin"...].我想在该列上打印所有不同的值,以便我知道例如某个城市的值是否丢失。我该怎么做,因为该.describe('location')方法没有帮助?
查看完整描述

3 回答

?
弑天下

TA贡献1818条经验 获得超7个赞

describe方法用于基本的预定义统计数据,如计数、平均值、标准、最小值、最大值等。但是,为了找到任何列的不同值,您可以使用distinct()方法。

希望这可以帮助。


查看完整回答
反对 回复 2021-08-17
  • 3 回答
  • 0 关注
  • 150 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信