为了账号安全,请及时绑定邮箱和手机立即绑定

【九月打卡】第1天 - 数据诊断

标签:
Python

模块一:Python制作数据分析工具 - 2 数据诊断 - Alex Cen

模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.

模块三:必要包 - numpy, pandas, scipy

数据读取用Kaggle,下载网页https://www.kaggle.com/c/santander-customer-satisfaction


数据诊断:最小最大均值中位数;计数类;方差,缺失值;分位点的频数

计数类 先避免缺失值,然后计算所有的独有值,可以用iloc来找到数值

如果需要对多个数组进行操作,可以用pandas里面的lambda函数,返回true/false值,np.sum把true的函数加起来

实际操作时,iloc找合适的时候,可以返回head(3)先看看数列怎么样,再用lambda函数对所有的进行操作apply

模块四:

https://img2.sycdn.imooc.com/63271d150001deba03310162.jpghttps://img1.sycdn.imooc.com/63271d3100014a4503510237.jpg


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消