为了账号安全,请及时绑定邮箱和手机立即绑定
首页 手记 【九月打卡】第1天 - 数据诊断

【九月打卡】第1天 - 数据诊断

2022.09.18 21:36 206浏览

模块一:Python制作数据分析工具 - 2 数据诊断 - Alex Cen

模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.

模块三:必要包 - numpy, pandas, scipy

数据读取用Kaggle,下载网页https://www.kaggle.com/c/santander-customer-satisfaction


数据诊断:最小最大均值中位数;计数类;方差,缺失值;分位点的频数

计数类 先避免缺失值,然后计算所有的独有值,可以用iloc来找到数值

如果需要对多个数组进行操作,可以用pandas里面的lambda函数,返回true/false值,np.sum把true的函数加起来

实际操作时,iloc找合适的时候,可以返回head(3)先看看数列怎么样,再用lambda函数对所有的进行操作apply

模块四:

https://img2.sycdn.imooc.com/63271d150001deba03310162.jpghttps://img1.sycdn.imooc.com/63271d3100014a4503510237.jpg


点击查看更多内容
0人点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
手记
粉丝
0
获赞与收藏
2

关注TA,一起探索更多经验知识

同主题相似文章浏览排行榜

风间影月说签约讲师

50篇手记,涉及Java、MySQL、Redis、Spring等方向

进入讨论

Tony Bai 说签约讲师

145篇手记,涉及Go、C、Java、Python等方向

进入讨论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消