为了账号安全,请及时绑定邮箱和手机立即绑定

【九月打卡】第7天 - 性能效率

模块一:Python制作数据分析工具 - 4 性能效率 - Alex Cen模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.模块三:用timeit函数来查看效率,可以看到结果是0.28想要知道每一个板块所需时间,想要知道时间需先建立一个默认值default_timer() default_timeer减去这个start time得出所需时间,看到每一个需要时间后可以知道以后往哪个方向优化例如用的函数和步骤先后等模块四:

1273浏览
0推荐
0评论

【九月打卡】第6天 - 工具整合

模块一:Python制作数据分析工具 - 4 工具整合 - Alex Cen模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.模块三:工具整合,之前是小零部件,需要整合起来使用 写一个默认路参或者自定义导入所有需要用的函数如division,然后自定义一个频数的命名再运用到的自定义函数eda_analysis_v1()注意to_frame 即to dataframe然后在每一个小块的结果一样情况下可以拼起来 用concat()连接起来模块四:

1298浏览
0推荐
0评论

【九月打卡】第5天 - 频数

模块一:Python制作数据分析工具 - 3 数据诊断 频数 - Alex Cen模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.模块三:用value_counts来实现,取前五位频繁出现值多少,或者取前十得更多的值频数建立空子集, 运行fill nan函数,如果如果不满5个就出现少于5个的值,其它为nan转正数组,然后合并用concat合并数组模块四:

1168浏览
0推荐
0评论

【九月打卡】第4天 - 分位点

模块一:Python制作数据分析工具 - 3 数据诊断 分位点 - Alex Cen模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.模块三:用numpy里面的percentile函数,里面使用两个路参,一个是输入数据本身,另外一个是设置百分之xx分位点,然后就会返回百分之多少分位点的值定义一个空字典 Json_quantile={},打印这个字典,每一个key对应一个数得出数后,用一个dataframe包装起来...

1296浏览
0推荐
0评论

【九月打卡】第3天 - 最大最小值

模块一:Python制作数据分析工具 - 3 数据诊断 最大最小值 - Alex Cen模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.模块三:用np里面的min求最小值 max最大值 np.max[df.iloc[:,0]处理的时候先去除缺失值,在进行最大值最小值计算运算得最小值-999999,去除缺失值后为 0 进行运算后得0,5,0同理进行max缺失值前238,去除后238,所以缺失值最大不过238模块四:

1013浏览
0推荐
0评论

【九月打卡】第2天 - 众数

模块一:Python制作数据分析工具 - 3 数据诊断 众数 - Alex Cen模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.模块三:没有直接得出众数的函数,因此用stats.mode然后用lambda apply求得图一中第一行返回众数为哪些个 mode values, 第二行为众数出现的频次, 第三行是他们的比例在数列中的.例如例子中求得的众数分别为2,23,0, 对应出现的次数为7万次,2万次,和7万次.如果想要知道整个数组的形状,可以用想df.shape[0]得行数和[1]得列数模块四:

410浏览
0推荐
0评论

【九月打卡】第1天 - 均值和中位数

模块一:Python制作数据分析工具 - 3 数据诊断  均值和中位数 - Alex Cen模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.模块三:看第一个路参是否满足第二个路参(df.iloc[:,0],missSet),如果满足true,不满足false,即找到缺失值如何去除可以加入~符号选择 再把规则使用到3列中[:,0:3],apply lambda对比去除缺失值之前与之后的区别然后进行计算这是其中一个去除的方法模块四:

537浏览
0推荐
0评论

【九月打卡】第1天 - 数据诊断

模块一:Python制作数据分析工具 - 2 数据诊断 - Alex Cen模块二:数据诊断是数据挖掘和机器学习的第一步, 事实上确实也是很重要的基石,需要重新把基础学好.模块三:必要包 - numpy, pandas, scipy数据读取用Kaggle,下载网页https://www.kaggle.com/c/santander-customer-satisfaction数据诊断:最小最大均值中位数;计数类;方差,缺失值;分位点的频数计数类...

289浏览
0推荐
0评论

【九月打卡】第11天 - 课程总结 数组操作

模块一:numpy基础入门 - 9 课程总结 数组操作 - 夏正东模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:运算 +-*/ //整除 %取余 **次幂数组广播3条规则:1 先对比形状,再对比维度,最后对比对应轴的长度2 如果对应数组维度不同,则在维度较低的数组左侧补1,直到维度与高维数组相等3 当数组维度相同,如果数组长度相同,或是一个数组维度为1,兼容数组可广播random.rand(数组形状)返回随机数,>=0.0,<=1.0,...

253浏览
0推荐
0评论

【九月打卡】第10天 - 课程总结 二维数组

模块一:numpy基础入门 - 9 课程总结 二维数组 - 夏正东模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:array可以用作一维/二维数组创建Ones zeros 建立全是1,0的数组,full是指定数字的数组,而identity则对角线是1,其余0ndarray[0,1], ndarray[0],[1]按着轴来作为索引,同理二维数组一致布尔索引,花式索引都是深层复制当用hstack,...

244浏览
0推荐
0评论

【九月打卡】第9天 - 课程总结 一维数组

模块一:numpy基础入门 - 9 课程总结 一维数组 - 夏正东模块二:掌握numpy基础是为后期更好学习pandas, matplotlib,...

251浏览
0推荐
0评论

【九月打卡】第8天 - 读取函数

模块一:numpy基础入门 - 8-2  读取函数 - 夏正东模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:Load(),里面的参数使用默认模式即可,如mmap_mode用在读取较大可以读取 npy npz 结尾的文件例如例子里的arr=np.load('文件名‘)注意print的时候要区分里面不同的数组,如(arr['array_a1'])同理,压缩文件也用load()打开,对应数列print即可模块四:

261浏览
0推荐
0评论

【九月打卡】第7天 - 保存函数

模块一:numpy基础入门 - 8-1  保存函数 - 夏正东模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:pickle是一种数组类型,几乎所有数组类型都来数据化fix_imports通常使用默认值即可Savez - 多个数组保存若想压缩这些多个函数,用savez_compressed()用这两个函数的时候注意,array_a和array_b要区分好,不然保存后难以找到那个array模块四:

183浏览
0推荐
0评论

【九月打卡】第6天 - 聚合函数(2)

模块一:numpy基础入门 - 7-3  聚合函数(3) - 夏正东 模块二:掌握numpy基础是为后期更好学习pandas, matplotlib,...

216浏览
0推荐
0评论

【九月打卡】第5天 - 聚合函数(1)

模块一:numpy基础入门 - 7-3  聚合函数(1) - 夏正东 模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:聚合函数包含求和,最大值,最小值,平均数,加权平均数,分别用sum,amax,amin, mean,average函数来求得使用时可以用np. sum(a)数组来调用,也可以针对数组使用方法如np.ndarray.sum()另外这里使用方法而不是函数时,amax用max,...

96浏览
0推荐
0评论

【九月打卡】第4天 - 排序函数(2)

模块一:numpy基础入门 - 7-2  排序函数(2) - 夏正东 模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:先用randint()生成随机整数,randint(0,10,size=(3,4)) {三行四列的0-10之间的随机整数}按照axis=-1即默认的最后的一轴来做索引,在二维数组中即axis=1,这里的数列中即是2366重新排序里,2366不需变化,后面的按照从小到大来排序。上面数组是原数组,下面是重新排序。axis=0...

124浏览
0推荐
0评论

【九月打卡】第3天 - 排序函数(1)

模块一:numpy基础入门 - 7-2  排序函数(1) - 夏正东 模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:sort()是基础排序函数,按照轴排序, 包括的内容有数组,排序的轴index(最后的轴,例如一个二维函数(0,1)则最后轴为1),另外还有排序类型(默认quicksort)和字段argsort()对应的是排序轴的索引index例子先生成随机数组,调用的时候先用numpy as np,...

102浏览
0推荐
0评论

【九月打卡】第2天 - 随机函数

模块一:numpy基础入门 - 7- 2 随机函数 - 夏正东 模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:rand()可以生成随机浮点数,数会在 0<x<1,同理Randint()生成随机整数 其中d0, d1,决定了数组的形状例如 rand(10)生成10个数的一维数组若是rand(3,4)则是3行4列的二维数组模块四:

196浏览
0推荐
0评论

【九月打卡】第1天 - 数组的广播

模块一:numpy基础入门 - 6-4 数组的广播 - 夏正东模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:数组的广播原则有三个 - 看形状、维度和对应轴长度一维度直接加两个2,2,二维自动添加一个相同数组,如图2两个例子当两个形状不相同,如(1,2), (2,1) 时,则看维度因a2轴长度为1,兼容数组可以广播,长度为1的数组可扩展;但广播后,长度不同,如长度(2,2)与(2,3)则无法相加,a2+b2发生错误模块四:

113浏览
0推荐
0评论

【学习打卡】第8天 numpy基础入门 - 索引访问

模块一:numpy基础入门 - 4-创建2维数组模块二:掌握numpy基础是为后期更好学习pandas, matplotlib, seaborn的必要基础,因后期的都是基于数据的处理和展示,而numpy则对数据管理体系进行讲解和管理,因此需要踏实打好基础。模块三:一维度的可以看到ndarray[index],倒着数可以用复数显示离最后一点有多远二维数据相同,用的函数一样,不同用法,先标亮出来模块四:一维数据索引

1108浏览
0推荐
0评论
首页上一页12下一页尾页
意见反馈 帮助中心 APP下载
官方微信