Python数据分析-基础技术篇_学习笔记

首页免费课 Python数据分析-基础技术篇笔记

Python数据分析-基础技术篇

最热最新

Q_Collector

#常用array操作
np.arange(1, 11) #产生一个1-11（不含11）的等差数列
np.arange(1, 11)reshape([2, 5]) # 变成两行五列五也可换为-1
np.exp(list) # list 的自然指数
np.exp2(list） # list 的自然指数的平方
np.【sqrt，sin，log，square,sum,max,min】(list)
# list 的正弦，自然对数，开方，平方,求和，最大值，最小值
#np.dot 点乘（也可直接进行加减乘除等操作）
np.copy(list1) #对数组进行拷贝
np.concateenata[vstack,hstack] #对数组进行追加 split 分开

查看全部

0 采集收起来源：numpy常用操作
2020-11-05
Q_Collector 04:38

常用数组
np.zeros([2, 4]) #输出元素都为0的2行4列数组
(np.ones([3, 5]) #输出元素都为1 的2行4列数组
随机数生成
np.random.rand(2, 4))#输出2行4列的随机数组范围(0,1)
np.random.rand() #生成一个随机数
np.random.randint(1, 14, 5) #在1到14之间生成5个随机整数
np.random.randn(2, 4) #输出2行4列标准正态分布随机数
np.random.choice([10,20, 41])#随机生成一个列表中的数
分布
np.random.beta(1,10, 100) #生成一个1-10共100个beta分布 (也可生成狄利克雷分布，二项式分布等等)

查看全部

0 采集收起来源：numpy常用Array
2020-11-03
Q_Collector 06:58

numpy
array 转换为 ndarray 类型
shape 几行几列
ndim 维度
dtype 数据类型 (可定义数据类型，默认float64)
itensize 每个元素所占字节
size 元素个数

查看全部

0 采集收起来源：ndarray
2020-11-03

戴安_ttwang

#encoding=utf-8
import numpy as np

def main():
    lst=[[1, 3, 5], [2, 4, 6]]#建立一个二维list
    print(type(lst))#打印lst的数据类型 结果：<type ‘list’>
    np_lst=np.array(lst)#array是numpy中的数据结构，目的是统一list类型中不同的数据类型，降低维护成本
    print(type(np_lst))#结果：<type 'numpy.ndarray'>
    np_lst=np.array(lst.dtype=np.float)#指定数据类型为float
    #数据类型有bool, int, int8/16/32/64/128, unit8/16/32/128, float16/32/64, complex64/128
    print(np_lst.shape)#打印array的形状
    print(np_lst.ndim)#打印array的维度
    print(np_lst.dtype)#打印array的数据类型 结果：float64
    print(np_lst.itemsize)#打印array中每个元素的大小（字节数） 结果： 8
    print(np_lst.size)#打印array的大小（元素数） 结果： 6
if __name__=="__main__":
    main()

查看全部

0 采集收起来源：ndarray

2020-07-13

慕粉1653322654

#encoding=utf-8
import numpy as np
import pandas as pd



def main():
        #Data structure
        s=pd.Series([i*2 for i in range(1,11)])
        print(type(s))
        dates=pd.date_range('20170301',periods=8)
        df=pd.DataFrame(np.random.randn(8,5),index=dates,columns=list('ABCDE'))
        print(df)
        # basic
        print(df.head(3))  # head()打印出前几行
        print(df.tail(3))  # tail()打印出后几行
        print(df.index)  # index()打印出索引
        print(df.values)  # values()打印出values
        print(df.T)  # T 转置
        print(df.sort_values("C"))  # 第C列的values按从小到大的顺序排序
        print(df.sort_index(axis=1, ascending=False))  # 将index进行降序排序
        print(df.describe())  # 打印出所有属性值 的数量 平均值 标准差 最小值 最大值等
        #select
        print(type(df["A"]))
        print(df[:3])
        print(df.loc[dates[0]])
        print(df.iloc[1:3])
        print(df[df.B>0][df.A<0])
if __name__ == '__main__':
              main()

查看全部

0 采集收起来源：pandas基本操作

2020-07-07

慕粉1653322654

#encoding=utf-8
import numpy as np
import pandas as pd



def main():
        #Data structure
        s=pd.Series([i*2 for i in range(1,11)])
        print(type(s))
        dates=pd.date_range('20170301',periods=8)
        df=pd.DataFrame(np.random.randn(8,5),index=dates,columns=list('ABCDE'))
        print(df)


if __name__ == '__main__':
        main()

查看全部

0 采集收起来源：pandas基础数据结构

2020-07-07

libigfat

多种库的总结
numpy
scipy matplotlib
scikit learn
pandas
keras
继续加油

查看全部

0 采集收起来源：课程总结
2020-06-27
libigfat

Dense全连接层
Activation激活层
SGD随机梯度下降算法
标签先独热码化

查看全部

0 采集收起来源：keras实现人工神经网络
2020-06-27
libigfat

人工神经网络ANN
反向传播
激活函数
多层神经元
映射到分类种类

查看全部

0 采集收起来源：人工神经网络简单介绍
2020-06-27
libigfat

keras简化了构建深度学习的步骤
高层库
底层库为tensorflow

查看全部

0 采集收起来源：认识Keras
2020-06-27
libigfat

iris花经典数据集
预处理，随机切割分为训练集和测试集
clf fit加载训练集到分类器中
predict来预测测试集，计算准确率，验证分类器的性能
使用准确率metrics accuracy_score
或混淆矩阵metrics confusion_matrix

查看全部

0 采集收起来源：scikit-learn实现决策树
2020-06-27
libigfat

机器学习
无监督不打标签聚类
监督打标签分类回归
决策树，通过不同的条件，来判断一个问题如果处理
条件的选取有不同的算法，一种是观察信息熵的变化，来决定
概率*log概率

查看全部

0 采集收起来源：机器学习与决策树
2020-06-27
libigfat

scikit-learn数据挖掘，机器学习的库

查看全部

0 采集收起来源：认识scikit-learn
2020-06-27
libigfat

date_range时间序列日期
periods个数，freq单位
文件操作 xlsx csv
read_csv
read_excel(文件名,表名)
to_csv保存
to_excel

查看全部

0 采集收起来源：pandas时间、绘图、文件操作
2020-06-27
libigfat

统计方法
mean var std
value_counts计算值出现的次数
group_by类似sql的分组聚合
pivot_table透视表，数据交叉分析中常用

查看全部

0 采集收起来源：pandas表统计与整合
2020-06-27

首页上一页 4 5 6 7 8 9 10 下一页尾页

0/150

提交

取消

开始学习

课程须知: 需要对python语法和基本数据结构有所了解，对数据分析感兴趣！

老师告诉你能学到什么？: 1、数据分析的一般步骤 2、numpy简介与基本使用 3、matplotlib简介与基本使用 4、scipy简介与基本使用 5、pandas简介与基本使用 6、机器学习的一般概念 7、scikit-learn的简介、使用示例与学习方法 8、keras的简介与一般用法

微信扫码，参与3人拼团

热搜

最近搜索清空

Python数据分析-基础技术篇