为了账号安全,请及时绑定邮箱和手机立即绑定

Python数据分析-基础技术篇

难度初级
时长 2小时42分
学习人数
综合评分8.27
73人评价 查看评价
8.9 内容实用
7.9 简洁易懂
8.0 逻辑清晰
  • #常用array操作

    np.arange(1, 11)  #产生一个1-11(不含11)的等差数列

    np.arange(1, 11)reshape([2, 5]) # 变成两行五列 五也可换为-1

    np.exp(list) # list 的自然指数

    np.exp2(list) # list 的自然指数的平方

    np.【sqrt,sin,log,square,sum,max,min】(list) 

    # list 的正弦,自然对数,开方,平方,求和,最大值,最小值

    #np.dot  点乘  (也可直接进行加减乘除等操作 )

    np.copy(list1)  #对数组进行拷贝

    np.concateenata[vstack,hstack]  #对数组进行追加  split 分开

    查看全部
    0 采集 收起 来源:numpy常用操作

    采集自:Q_Collector 2021-02-09

  • 2:30
    查看全部
    0 采集 收起 来源:概述

    2021-02-08

  • numpy 数据结构基础

    scipy 强大的科学计算方法(矩阵分析,信号分析,数理分析。。)

    matplotlib 丰富的可视化套件(树状图,折线图,,三维图,)

    pandas 基础数据分析套件(交叉分析,实际分析,)

    scikit-learn 强大的数据分析建模库

    keras 人工神经网络

    Python环境搭建

    平台 Windows,Linux,Macos

    科学计算工具 anaconda

    查看全部
    0 采集 收起 来源:概述

    2021-02-01

  • # 常用图标:散点图 scatter
    fig = plt.figure()
    ax = fig.add_subplot(3, 3, 1) # 3行3列第1个子图,创建一个子图
    n = 128
    X = np.random.normal(0, 1, n)
    Y = np.random.normal(0, 1, n)
    T = np.arctan2(Y, X) # 用来上色,arctan的平方(Y/X)
    # plt.axes([0.05, 0.05, 0.9, 0.9]) # 指定显示范围
    ax.scatter(X, Y, s=25, c=T, alpha=.5) # s:size
    plt.xlim(-1.5*1.1, 1.5*1.1), plt.xticks() # xlim设置横轴的上下限, xticks设置横轴记号
    plt.ylim(-1.5*1.1, 1.5*1.1), plt.yticks()
    plt.axis()
    plt.title("scatter")
    plt.xlabel("x")
    plt.ylabel("y")
    
    # bar
    ax = fig.add_subplot(332) # 3行3列第2个
    n = 5
    X = np.arange(n)
    Y1 = (1 - X / float(n)) * np.random.uniform(0.5, 1.0, n)
    Y2 = (1 - X / float(n)) * np.random.uniform(0.5, 1.0, n)
    
    ax.bar(X, +Y1, facecolor='#9999ff', edgecolor='purple')
    ax.bar(X, -Y2, facecolor='#ff9999', edgecolor='green')
    
    for x, y in zip(X, Y1):
        plt.text(x + 0.4, y + 0.05, '%.2f' % y, ha='center', va='bottom')
    for x, y in zip(X, Y2):
        plt.text(x + 0.4, -y - 0.05, '%.2f' % y, ha='center', va='top')
    
    # Pie
    fig.add_subplot(333)
    n = 20
    Z = np.ones(n)
    Z[-1] *= 2 # 最后一个设为2
    # explode 每个扇形离中心的距离,labels 将颜色值显示出来
    plt.pie(Z, explode=Z * .05, colors=['%f' % (i / float(n)) for i in range(n)],
            labels=['%.2f' % (i / float(n)) for i in range(n)])
    # plt.gca().set_aspect('equal') # 正圆
    plt.xticks([]), plt.yticks([])
    
    # 极坐标图 polar
    fig.add_subplot(334, polar=True) # polar!= True为折线图
    n = 20
    theta = np.arange(0.0, 2 * np.pi, 2 * np.pi / n)
    radii = 10 * np.random.rand(n)
    plt.polar(theta, radii) # 两种方法都可以
    # plt.plot(theta, radii)
    
    # heatmap 热图
    fig.add_subplot(335)
    from matplotlib import cm
    data = np.random.rand(3, 3)
    cmap = cm.Blues # 蓝色系
    # interpolation 插值:用离它最近的值做插值,coloarmap, aspect 缩放,vmin 白色,vmax 这里为蓝色
    map = plt.imshow(data, interpolation='nearest', cmap=cmap, aspect='auto', vmin=0, vmax=1)
    
    # 3D
    from mpl_toolkits.mplot3d import Axes3D
    ax = fig.add_subplot(336, projection="3d")
    ax.scatter(1, 1, 3, s=100)
    
    # hot map 热力图
    fig.add_subplot(313)
    def f(x, y):
        return (1 - x / 2 + x **5 + y ** 3) * np.exp(-x ** 2 - y **2)
    n = 256
    x = np.linspace(-3, 3, n)
    y = np.linspace(-3, 3, n)
    X, Y = np.meshgrid(x, y)
    plt.contourf(X, Y, f(X, Y), 8, alpha=.75, cmap=plt.cm.hot) # cmap 指定热力图颜色
    
    plt.savefig("./data/fig.png", dpi=72) # 以分辨率 72 来保存图片
    plt.show()


    查看全部
  • python数据分析

    numpy

    scipy

    matplotlib

    pandas

    scikit learn

    keras

    查看全部
    0 采集 收起 来源:概述

    采集自:libigfat 2020-12-19

  • numpy-数据结构基础
    查看全部
    0 采集 收起 来源:概述

    2020-12-19

  • ###基本线图绘制
    import matplotlib.pyplot as plt
    x=np.linspace(-np.pi,np.pi,256,endpoint=True)
    c,s=np.cos(x),np.sin(x)
    plt.figure(1)
    plt.plot(x,c,color='blue',linewidth=1.0,linestyle='-',label='COS',alpha=0.5)
    plt.plot(x,s,'r*',label='SIN')
    plt.title=('COS&SIN')
    ax=plt.gca()
    ax.spines['right'].set_color('none')
    ax.spines['top'].set_color('none')
    ax.spines['left'].set_position(('data',0))#左边线的位置移到数据为0的地方
    ax.spines['bottom'].set_position(('data',0))#将下边线的位置移到数为0的地方
    plt.legend(loc='upper left')
    plt.grid()
    # plt.axis([-1,1,-0.5,1])#指定显示范围,前两个数指定横轴范围,后两个数指定纵轴显示范围
    plt.fill_between(x,np.abs(x)<0.5,c,c>0.5,color='green',alpha=0.25)#进行绿色填充
    t=1
    plt.plot([t,t],[0,np.cos(t)],'y',linewidth=3,linestyle='--')#加一条与y轴平行的虚竖线
    plt.annotate('cos(1)',xy=(t,np.cos(1)),xycoords='data',xytext=(+10,+30),
                 textcoords='offset points',arrowprops=dict(arrowstyle='-'))#给上面那条虚竖线加(相对位置)注释
    plt.show()
    查看全部
    0 采集 收起 来源:基本线图绘制

    采集自:ssssylvia_zhu 2020-11-05

  • matplotlibna

    官网:http://matplotlib.org/

    绘制图表,进行数据可视化

    pandas:基础数据分析套件

    scikit-learn:强大的数据分析建模库

    keras:人工神经网络


    查看全部
    0 采集 收起 来源:matplotlib概述

    2020-11-05

  • #numpy的其他操作  

    FFT   

    np.fft.fft(np.array([1,1,1,1,1,1,1,])  #阶跃响应  

    np.corrcoef([1, 0, 1],[0, 2, 1]) # 皮尔逊相关系数计算   

    np.poly1d([3,1,3]) # 生成一元多次函数


    查看全部
  • 矩阵操作

     from numpy.linalg import *

    1. 求逆矩阵  inv()

    2. 转置矩阵  transpose()

    3. 行列式   det()

    4. 特征值与特征向量   eig()第一个特征值 第二个特征向量

    5. 求解方程   solve(a,b)


    查看全部
  • #常用array操作

    np.arange(1, 11)  #产生一个1-11(不含11)的等差数列

    np.arange(1, 11)reshape([2, 5]) # 变成两行五列 五也可换为-1

    np.exp(list) # list 的自然指数

    np.exp2(list) # list 的自然指数的平方

    np.【sqrt,sin,log,square,sum,max,min】(list) 

    # list 的正弦,自然对数,开方,平方,求和,最大值,最小值

    #np.dot  点乘  (也可直接进行加减乘除等操作 )

    np.copy(list1)  #对数组进行拷贝

    np.concateenata[vstack,hstack]  #对数组进行追加  split 分开

    查看全部
    0 采集 收起 来源:numpy常用操作

    2020-11-05

  • #常用array操作 list =  (np.arange(1, 11)) #产生一个1-11(不含11)的等差数列 list =  (np.arange(1, 11)).reshape([2, 5]) # 变成两行五列数组 print (np.exp(list))  # list 的自然指数 print (np.exp2(list)) # list 的自然指数的平方 print (np.sqrt(list)) # list 的开方 print (np.square(list)) # list 的平方 print (np.sin(list)) # list 的正弦值    print (np.log(list)) # list 的对数值 print (np.vstack((list1,list2))) #将两个数组分成两行组成一个数组也就是以行连接,注意传的是个tuple print (np.hstack((list1,list2))) #将两个数组相连组成一个一维数组,传的是tup print (np.split(list1,n)) #将数组 list1 切分成n个子数组 print (np.copy(list1)) #对数组进行拷贝

    查看全部
  • 常用数组

    np.zeros([2, 4])   #输出元素都为0的2行4列数组  

    (np.ones([3, 5]) #输出元素都为1 的2行4列数组   

    随机数生成

    np.random.rand(2, 4))#输出2行4列的随机数组  范围(0,1)  

    np.random.rand() #生成一个随机数   

    np.random.randint(1, 14, 5) #在1到14之间生成5个随机整数  

    np.random.randn(2, 4) #输出2行4列标准正态分布随机数     

    np.random.choice([10,20, 41])#随机生成一个列表中的数    

    分布

    np.random.beta(1,10, 100) #生成一个1-10共100个beta分布 (也可生成狄利克雷分布,二项式分布等等)

    查看全部
    0 采集 收起 来源:numpy常用Array

    2020-11-03

  • numpy

    array 转换为 ndarray 类型

    shape  几行几列

    ndim 维度

    dtype  数据类型 (可定义数据类型,默认float64)

    itensize 每个元素所占字节

    size 元素个数


    查看全部
    0 采集 收起 来源:ndarray

    2020-11-03

  • # 常用图标:散点图 scatter
    fig = plt.figure()
    ax = fig.add_subplot(3, 3, 1) # 3行3列第1个子图,创建一个子图
    n = 128
    X = np.random.normal(0, 1, n)
    Y = np.random.normal(0, 1, n)
    T = np.arctan2(Y, X) # 用来上色,arctan的平方(Y/X)
    # plt.axes([0.05, 0.05, 0.9, 0.9]) # 指定显示范围
    ax.scatter(X, Y, s=25, c=T, alpha=.5) # s:size
    plt.xlim(-1.5*1.1, 1.5*1.1), plt.xticks() # xlim设置横轴的上下限, xticks设置横轴记号
    plt.ylim(-1.5*1.1, 1.5*1.1), plt.yticks()
    plt.axis()
    plt.title("scatter")
    plt.xlabel("x")
    plt.ylabel("y")
    
    # bar
    ax = fig.add_subplot(332) # 3行3列第2个
    n = 5
    X = np.arange(n)
    Y1 = (1 - X / float(n)) * np.random.uniform(0.5, 1.0, n)
    Y2 = (1 - X / float(n)) * np.random.uniform(0.5, 1.0, n)
    
    ax.bar(X, +Y1, facecolor='#9999ff', edgecolor='purple')
    ax.bar(X, -Y2, facecolor='#ff9999', edgecolor='green')
    
    for x, y in zip(X, Y1):
        plt.text(x + 0.4, y + 0.05, '%.2f' % y, ha='center', va='bottom')
    for x, y in zip(X, Y2):
        plt.text(x + 0.4, -y - 0.05, '%.2f' % y, ha='center', va='top')
    
    # Pie
    fig.add_subplot(333)
    n = 20
    Z = np.ones(n)
    Z[-1] *= 2 # 最后一个设为2
    # explode 每个扇形离中心的距离,labels 将颜色值显示出来
    plt.pie(Z, explode=Z * .05, colors=['%f' % (i / float(n)) for i in range(n)],
            labels=['%.2f' % (i / float(n)) for i in range(n)])
    # plt.gca().set_aspect('equal') # 正圆
    plt.xticks([]), plt.yticks([])
    
    # 极坐标图 polar
    fig.add_subplot(334, polar=True) # polar!= True为折线图
    n = 20
    theta = np.arange(0.0, 2 * np.pi, 2 * np.pi / n)
    radii = 10 * np.random.rand(n)
    plt.polar(theta, radii) # 两种方法都可以
    # plt.plot(theta, radii)
    
    # heatmap 热图
    fig.add_subplot(335)
    from matplotlib import cm
    data = np.random.rand(3, 3)
    cmap = cm.Blues # 蓝色系
    # interpolation 插值:用离它最近的值做插值,coloarmap, aspect 缩放,vmin 白色,vmax 这里为蓝色
    map = plt.imshow(data, interpolation='nearest', cmap=cmap, aspect='auto', vmin=0, vmax=1)
    
    # 3D
    from mpl_toolkits.mplot3d import Axes3D
    ax = fig.add_subplot(336, projection="3d")
    ax.scatter(1, 1, 3, s=100)
    
    # hot map 热力图
    fig.add_subplot(313)
    def f(x, y):
        return (1 - x / 2 + x **5 + y ** 3) * np.exp(-x ** 2 - y **2)
    n = 256
    x = np.linspace(-3, 3, n)
    y = np.linspace(-3, 3, n)
    X, Y = np.meshgrid(x, y)
    plt.contourf(X, Y, f(X, Y), 8, alpha=.75, cmap=plt.cm.hot) # cmap 指定热力图颜色
    
    plt.savefig("./data/fig.png", dpi=72) # 以分辨率 72 来保存图片
    plt.show()


    查看全部
  • #encoding=utf-8
    import numpy as np
    
    def main():
        lst=[[1, 3, 5], [2, 4, 6]]#建立一个二维list
        print(type(lst))#打印lst的数据类型 结果:<type ‘list’>
        np_lst=np.array(lst)#array是numpy中的数据结构,目的是统一list类型中不同的数据类型,降低维护成本
        print(type(np_lst))#结果:<type 'numpy.ndarray'>
        np_lst=np.array(lst.dtype=np.float)#指定数据类型为float
        #数据类型有bool, int, int8/16/32/64/128, unit8/16/32/128, float16/32/64, complex64/128
        print(np_lst.shape)#打印array的形状
        print(np_lst.ndim)#打印array的维度
        print(np_lst.dtype)#打印array的数据类型 结果:float64
        print(np_lst.itemsize)#打印array中每个元素的大小(字节数) 结果: 8
        print(np_lst.size)#打印array的大小(元素数) 结果: 6
    if __name__=="__main__":
        main()


    查看全部
    0 采集 收起 来源:ndarray

    2020-07-13


  • print(np.zeros([2,4]))#输出元素都为0的2行4列数组
    print(np.ones([3,5]))#输出元素都为1 的2行4列数组
    print("Rand:")#生成随机数
    print(np.random.rand(2, 4))#输出2行4列的随机数组
    print(np.random.rand())#生成一个随机数
    print(np.random.randint(1, 14, 5))#在1到14之间生成5个随机数
    print("RandInt:")#生成随机整数
    print(np.random.randint(1,10))#生成1个1到10之间的随机整数
    print(np.random.randint(1,10,3))#生成3个1到10之间的随机整数[a b c]
    print("Randn:")#生成正态分布的随机数
    print(np.random.randn())#生成一个标准正态分布的随机数
    print(np.random.randn(2, 4))#生成2行4列标准正态分布的随机数
    print("Choice:")#从给定数组中随机选取一个数
    print(np.random.choice([10, 20, 30]))#从给定数组中随机选取一个打印出来
    print("Distribute:")#生成数学上某种指定分布
    print(np.random.beta(1, 10, 100))#生成从1到10一共100个beta分布的数


    查看全部
    1 采集 收起 来源:numpy常用Array

    2020-07-13

  • #encoding=utf-8
    import numpy as np
    import pandas as pd
    
    
    
    def main():
            #Data structure
            s=pd.Series([i*2 for i in range(1,11)])
            print(type(s))
            dates=pd.date_range('20170301',periods=8)
            df=pd.DataFrame(np.random.randn(8,5),index=dates,columns=list('ABCDE'))
            print(df)
            # basic
            print(df.head(3))  # head()打印出前几行
            print(df.tail(3))  # tail()打印出后几行
            print(df.index)  # index()打印出索引
            print(df.values)  # values()打印出values
            print(df.T)  # T 转置
            print(df.sort_values("C"))  # 第C列的values按从小到大的顺序排序
            print(df.sort_index(axis=1, ascending=False))  # 将index进行降序排序
            print(df.describe())  # 打印出所有属性值 的数量 平均值 标准差 最小值 最大值等
            #select
            print(type(df["A"]))
            print(df[:3])
            print(df.loc[dates[0]])
            print(df.iloc[1:3])
            print(df[df.B>0][df.A<0])
    if __name__ == '__main__':
                  main()


    查看全部
    0 采集 收起 来源:pandas基本操作

    2020-07-07

  • #encoding=utf-8
    import numpy as np
    import pandas as pd
    
    
    
    def main():
            #Data structure
            s=pd.Series([i*2 for i in range(1,11)])
            print(type(s))
            dates=pd.date_range('20170301',periods=8)
            df=pd.DataFrame(np.random.randn(8,5),index=dates,columns=list('ABCDE'))
            print(df)
    
    
    if __name__ == '__main__':
            main()


    查看全部
  • 多种库的总结

    numpy

    scipy matplotlib

    scikit learn

    pandas

    keras

    继续加油

    查看全部
    0 采集 收起 来源:课程总结

    2020-06-27

  • Dense全连接层

    Activation激活层

    SGD随机梯度下降算法

    标签先独热码化

    查看全部
  • 人工神经网络ANN

    反向传播

    激活函数

    多层神经元

    映射到分类种类

    查看全部
  • keras简化了构建深度学习的步骤

    高层库

    底层库为tensorflow

    查看全部
    0 采集 收起 来源:认识Keras

    2020-06-27

首页上一页1234567下一页尾页

举报

0/150
提交
取消
课程须知
需要对python语法和基本数据结构有所了解,对数据分析感兴趣!
老师告诉你能学到什么?
1、数据分析的一般步骤 2、numpy简介与基本使用 3、matplotlib简介与基本使用 4、scipy简介与基本使用 5、pandas简介与基本使用 6、机器学习的一般概念 7、scikit-learn的简介、使用示例与学习方法 8、keras的简介与一般用法

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!