为了账号安全,请及时绑定邮箱和手机立即绑定

Python数据分析-基础技术篇

难度初级
时长 2小时42分
学习人数
综合评分8.40
77人评价 查看评价
9.0 内容实用
8.1 简洁易懂
8.1 逻辑清晰
  • #常用array操作

    np.arange(1, 11)  #产生一个1-11(不含11)的等差数列

    np.arange(1, 11)reshape([2, 5]) # 变成两行五列 五也可换为-1

    np.exp(list) # list 的自然指数

    np.exp2(list) # list 的自然指数的平方

    np.【sqrt,sin,log,square,sum,max,min】(list) 

    # list 的正弦,自然对数,开方,平方,求和,最大值,最小值

    #np.dot  点乘  (也可直接进行加减乘除等操作 )

    np.copy(list1)  #对数组进行拷贝

    np.concateenata[vstack,hstack]  #对数组进行追加  split 分开

    查看全部
    0 采集 收起 来源:numpy常用操作

    2020-11-05

  • 常用数组

    np.zeros([2, 4])   #输出元素都为0的2行4列数组  

    (np.ones([3, 5]) #输出元素都为1 的2行4列数组   

    随机数生成

    np.random.rand(2, 4))#输出2行4列的随机数组  范围(0,1)  

    np.random.rand() #生成一个随机数   

    np.random.randint(1, 14, 5) #在1到14之间生成5个随机整数  

    np.random.randn(2, 4) #输出2行4列标准正态分布随机数     

    np.random.choice([10,20, 41])#随机生成一个列表中的数    

    分布

    np.random.beta(1,10, 100) #生成一个1-10共100个beta分布 (也可生成狄利克雷分布,二项式分布等等)

    查看全部
    0 采集 收起 来源:numpy常用Array

    2020-11-03

  • numpy

    array 转换为 ndarray 类型

    shape  几行几列

    ndim 维度

    dtype  数据类型 (可定义数据类型,默认float64)

    itensize 每个元素所占字节

    size 元素个数


    查看全部
    0 采集 收起 来源:ndarray

    2020-11-03

  • #encoding=utf-8
    import numpy as np
    
    def main():
        lst=[[1, 3, 5], [2, 4, 6]]#建立一个二维list
        print(type(lst))#打印lst的数据类型 结果:<type ‘list’>
        np_lst=np.array(lst)#array是numpy中的数据结构,目的是统一list类型中不同的数据类型,降低维护成本
        print(type(np_lst))#结果:<type 'numpy.ndarray'>
        np_lst=np.array(lst.dtype=np.float)#指定数据类型为float
        #数据类型有bool, int, int8/16/32/64/128, unit8/16/32/128, float16/32/64, complex64/128
        print(np_lst.shape)#打印array的形状
        print(np_lst.ndim)#打印array的维度
        print(np_lst.dtype)#打印array的数据类型 结果:float64
        print(np_lst.itemsize)#打印array中每个元素的大小(字节数) 结果: 8
        print(np_lst.size)#打印array的大小(元素数) 结果: 6
    if __name__=="__main__":
        main()


    查看全部
    0 采集 收起 来源:ndarray

    2020-07-13

  • #encoding=utf-8
    import numpy as np
    import pandas as pd
    
    
    
    def main():
            #Data structure
            s=pd.Series([i*2 for i in range(1,11)])
            print(type(s))
            dates=pd.date_range('20170301',periods=8)
            df=pd.DataFrame(np.random.randn(8,5),index=dates,columns=list('ABCDE'))
            print(df)
            # basic
            print(df.head(3))  # head()打印出前几行
            print(df.tail(3))  # tail()打印出后几行
            print(df.index)  # index()打印出索引
            print(df.values)  # values()打印出values
            print(df.T)  # T 转置
            print(df.sort_values("C"))  # 第C列的values按从小到大的顺序排序
            print(df.sort_index(axis=1, ascending=False))  # 将index进行降序排序
            print(df.describe())  # 打印出所有属性值 的数量 平均值 标准差 最小值 最大值等
            #select
            print(type(df["A"]))
            print(df[:3])
            print(df.loc[dates[0]])
            print(df.iloc[1:3])
            print(df[df.B>0][df.A<0])
    if __name__ == '__main__':
                  main()


    查看全部
    0 采集 收起 来源:pandas基本操作

    2020-07-07

  • #encoding=utf-8
    import numpy as np
    import pandas as pd
    
    
    
    def main():
            #Data structure
            s=pd.Series([i*2 for i in range(1,11)])
            print(type(s))
            dates=pd.date_range('20170301',periods=8)
            df=pd.DataFrame(np.random.randn(8,5),index=dates,columns=list('ABCDE'))
            print(df)
    
    
    if __name__ == '__main__':
            main()


    查看全部
  • 多种库的总结

    numpy

    scipy matplotlib

    scikit learn

    pandas

    keras

    继续加油

    查看全部
    0 采集 收起 来源:课程总结

    2020-06-27

  • Dense全连接层

    Activation激活层

    SGD随机梯度下降算法

    标签先独热码化

    查看全部
  • 人工神经网络ANN

    反向传播

    激活函数

    多层神经元

    映射到分类种类

    查看全部
  • keras简化了构建深度学习的步骤

    高层库

    底层库为tensorflow

    查看全部
    0 采集 收起 来源:认识Keras

    2020-06-27

  • iris花经典数据集

    预处理,随机切割分为训练集和测试集

    clf fit加载训练集到分类器中

    predict来预测测试集,计算准确率,验证分类器的性能

    使用准确率metrics accuracy_score

    或混淆矩阵metrics confusion_matrix



    查看全部
  • 机器学习

    无监督 不打标签 聚类

    监督 打标签 分类 回归

    决策树,通过不同的条件,来判断一个问题如果处理

    条件的选取有不同的算法,一种是观察信息熵的变化,来决定

    概率*log概率

    查看全部
  • scikit-learn数据挖掘,机器学习的库

    查看全部
    0 采集 收起 来源:认识scikit-learn

    2020-06-27

  • date_range时间序列 日期

    periods个数,freq单位

    文件操作 xlsx csv

    read_csv

    read_excel(文件名,表名)

    to_csv保存

    to_excel


    查看全部
  • 统计方法

    mean var std

    value_counts计算值出现的次数

    group_by类似sql的分组聚合

    pivot_table透视表,数据交叉分析中常用


    查看全部

举报

0/150
提交
取消
课程须知
需要对python语法和基本数据结构有所了解,对数据分析感兴趣!
老师告诉你能学到什么?
1、数据分析的一般步骤 2、numpy简介与基本使用 3、matplotlib简介与基本使用 4、scipy简介与基本使用 5、pandas简介与基本使用 6、机器学习的一般概念 7、scikit-learn的简介、使用示例与学习方法 8、keras的简介与一般用法

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!