Pandas 层次化索引_Pandas 入门教程-慕课网

松思园 · 更新于 2021-03-12

Pandas 字符串操作

Pandas 数据重塑

1. 前言

上一节我们学习了字符串的一些操作函数，对于字符串数据的分析有一定的帮助，有利于我们在数据值上的处理和分析。在这之前我们接触到的数据集的索引都是单个层次，行索引或者列索引，除此之外，Pandas 库中的数据集还存在层次化的索引，极大的提升了数据集所能表现的数据维度，下面将详细学习 Pandas 库中的层次化索引知识。

2. 什么是层次化索引

层次化索引是 Pandas 的一个重要功能，是指在一个轴上有至少两个级别的索引值，层次化索引的好处是我们可以方便的使用低纬度索引形式去表示高纬度的数据，下面我们看一下层次化索引的具体数据表现：

# 1. 构造了一个 Series 数据集
obj=pd.Series([12,23,34,45],index=[["a","a","b","b"],[1,2,3,4]])
print(obj)
# --- 输出结果 ---
a  1    12
   2    23
b  3    34
   4    45
# 结果解析：可以看到这里和我们第5小节讲到的 Series 有点不一样的地方，在他的索引列前面还有一列，值为 'a'，'b' 这也是索引，有两层索引，因此之前的二维数据结构 Series 通过层次化的索引，就可以表示3维的数据集。

# 2. 构造了一个 DataFrame 数据集
df1=pd.DataFrame([[96,92,83,94],[85,86,77,88],[69,90,91,82],[83,84,85,86],[83,84,85,86],[83,84,85,86]],index=[['2018年','2018年','2018年','2019年','2019年','2019年'],['语文','数学','英语','语文','数学','英语']],columns=[['上学期','上学期','下学期','下学期'],['期中考试','期末考试','期中考试','期末考试']])
print(df1)
# --- 输出结果 ---
            上学期          下学期     
          	期中考试 期末考试 期中考试 期末考试
2018年  语文   96   	92    83     94
      	数学   85   	86     77     88
      	英语   69   	90     91     82
2019年  语文   83      84    85     86
      	数学   83  	 84    85     86
      	英语   83  	 84    85     86
# 结果解析：这里我们构造了一个 DataFrame 数据集，在行索引和列索引我们均设置了层次化的索引，这样能更加有效的表示高纬度的数据。

3. 层次化索引数据的选取

对于 Pandas 库数据集具有多层索引值，我们可以对一级索引通过 loc () 函数获取数据子集：

# df1 原数据集，是上面我们自己创建的具有两层列索引和两层行索引的数据集
print(df1.loc['2018年','上学期'])
# --- 输出结果 ---
    期中考试 期末考试
语文	 96	    92
数学	 85	    86
英语	 69	    90
# 结果解析：我们通过 loc() 函数传入行和列的一级索引，可以看到得到了一个 DataFrame 数据子集

print(df1.loc[:,'上学期'])
# --- 输出结果 ---
             期中考试	期末考试
2018年	语文	  96	 92
         数学	   85	 86
         英语	   69	 90
2019年	语文	  83	84
         数学	  83	 84
         英语	  83	 84
# 结果解析：这里我们获取了列索引中的上学期的子集，可以看到输出结果中行索引还是两级索引

4. 小结

本节课程我们主要学习了 Pandas 库中的层次化索引，利用数据集的层次化索引，我们可以表示更高维度的数据集，用于处理更复杂的数据。本节课程的重点如下：

了解 Pandas 层次化索引在数据集中的具体表现形式；
掌握 Pandas 层次化索引中数据子集的获取方式。

Pandas 字符串操作

Pandas 数据重塑

我要提出意见反馈

热搜

最近搜索 清空

我的购物车

已加入门课程

购物车里空空如也

Pandas 入门教程

前端开发

JavaScript

JavaScript 入门教程

TypeScript 入门教程

Vue 入门教程

Ajax 入门教程

ES6-10 入门教程

Yarn 入门教程

ECharts 入门教程

HTML & CSS

CSS3 入门教程

雪碧图入门教程

移动端布局教程

Html5 入门教程

Sass 入门教程

HTML 入门教程

canvas 入门教程

uni-app 入门教程

服务端相关

服务器

Nginx 入门教程

HTTP 入门教程

Docker 入门教程

Shell 入门教程

Linux 入门教程

开发工具

Gradle 入门教程

Vim 编辑器教程

RESTful 规范教程

Dreamweaver 教程

Markdown 入门教程

Maven 入门教程

Eclipse 编辑器教程

GitHub 入门教程

Android Studio 编辑器教程

PyCharm 编辑器教程

Sublime Text 使用教程

Postman 教程

Git入门教程

热门服务端语言

C 语言入门教程

Go 入门教程

Kotlin 教程

Ruby 入门教程

ThinkPHP 入门教程

Java

基础应用

Java 入门教程

Android 入门教程

算法入门教程

数据结构入门教程

Lambda 表达式教程

Java 并发原理入门教程

设计模式入门教程

Java并发工具

JVM 入门教程

RabbitMQ 入门教程

网络编程入门教程

后端通用面试教程

框架应用

Spring Boot 入门教程

Spring 入门教程

Hibernate 入门教程

MyBatis 入门教程

Spring MVC 入门教程

Swagger 入门教程

Zookeeper 入门教程

Netty 教程

Spring Security

微服务

Spring Cloud Hystrix

Python

基础应用

Python 入门语法教程

最近搜索清空