为了账号安全,请及时绑定邮箱和手机立即绑定

多文件夹下Excel指定列的提取合并

一、前言

大家好,我是崔艳飞,工作中经常遇到,从多个文件夹下的Excel中,提取指定列,再合并成新的Excel。几个文件夹还能应付,但要是有成百上千个文件夹,你就要哭了,本文针对此问题,实现Python自动处理。

二、导入库

只需导入OS库,进行文件查询,和pandas库进行数据处理。

import pandas as pd
import os

三、编写代码

1. 定义要提取Excel的总文件夹路径

输入要提取的文件夹、定义要提取的列、指定要保存输出结果的文件位置

    #要提取EXCEL的总文件夹路径
    path="D:/a/"
    # 定义要提取的列名
    key=['A','B']
    path2 = os.listdir(path)
    #定义输出合并结果文件名
    bb = path + 'result.xlsx'
    writer = pd.ExcelWriter(bb,engine='openpyxl')

2. 获取所有待提取的Excel文件List

 file_names=[]
    for p in path2:
        if '.xl' in p:
            continue
        path3=path+p+"/"
        #获取文件夹下所有EXCEL名
        xlsx_names = [x for x in os.listdir(path3) if x.endswith(".xlsx")]
        for f in xlsx_names:
            file_names.append(path3+f)

3. 循环读取所有Excel,提取指定列进行合并

 df = None
    for xlsx_name in file_names:
            df1 = pd.read_excel(xlsx_name, sheet_name=0, index_col=None,header=0)
            _df=df1.loc[:, key]
            if df is None:
                df = _df
            else:
                df = pd.concat([df, _df], ignore_index=True)
            print(xlsx_name + "  保存成功!共%d个,第%d个。" % (len(file_names), num))

四、执行效果

所有待提取合并的文件夹如下图:

image.png

执行代码成功:

image.png

保存结果文件:

image.png

提取结果文件内容如下:

image.png

五、总结

本文介绍了利用Pandas对批量Excel进行提取合并的有关操作。通过代码的演示、运行效果的展示,对Pandas的强大功能有了进一步地了解。有你真好,我爱Python。

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消