首页猿问 Pandas read_csv...

Pandas read_csv 不读取文件（while 循环）

Python

慕无忌1623718 2023-06-27 13:24:21

我正在尝试阅读我存储在电脑上的几张（~30）csv 表。i=2Liste1 = []Liste2 = []x = 0while i < 32: string = str(i) if i < 10: try: Name = 'D:\\FTPDaten\\2020\\Alle\\2020010'+string+'.csv' Tabelle = pd.read_csv(Name, sep=';', decimal=",", header=0, usecols=[7, 20]) Tabelle.columns = ['AC', 'DC'] neueTabelle1 = Tabelle['AC'] neueTabelle = Tabelle['DC'] Schleifenlaenge = len(neueTabelle) j = 0 del(Tabelle) while j < Schleifenlaenge: Datenwert1 = neueTabelle.iloc[j] Datenwert2 = neueTabelle1.iloc[j] Liste1.append(Datenwert1) Liste2.append(Datenwert2) j = j + 1 except FileNotFoundError: i=i+1 elif i >= 10 and i < 32: try: Name = 'D:\\FTPDaten\\2020\\Alle\\202001' + string + '.csv' Tabelle = pd.read_csv(Name, sep=';', decimal=",", header=0, usecols=[7, 20]) Tabelle.columns = ['AC', 'DC'] neueTabelle1 = Tabelle['AC'] neueTabelle = Tabelle['DC'] Schleifenlaenge = len(neueTabelle) j = 0 while j < Schleifenlaenge: Datenwert1 = neueTabelle1.iloc[j] Datenwert2 = neueTabelle.iloc[j] Liste1.append(Datenwert1) Liste2.append(Datenwert2) j = j + 1 except FileNotFoundError: i = i+1 i = i + 1当 while 循环第一次运行时，一切正常。当进入第一次迭代时，read_csv 不会像以前那样读取文件。我希望得到一个存储第 7 列和第 20 列的 DataFrame。但我确实得到了一个完全没有内容的 DataFrame - 只有标题。我尝试了很多，但肯定无法修复它。

查看完整描述

3 回答

紫衣仙女

TA贡献1839条经验获得超15个赞

问题在于它如何读取';'其他文件（第一个文件除外）。如果你用 Excel 打开它们，你也许就能明白我在说什么。因此，您需要做的是跳过文件开头的那些行。

import pandas as pd

Liste1 = []

Liste2 = []

for i in range(2,32):

skipRows = 7

if i != 2:

skipRows += 1

if i < 10:

try:

Name = 'D:\\FTPDaten\\2020\\Alle\\2020010{string}.csv'.format(string=i)

Tabelle = pd.read_csv(Name, sep=';', decimal=",", header=0, usecols=[7, 20], skiprows=skipRows)

Tabelle.columns = ['AC', 'DC']

if i < 10:

Datenwert1 = list(Tabelle['DC'])

Datenwert2 = list(Tabelle['AC'])

elif i >= 10 and i < 32:

Datenwert1 = list(Tabelle['AC'])

Datenwert2 = list(Tabelle['DC'])

Liste1 += Datenwert1

Liste2 += Datenwert2

except FileNotFoundError as e:

print(e)

df = pd.DataFrame({'col1':Datenwert1, #<-- change 'col1', 'col2' to whatever you want to name them

'col2':Datenwert2})

反对回复 2023-06-27

梦里花落0921

TA贡献1772条经验获得超6个赞

尝试在此处创建一个新的数据框，而不是迭代现有的数据框

cols = ['AC', 'DC']

new_Tabelle = pd.DataFrame(columns = cols)

new_Tabelle['AC']=Tabelle['AC']

new_Tabelle['DC']=Tabelle['DC']

反对回复 2023-06-27

largeQ

TA贡献2039条经验获得超8个赞

我没有 30 个分号分隔的文件。然而，这可以很容易地简化为仅拾取存在并匹配模式的文件，使用glob

import pandas as pd

from pathlib import Path

import random

for i in range(30):

with open(f"2020010_os_{i}.csv", "w") as fp: fp.write(f"id;val\n{i};{random.randint(10,20)}\n")

pd.concat([pd.read_csv(fn, sep=";") for fn in Path().cwd().glob("2020010*.csv")])

反对回复 2023-06-27

3 回答
0 关注
369 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

Pandas read_csv 不读取文件（while 循环）

Pandas read_csv 不读取文件（while 循环）

3 回答

添加回答