所以我试图用python做一个多变量线性回归。但我不能这样做,因为我的数据集有大小(2920x1)。我想像这张图片2那样拆分列,但我用“;”分隔它们。我该怎么做? 在此处输入图像描述 在此处 输入图像描述
1 回答

慕尼黑的夜晚无繁华
TA贡献1864条经验 获得超6个赞
如果你有一个 pandas.DataFrame ,其中有一列如下所示:
>>> import pandas as pd
>>> df = pd.DataFrame({'a;b;c;d': ['2;3;1;6', '0;1;4;2', '6;9;6;0']})
>>> print(df)
a;b;c;d
0 2;3;1;6
1 0;1;4;2
2 6;9;6;0
您可以使用pandas.Series.str.split()
并pandas.Series.to_list()
制作一个新的数据框。
代码如下。
>>> df_adjusted = pd.DataFrame(df.iloc[:, 0].str.split(';').to_list(), columns=df.columns[0].split(';'))
>>> print(df_adjusted)
a b c d
0 2 3 1 6
1 0 1 4 2
2 6 9 6 0
编辑:
要读取以分号分隔单元格的 CSV 文件,请使用pandas.read_csv()
具有正确填充sep
参数的函数。
>>> df = pd.read_csv('path/to/your/data', sep=';')
添加回答
举报
0/150
提交
取消