为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用 pandas 更改 csv 表?

如何使用 pandas 更改 csv 表?

四季花海 2023-09-26 14:08:47
我拥有的?我有一个 csv 文件,如下所示:------------------------------------------|      |         | 2017 | 2018 | 2019|   x  | England |  70  |  80  |  90|      |  param1 |  20  |  30  |  40|      |  param2 |  25  |  35  |  45|      |  param3 |  25  |  15  |   5|   y  | England |  60  |  50  |  60|      |  param1 |  10  |  25  |  10|      |  param2 |  20  |  25  |  20|      |  param3 |  30  |  0   |  30|   x  |   US    |  10  |  20  |  30|      |  param1 |  3   |  5   |  10|      |  param2 |  3   |  10  |  10|      |  param3 |  4   |  5   |  10|   y  |   US    |  60  |  50  |  60|      |  param1 |  10  |  25  |  10|      |  param2 |  20  |  25  |  20|      |  param3 |  30  |  0   |  30.........------------------------------------------我想要得到什么?我想得到一个像这样的数据框:对于 param(i) 的每个值我想要一行------------------------------------------country | type | param | year | value England |  x   | param1| 2017 |  20England |  x   | param1| 2018 |  30England |  x   | param1| 2019 |  40England |  x   | param2| 2017 |  25England |  x   | param2| 2018 |  35England |  x   | param2| 2019 |  45England |  x   | param3| 2017 |  25 England |  x   | param3| 2018 |  15England |  x   | param3| 2019 |  5England |  y   | param1| 2017 |  10England |  y   | param1| 2018 |  25England |  y   | param1| 2019 |  10England |  y   | param2| 2017 |  20England |  y   | param2| 2018 |  25England |  y   | param2| 2019 |  20England |  y   | param3| 2017 |  30England |  y   | param3| 2018 |   0 England |  y   | param3| 2019 |  30.........------------------------------------------请注意,我不需要县行的值我想做什么?首先填写x/y类型删除包含国家/地区的行并添加名为“county”的列以及国家/地区名称使用pivot更改表以获得正确的df我有什么问题?如何用 pandas 轻松填充类型?如何将正确的县添加到正确的行?我可以使用 pandas hub 来获得我想要的东西还是有更好的方法?谢谢
查看完整描述

1 回答

?
沧海一幻觉

TA贡献1824条经验 获得超5个赞

reset_index那么我们来尝试一下melt:


param_list = ['param1','param2','param3']

s=(df.rename_axis(['country','type'])

       .reset_index()

    )


mask=s['type'].isin(param_list)

s['country'] = s['type'].mask(mask).ffill()

out = s[mask].melt(['country','type'], var_name='year')

输出:


    country    type  year  value

0   England  param1  2017     20

1   England  param2  2017     25

2   England  param3  2017     25

3   England  param1  2017     10

4   England  param2  2017     20

5   England  param3  2017     30

6        US  param1  2017      3

7        US  param2  2017      3

8        US  param3  2017      4

9        US  param1  2017     10

10       US  param2  2017     20

11       US  param3  2017     30

12  England  param1  2018     30

13  England  param2  2018     35

14  England  param3  2018     15

15  England  param1  2018     25

16  England  param2  2018     25

17  England  param3  2018      0

18       US  param1  2018      5

19       US  param2  2018     10

20       US  param3  2018      5

21       US  param1  2018     25

22       US  param2  2018     25

23       US  param3  2018      0

24  England  param1  2019     40

25  England  param2  2019     45

26  England  param3  2019      5

27  England  param1  2019     10

28  England  param2  2019     20

29  England  param3  2019     30

30       US  param1  2019     10

31       US  param2  2019     10

32       US  param3  2019     10

33       US  param1  2019     10

34       US  param2  2019     20

35       US  param3  2019     30


查看完整回答
反对 回复 2023-09-26
  • 1 回答
  • 0 关注
  • 59 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信