为了账号安全,请及时绑定邮箱和手机立即绑定

Pandas 将聚合数组列表变成字典

Pandas 将聚合数组列表变成字典

米琪卡哇伊 2021-07-22 18:00:13
我有以下数据结构:import pandas as pdimport jsondf = pd.DataFrame( {'g1' : ['ABC', 'ABC', 'XYZ', 'XYZ'], 'g2' : ['DEF', 'GHI', 'RST', 'UVW']})print df>>     g1   g20  ABC  DEF1  ABC  GHI2  XYZ  RST3  XYZ  UVW我正在尝试编写具有以下结构的 JSON 文件$ cat ABC.json> {    "DEF" : true,     "GHI" : true  }  和$ cat XYZ.json> {    "RST" : true,     "UVW" : true  }  到目前为止,我已经能够创建聚合print df.groupby(u'g1',as_index=True)[u'g2'].aggregate(lambda x: set(x))>> g1ABC    {GHI, DEF}XYZ    {RST, UVW}并将其转储到 JSONdd = json.loads(df.to_json())然后将其写入单个文件for k,v in dd.iteritems():    with open(k+'json','wb') as fp:        json.dump(v, fp)但是以pandas-y的方式将列表映射到dict仍然让我感到困惑。我将发布我的 python(非熊猫)答案作为参考
查看完整描述

2 回答

?
倚天杖

TA贡献1828条经验 获得超3个赞

你可以这样做:


import json

import pandas as pd


df = pd.DataFrame({'g1': ['ABC', 'ABC', 'XYZ', 'XYZ'], 'g2': ['DEF', 'GHI', 'RST', 'UVW']})


for name, group in df.groupby('g1'):

    with open('{}.json'.format(name), 'w') as out:

        json.dump(dict.fromkeys(group['g2'].values, True), out)


查看完整回答
反对 回复 2021-07-27
?
慕村9548890

TA贡献1884条经验 获得超4个赞

解决此问题的非 Pandas(并且不是非常 Pythonic)的方法是首先循环遍历每个键 (k),然后循环遍历每个数组 (v) 元素,为数组的每个成员创建一个字典 (vd) 条目。它有效,这就是我能说的。


vd = dict()

for k,v in dd.iteritems():

    for x in v:

        vd[x] = True


    with open(k+'json','wb') as fp:

        json.dump(vd, fp)


查看完整回答
反对 回复 2021-07-27
  • 2 回答
  • 0 关注
  • 362 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信