为了账号安全,请及时绑定邮箱和手机立即绑定

使用 Pandas 和 R 将序列号连接到组中的每一行

使用 Pandas 和 R 将序列号连接到组中的每一行

四季花海 2023-08-15 16:26:36
我有一个如下所示的数据框(下面给出了 R 和 Python 数据框代码)df = pd.DataFrame({'person_id': [11,11,11,12,12,12,12,13,13,13,13,13,14,14,14]}) df['enc_id'] = [1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579] person_id <- c(11,11,11,12,12,12,12,13,13,13,13,13,14,14,14) enc_id <- c(1134567890,1134567890,1134567890,3456789210,3456789210,3456789210,3456789210,5643271890,5643271890,5643271890,5643271890,5643271890,2468013579,2468013579,2468013579) df <- data.frame(person_id, enc_id)我想enc_id为每个人连接一个序列号我用Python写了类似下面的东西df['new_enc_id'] = df['enc_id'].map(str) + (df.groupby('person_id').cumcount()+1).map(str)你能帮我解决以下问题吗?我怎样才能在 R 中做到这一点?有什么优雅的方法可以在Python中做到这一点吗?我希望我的输出如下所示。您可以看到sequence number每个组 和 都是串联的not added。
查看完整描述

4 回答

?
跃然一笑

TA贡献1826条经验 获得超6个赞

您的解决方案很好,只有我用于astype转换为字符串:

df['new_enc_id'] = (df['enc_id'].astype(str) + 
                    (df.groupby('person_id').cumcount()+1).astype(str))


查看完整回答
反对 回复 2023-08-15
?
达令说

TA贡献1821条经验 获得超6个赞

在R中

df = df %>% group_by(person_id) %>% dplyr::mutate(new_enc_id = paste0(enc_id,row_number()) )


查看完整回答
反对 回复 2023-08-15
?
SMILET

TA贡献1796条经验 获得超4个赞

在空间内R,您可以通过以下方式获得相同的结果data.table

setDT(df)

df[, paste0(enc_id,row.names(.SD)), by=person_id]


查看完整回答
反对 回复 2023-08-15
?
梵蒂冈之花

TA贡献1900条经验 获得超5个赞

transform使用+的基本 R 选项ave


df <- transform(

  df,

  new_enc_id = paste0(new_enc_id, ave(1:nrow(df), person_id, FUN = seq_along))

)


查看完整回答
反对 回复 2023-08-15
  • 4 回答
  • 0 关注
  • 110 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信