为了账号安全,请及时绑定邮箱和手机立即绑定

dplyr包可以用于条件变异吗?

dplyr包可以用于条件变异吗?

蝴蝶刀刀 2019-07-31 15:54:10
dplyr包可以用于条件变异吗?当突变是有条件的(取决于某些列值的值)时,可以使用mutate吗?这个例子有助于显示我的意思。structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, 6, 5, 3, 6, 5, 3), d = c(6, 2, 4, 5, 3, 7, 2, 6), e = c(1, 2, 4, 5, 6, 7, 6, 3), f = c(2, 3, 4, 2, 2, 7, 5, 2)), .Names = c("a", "b", "c", "d", "e", "f"), row.names = c(NA, 8L), class = "data.frame")  a b c d e f1 1 1 6 6 1 22 3 3 3 2 2 33 4 4 6 4 4 44 6 2 5 5 5 25 3 6 3 3 6 26 2 7 6 7 7 77 5 2 5 2 6 58 1 6 3 6 3 2我希望使用dplyr包找到解决我的问题的方法(是的,我知道这不是应该有效的代码,但我想它的目的很明确)用于创建新列g: library(dplyr) df <- mutate(df,         if (a == 2 | a == 5 | a == 7 | (a == 1 & b == 4)){g = 2},         if (a == 0 | a == 1 | a == 4 | a == 3 |  c == 4) {g = 3})我正在寻找的代码的结果应该在这个特定的例子中有这个结果:  a b c d e f  g1 1 1 6 6 1 2  32 3 3 3 2 2 3  33 4 4 6 4 4 4  34 6 2 5 5 5 2 NA5 3 6 3 3 6 2 NA6 2 7 6 7 7 7  27 5 2 5 2 6 5  28 1 6 3 6 3 2  3有没有人知道如何在dplyr中这样做?这个数据框只是一个例子,我正在处理的数据框要大得多。由于它的速度,我试图使用dplyr,但也许还有其他更好的方法来处理这个问题?
查看完整描述

3 回答

?
侃侃无极

TA贡献2051条经验 获得超10个赞

使用 ifelse

df %>%
  mutate(g = ifelse(a == 2 | a == 5 | a == 7 | (a == 1 & b == 4), 2,
               ifelse(a == 0 | a == 1 | a == 4 | a == 3 |  c == 4, 3, NA)))

添加 - if_else:注意,在dplyr 0.5中有一个if_else定义的函数,所以替代方法是替换ifelseif_else; 但请注意,因为if_elseifelse条件更严格(条件的两条腿必须具有相同的类型)所以NA在这种情况下必须更换NA_real_

df %>%
  mutate(g = if_else(a == 2 | a == 5 | a == 7 | (a == 1 & b == 4), 2,
               if_else(a == 0 | a == 1 | a == 4 | a == 3 |  c == 4, 3, NA_real_)))

添加 - case_when自发布此问题后,dplyr已添加,case_when因此另一个替代方案是:

df %>% mutate(g = case_when(a == 2 | a == 5 | a == 7 | (a == 1 & b == 4) ~ 2,
                            a == 0 | a == 1 | a == 4 | a == 3 |  c == 4 ~ 3,
                            TRUE ~ NA_real_))


查看完整回答
反对 回复 2019-07-31
  • 3 回答
  • 0 关注
  • 577 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信