为了账号安全,请及时绑定邮箱和手机立即绑定

与开始和结束位置重叠连接

与开始和结束位置重叠连接

郎朗坤 2019-06-13 14:42:23
与开始和结束位置重叠连接考虑以下几点data.tableS.第一个区域定义了每组“x”的起始和结束位置的一组区域:library(data.table)d1 <- data.table(x = letters[1:5], start = c(1,5,19,30, 7), end = c(3,11,22,39,25))setkey(d1, x, start) #    x start end# 1: a     1   3# 2: b     5  11# 3: c    19  22# 4: d    30  39# 5: e     7  25第二个数据集具有相同的分组变量‘x’,并在每个组中定位‘pos’:d2 <- data.table(x = letters[c(1,1,2,2,3:5)], pos = c(2,3,3,12,20,52,10))setkey(d2, x, pos)#    x pos# 1: a   2# 2: a   3 # 3: b   3# 4: b  12# 5: c  20# 6: d  52# 7: e  10最后,我想提取‘d2’中的行,其中‘pos’在每个组中都属于由‘start’和‘end’定义的范围内。x..期望的结果是#    x pos start  end# 1: a   2     1    3# 2: a   3     1    3# 3: c  20    19   22# 4: e  10     7   25任何组的开始/结束位置。x永远不会重叠,但在任何地区都可能存在价值差距。现在,我认为我应该使用滚动连接。据我所知,我不能在联接中使用“end”列。我试过d1[d2, roll = TRUE, nomatch = 0, mult = "all"][start <= end]得到#    x start end# 1: a     2   3# 2: a     3   3# 3: c    20  22# 4: e    10  25这是我想要的正确的行集;但是,“pos”变成了“start”,而原始的“start”已经丢失了。是否有一种方法可以保留所有列的滚动连接,以便我可以报告“开始”,“pos”,“结束”的要求吗?
查看完整描述

3 回答

  • 3 回答
  • 0 关注
  • 629 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信