首页猿问理解order（）函数

理解order（）函数

R语言

守着一只汪 2019-08-02 14:11:24

理解order（）函数我试图了解该order()功能的工作原理。我的印象是它返回了索引的排列，当排序时，它会对原始向量进行排序。例如，> a <- c(45,50,10,96)> order(a)[1] 3 1 2 4我本来希望这会返回c(2, 3, 1, 4)，因为排序的列表将是10 45 50 96。有人能帮我理解这个函数的返回值吗？

查看完整描述

3 回答

大话西游666

TA贡献1817条经验获得超14个赞

这似乎可以解释它。

的定义order是，a[order(a)]为递增次序。这适用于您的示例，其中正确的顺序是第四，第二，第一，然后第三个元素。
您可能一直在寻找rank，它返回元素的等级，
R> a <- c(4.1, 3.2, 6.1, 3.1)
R> order(a)
[1] 4 2 1 3
R> rank(a)
[1] 3 2 4 1
因此rank告诉您数字的顺序， order告诉您如何按升序获取它们。
plot(a, rank(a)/length(a))将给出CDF的图表。order但是，要知道为什么有用，尝试plot(a, rank(a)/length(a),type="S") 哪个会弄乱，因为数据不是按顺序递增
如果您这样做
oo<-order(a)
plot(a[oo],rank(a[oo])/length(a),type="S")
或只是
oo<-order(a)
plot(a[oo],(1:length(a))/length(a)),type="S")
获得了CDF的折线图。

我打赌你在考虑排名。

反对回复 2019-08-02

眼眸繁星

TA贡献1873条经验获得超9个赞

要对1D向量或单列数据进行排序，只需调用sort函数并传入序列。

另一方面，顺序函数对于对数据二维数据进行排序是必要的- 即，在矩阵或数据帧中收集的多列数据。

Stadium Home Week Qtr Away Off Def Result Kicker Dist

751 Out PHI 14 4 NYG PHI NYG Good D.Akers 50

491 Out KC 9 1 OAK OAK KC Good S.Janikowski 32

702 Out OAK 15 4 CLE CLE OAK Good P.Dawson 37

571 Out NE 1 2 OAK OAK NE Missed S.Janikowski 43

654 Out NYG 11 2 PHI NYG PHI Good J.Feely 26

307 Out DEN 14 2 BAL DEN BAL Good J.Elam 48

492 Out KC 13 3 DEN KC DEN Good L.Tynes 34

691 Out NYJ 17 3 BUF NYJ BUF Good M.Nugent 25

164 Out CHI 13 2 GB CHI GB Good R.Gould 25

80 Out BAL 1 2 IND IND BAL Good M.Vanderjagt 20

以下是2008年NFL赛季投篮数据的摘录，这是一个我称之为“fg”的数据帧。假设这10个数据点代表了2008年尝试的所有实地目标; 进一步假设你想知道那一年尝试的最长射门次数的距离，踢球的距离以及是否好的; 你也想知道第二长，第三长，等等。最后你想要最短的射门尝试。

好吧，你可以这样做：

sort(fg$Dist, decreasing=T)

返回：50 48 43 37 34 32 26 25 25 20

这是正确的，但不是很有用 - 它确实告诉我们最长的射门尝试的距离，第二长的，......以及最短的; 然而，这就是我们所知道的 - 例如，我们不知道踢球者是谁，尝试是否成功等等。当然，我们需要在“Dist”栏上排序整个数据框（换句话说，我们想要对单个属性Dist。上的所有数据行进行排序，如下所示：

Stadium Home Week Qtr Away Off Def Result Kicker Dist

751 Out PHI 14 4 NYG PHI NYG Good D.Akers 50

307 Out DEN 14 2 BAL DEN BAL Good J.Elam 48

571 Out NE 1 2 OAK OAK NE Missed S.Janikowski 43

702 Out OAK 15 4 CLE CLE OAK Good P.Dawson 37

492 Out KC 13 3 DEN KC DEN Good L.Tynes 34

491 Out KC 9 1 OAK OAK KC Good S.Janikowski 32

654 Out NYG 11 2 PHI NYG PHI Good J.Feely 26

691 Out NYJ 17 3 BUF NYJ BUF Good M.Nugent 25

164 Out CHI 13 2 GB CHI GB Good R.Gould 25

80 Out BAL 1 2 IND IND BAL Good M.Vanderjagt 20

这就是订单的作用。它是二维数据的“排序”; 换一种说法，它返回由行号这样的一维整数索引排序行根据该矢量，会给你的专栏，正确的面向行的排序DIST

这是它的工作原理。上面，sort用于对Dist列进行排序; 要对Dist列上的整个数据框进行排序，我们使用'order' 与上面使用的'sort'完全相同：

ndx = order(fg$Dist, decreasing=T)

（我通常将从'order'返回的数组绑定到变量'ndx'，它代表'index'，因为我将它用作索引数组来排序。）

那是第1步，这是第2步：

'ndx'，'sort'返回的内容然后用作索引数组来重新排序数据帧'fg'：

fg_sorted = fg[ndx,]

fg_sorted是紧接在上面的重新排序的数据帧。

总而言之，'sort'用于创建索引数组（指定要排序的列的排序顺序），然后将其用作索引数组以重新排序数据框（或矩阵）。

反对回复 2019-08-02

汪汪一只猫

TA贡献1898条经验获得超8个赞

？order告诉你原始向量的哪个元素需要放在第一个，第二个等，以便对原始向量进行排序，而？rank告诉你哪个元素具有最低，第二低等值。例如：

> a <- c(45, 50, 10, 96)> order(a)  [1] 3 1 2 4  > rank(a)  [1] 2 3 1 4

所以order(a)说，“当你排序时，把第三个元素放在第一位......”，而是rank(a)说，'第一个元素是第二个最低......'。（请注意，他们都同意哪个元素最低等等;它们只是以不同的方式呈现信息。）因此，我们看到我们可以使用order()排序，但我们不能使用rank()这种方式：

> a[order(a)]  [1] 10 45 50 96  > sort(a)  [1] 10 45 50 96  > a[rank(a)]  [1] 50 10 45 96

通常，除非已经对矢量进行了排序，否则order()它将不相等rank()：

> b <- sort(a)  > order(b)==rank(b)  [1] TRUE TRUE TRUE TRUE

此外，由于order()（基本上）在数据行上操作，您可以在不影响信息的情况下编写它们，但反过来会产生乱码：

> order(rank(a))==order(a)  [1] TRUE TRUE TRUE TRUE  > rank(order(a))==rank(a)  [1] FALSE FALSE FALSE  TRUE

反对回复 2019-08-02

3 回答
0 关注
1821 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

理解order（）函数

理解order（）函数

3 回答

添加回答