将计数转换为长格式到宽格式的简单方法

R语言

Qyouu 2019-10-22 21:56:55

我有以下数据集：sample.data <- data.frame(Step = c(1,2,3,4,1,2,1,2,3,1,1), Case = c(1,1,1,1,2,2,3,3,3,4,5), Decision = c("Referred","Referred","Referred","Approved","Referred","Declined","Referred","Referred","Declined","Approved","Declined"))sample.data Step Case Decision1 1 1 Referred2 2 1 Referred3 3 1 Referred4 4 1 Approved5 1 2 Referred6 2 2 Declined7 1 3 Referred8 2 3 Referred9 3 3 Declined10 1 4 Approved11 1 5 DeclinedR中是否可以将其转换为宽表格式，并在标头上做出决定，并且每个单元格的值就是出现次数，例如：Case Referred Approved Declined1 3 1 02 1 0 13 2 0 14 0 1 05 0 0 1

查看完整描述

3 回答

互换的青春

TA贡献1797条经验获得超6个赞

您可以使用简单的table()语句来完成此操作。您可以通过设置因子水平来获得所需的响应。

sample.data$Decision <- factor(x = sample.data$Decision,

levels = c("Referred","Approved","Declined"))

table(Case = sample.data$Case,sample.data$Decision)

Case Referred Approved Declined

1 3 1 0

2 1 0 1

3 2 0 1

4 0 1 0

5 0 0 1

反对回复 2019-10-22

四季花海

TA贡献1811条经验获得超5个赞

-package dcast函数中的聚合参数reshape2默认为length（= count）。在data.table-package中，dcast实现了该函数的改进版本。因此，在您的情况下，这将是：

library('reshape2') # or library('data.table')

newdf <- dcast(sample.data, Case ~ Decision)

或显式使用参数：

newdf <- dcast(sample.data, Case ~ Decision,

value.var = "Decision", fun.aggregate = length)

这给出了以下数据框：

> newdf

Case Approved Declined Referred

1 1 1 0 3

2 2 0 1 1

3 3 0 1 2

4 4 1 0 0

5 5 0 1 0

如果未指定聚合函数，则会收到一条警告，告知您dcast正在使用它lenght作为默认值。

反对回复 2019-10-22

万千封印

TA贡献1891条经验获得超3个赞

这是dplyr + tidyr方法：

if (!require("pacman")) install.packages("pacman")

pacman::p_load(dplyr, tidyr)

sample.data %>%

count(Case, Decision) %>%

spread(Decision, n, fill = 0)

## Case Approved Declined Referred

## (dbl) (dbl) (dbl) (dbl)

## 1 1 1 0 3

## 2 2 0 1 1

## 3 3 0 1 2

## 4 4 1 0 0

## 5 5 0 1 0

反对回复 2019-10-22

热搜

最近搜索清空

将计数转换为长格式到宽格式的简单方法

将计数转换为长格式到宽格式的简单方法

3 回答

添加回答