为了账号安全,请及时绑定邮箱和手机立即绑定

如何利用样本函数将数据分割成训练/测试集

如何利用样本函数将数据分割成训练/测试集

饮歌长啸 2019-07-27 15:15:06
如何利用样本函数将数据分割成训练/测试集我刚刚开始使用R,我不知道如何将数据集与以下示例代码合并:sample(x, size, replace = FALSE, prob = NULL)我有一个数据集,我需要投入培训(75%)和测试(25%)集。我不知道我应该把什么信息放进x和尺码里?x是数据集文件吗?我有多少个样本?
查看完整描述

3 回答

?
汪汪一只猫

TA贡献1898条经验 获得超8个赞

有许多实现数据分区的方法。要获得更完整的方法,请查看createDataPartition函数中的caret包裹。


下面是一个简单的例子:


data(mtcars)


## 75% of the sample size

smp_size <- floor(0.75 * nrow(mtcars))


## set the seed to make your partition reproducible

set.seed(123)

train_ind <- sample(seq_len(nrow(mtcars)), size = smp_size)


train <- mtcars[train_ind, ]

test <- mtcars[-train_ind, ]




查看完整回答
反对 回复 2019-07-28
  • 3 回答
  • 0 关注
  • 426 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信