为了账号安全,请及时绑定邮箱和手机立即绑定

获得警告:“'newdata'有1行但找到的变量有32行”在predict.lm上

获得警告:“'newdata'有1行但找到的变量有32行”在predict.lm上

慕慕森 2019-12-02 08:04:03
获得警告:“'newdata'有1行但找到的变量有32行”在predict.lm上我在R中使用预测和lm函数时发现了特性。我对相同数据的数据帧和向量得到了不同的结果。DataFrame代码:data(mtcars)fitCar<-lm(mtcars$mpg~mtcars$wt)predict(fitCar,        data.frame(x=mean(mtcars$wt)),        interval="confidence")输出:     fit       lwr      upr1  23.282611 21.988668 24.576552  21.919770 20.752751 23.086793  24.885952 23.383008 26.388904  20.102650 19.003004 21.202305  18.900144 17.771469 20.028826  18.793255 17.659216 19.927297  18.205363 17.034274 19.376458  20.236262 19.136179 21.336359  20.450041 19.347720 21.5523610 18.900144 17.771469 20.0288211 18.900144 17.771469 20.0288212 15.533127 14.064349 17.0019013 17.350247 16.104455 18.5960414 17.083024 15.809403 18.3566415  9.226650  6.658271 11.7950316  8.296712  5.547468 11.0459617  8.718926  6.052112 11.3857418 25.527289 23.927797 27.1267819 28.653805 26.519252 30.7883620 27.478021 25.554415 29.4016321 24.111004 22.715653 25.5063522 18.472586 17.319886 19.6252923 18.926866 17.799465 20.0542724 16.762355 15.452833 18.0718825 16.735633 15.423002 18.0482626 26.943574 25.112491 28.7746627 25.847957 24.198041 27.4978728 29.198941 26.963760 31.4341229 20.343151 19.242185 21.4441230 22.480940 21.268498 23.6933831 18.205363 17.034274 19.3764532 22.427495 21.219818 23.63517警告信息:'newdata'有1行,但找到的变量有32行当我将两个数据分成向量时,我得到了不同的答案矢量代码predict(fit,data.frame(x=mean(x)), interval="confidence")输出:    fit   lwr   upr1 20.09 18.99 21.19造成这种差异的原因是什么?
查看完整描述

3 回答

?
缥缈止盈

TA贡献2041条经验 获得超4个赞

这是在您data和您之间使用不同名称的问题,newdata而不是使用向量或数据帧之间的问题。


当您使用该lm函数拟合模型然后用于predict进行预测时,predict尝试在您的上查找相同的名称newdata。在您的第一个案例名称x冲突,mtcars$wt因此您得到警告。


在这里看到我说的一个例子:


这是你做的,没有得到错误:


a <- mtcars$mpg

x <- mtcars$wt


#here you use x as a name

fitCar <- lm(a ~ x) 

#here you use x again as a name in newdata.

predict(fitCar, data.frame(x = mean(x)), interval = "confidence") 


       fit      lwr      upr

1 20.09062 18.99098 21.19027

在这种情况下,您可以使用名称x来拟合模型,并使用您的名称x进行预测newdata。这样你就不会得到任何警告,而这正是你所期望的。


让我们看看当我适应模型时将名称更改为其他内容时会发生什么:


a <- mtcars$mpg

#name it b this time

b <- mtcars$wt 


fitCar <- lm(a ~ b) 

#here I am using name x as previously

predict(fitCar, data.frame(x = mean(x)), interval = "confidence") 


         fit       lwr      upr

1  23.282611 21.988668 24.57655

2  21.919770 20.752751 23.08679

3  24.885952 23.383008 26.38890

4  20.102650 19.003004 21.20230

5  18.900144 17.771469 20.02882

Warning message:

'newdata' had 1 row but variables found have 32 rows 

我现在做的唯一的事情就是更改名称x拟合模型的时候b,然后预测使用该名称x的newdata。正如您所看到的,我遇到了与您的问题相同的错误。


希望现在很清楚!




查看完整回答
反对 回复 2019-12-03
?
牛魔王的故事

TA贡献1830条经验 获得超3个赞

在lm函数的公式中,不要使用datasetname $ variablename模式引用变量。而是使用variablename + variablename ...这不会抛出警告:'newdata'有nrow(测试)行,但找到的变量有nrow(train)行。

查看完整回答
反对 回复 2019-12-03
?
侃侃尔雅

TA贡献1801条经验 获得超15个赞

解决这个问题的方法是使用以下方法:

fitCar<-lm(mpg ~ wt, mtcars) #here you use x as a namepredict(fitCar,data.frame(wt=mean(mtcars$wt)), interval="confidence")


查看完整回答
反对 回复 2019-12-03
  • 3 回答
  • 0 关注
  • 799 浏览

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信