首页猿问 spark 怎么将离散变量处理为哑变量?

spark 怎么将离散变量处理为哑变量?

Spark

扬帆大鱼 2018-10-17 19:15:40

spark 怎么将离散变量处理为哑变量

查看完整描述

1 回答

月关宝盒

TA贡献1772条经验获得超5个赞

在spss中打开数据，确定要设置哪个变量为哑变量以后，我们打开逻辑回归对话框，操作方法：analyse--regression--binary logistic

将是否吸烟这个变量放到因变量中，将种族放到自变量中，如图所示

选择变量进入方程的方法是enter，因为所有的哑变量必须是同时进入，否则就没有统计学意义了。

接下来要设置哑变量了，点击categrio按钮，打开变量分类对话框

将要设置哑变量的变量放入右侧窗口中

到了最关键的部分，我们要选择哪个分类作为参考分类，设置参考分类必须使参考分类有意义，比如这个例子中，种族类别包括黑人、白人和其他种族，那么其他种族一般被设置为参考分类，那么你怎么知道参考分类是第一个还是最后一个呢，后面要设置last和first。下面一个步骤告诉你

回到变量视图中，找到种族这个变量，在value中可以查看变量值，我们看到其他种族这个分类为3，上面那一步应该设置为last

点击ok，开始输出统计结果

输出了一大堆数据，我们不用管，因为这里要教大家如何分析哑变量，所以直奔主题，找到variables in the equation表，这个表中，你可以看到有race（1）和race（2）这两个变量，他们就是race的哑变量，B是系数，因为他们都是跟其他种族相比，图中的数据可以看到，白种人比其他种族的人更容以吸烟，黑种人比其他种族更容易吸烟，白种人和黑种人相比，黑种人可能比白种人更容易吸烟，但是需要进一步的检验。

反对回复 2018-11-07

1 回答
0 关注
1011 浏览

关注

添加回答

0/150

提交

取消

热搜

最近搜索清空

spark 怎么将离散变量处理为哑变量?

spark 怎么将离散变量处理为哑变量?

1 回答

添加回答