本站分享:大数据、数据分析师考试认证培训,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训广告位

spss中设置虚拟变量的具体过程_spss虚拟变量设置

spss培训 cdadata 781℃ 0评论

spss中设置虚拟变量的具体过程

关键词:spss虚拟变量回归,spss虚拟变量设置,spss虚拟变量回归分析,spss如何设置虚拟变量,spss怎么设置虚拟变量

设置虚拟变量我是会做的,但是这里会有新问题。当使用spss软件做多元线性回归分析时,会纳入多个自变量,假如有5个自变量,其中一个是血型,其他自变量都是连续变量,那么设置自变量时,血型共有三个虚拟变量,加上其他四个,共有7个自变量需要纳入到回归方程中,请问这样做对吗?有的书上提到,血型的三个虚拟变量需要同时进同时出,如何办到?如果我以血型A为参照,是否就是说,血型A不设置虚拟变量而以其它三个血型设置三个虚拟变量,那么,这样做以后,如果血型B的OR值为1.2,可以这样解释,即血型B的患者比血型A的患者患所研究疾病的可能性大20%?


spss虚拟变量设置問題1那么设置自变量时,血型共有三个虚拟变量,加上其他四个,共有7个自变量需要纳入到回归方程中,请问这样做对吗?
沒錯,迴歸方程式是這樣的
Y=a+b1X1+b2X2+b3X3+b4X4+b5Type1+ b6Type2+ b7Type3
spss虚拟变量设置問題2有的书上提到,血型的三个虚拟变量需要同时进同时出,如何办到?
如果讲的设置虚拟变量我是会做的,那麼你只要接著執行步驟3到步驟6
步驟1:輸入資料。類別資料以原始型態輸入。
步驟2:虛擬化處理類別變項:
轉換(transform)→重新編碼(Record into different variables)→成不同變數→
舊值與新值→指令設定新變項的轉換條件,。總共要做K-1次(你要做3次)
spss虚拟变量设置步驟3:選取統計→分析迴歸方法→線性
spss虚拟变量设置步驟4:選擇依變項
spss虚拟变量设置步驟5:選擇Type1,Type2, Type3虛擬變項以及X1,X2,X3,X4移入自變項清單中
spss虚拟变量设置步驟6:選擇強迫進入變數法,按確定執行。

spss虚拟变量设置問題3如果我以血型A为参照,是否就是说,血型A不设置虚拟变量而以其它三个血型设置三个虚拟变量,那么,这样做以后,如果血型B的OR值为1.2,可以这样解释,即血型B的患者比血型A的患者患所研究疾病的可能性大20%?
『血型A不设置虚拟变量』????
『如果我以血型A为参照』,按照邱皓政(2007)的作法,改寫如下;
如果間斷變項有K個水準,則需要K-1個虛擬變項【此例為5-1=4】

Blood Type
(原變項)
Type 1
(虛擬變項1)
Type 2
(虛擬變項2)
Type 3
(虛擬變項3)
說明
1,血型A
2,血型B
3,血型O,
4,血型AB
1 0 0 0 代表是血型A,參照組
1 0 0 0 代表是血型A,參照組
2 1 0 0 代表是血型B
2 1 0 0 代表是血型B
3 0 1 0 代表是血型O
3 0 1 0 代表是血型O
4 0 0 1 代表是血型AB
4 0 0 1 代表是血型AB

上述血型虛擬變項
Type1表示『血型B組與血型A組的對比』
Type2表示『血型O組與血型A組的對比』
Type 3表示『血型AB組與血型A組的對比』
至於血型A組扮演參照組的角色
當你按照問題2所描述的步驟3到步驟6執行完畢之後,從SPSS提供的結果中:
血型B組與血型A組的對比
血型O組與血型A組的對比
血型AB組與血型A組的對比
會有分別對應的標準化Beta係數以及t值以及p值。
Beta係數的正負值會說明各血型組與A血型的差異
例如Beta—BA為正,則顯示就因變數而言,B血型高於A血型B
至於顯著性則看p值。


SPSS的多元回归,并不是一次把所有变量全进入方程,本质上是逐一分析的。另外,直接做线性回归的话,我认为不甚合理,应先做散点图拟合回归,采用Lowess


线选项对所有数据进行整体拟合,即局部加权回归散点图修匀法,以减少主观倾向,拟合结果表现出良好的线性关系后,才开始做回归分析。

想补充以下内容. 对于logistic回归模型中的多分类自变量,需要虚拟变量(哑变量)来分析,以期对结果有更正确合理的解释. 在以前的软件中,需要用楼上的方法, 由一个分类变量, 生成多个变量进行分析(变量数为分类数减去1). 若进行多个多分类变量分析, 很浪费时间.

但现在的软件包软件通常不用这种方法. 以下方法比较常用. SPSS中, 对logistic回归分析, 选择应变量放入应变量的选择框, 再选择自变量, 放入自变量的选择框, 然后,选择Categorical按扭, 将自变量中多分类的变量放入Categorical Covariates框, 其中, 有contrast indicator, reference category, 显示可选last或first. 如选first, click “continue”即可. 此时, 已将多分类变量设置为虚拟变量, 且以第一个分类为参照(如第一年龄组), 若选last, 则以最后的分类为参照(如最后年龄组). 然后进行分析即可. 若有多个多分类变量, 可采用同样的方法进行设置.

转载请注明:数据分析 » spss中设置虚拟变量的具体过程_spss虚拟变量设置

喜欢 (2)or分享 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址