本站分享:大数据、数据分析师考试认证培训,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训广告位

岭回归的共线性的处理_岭回归 spss步骤

spss培训 cdadata 319℃ 0评论

关键词:spss岭回归分析结果, spss岭回归,spss如何做岭回归

岭回归的共线性的处理

语法:

INCLUDE ‘ C:\Program Files\SPSS\Ridge Regression.sps’

ridgereg enter=自变量列表

/dep=因变量名

/start=K值起始值,默认为0

/stop= K值终止值,默认为1

/inc=K值搜索步长,默认为0.05

/k=允许搜索的K值个数,默认为999

 

岭回归 spss步骤步骤:

  • 打开需要处理的数据文件;
  • 执行file/new/syntax,并根据上述的语法格式写入程序;
  • 点击“syntax”窗口上的播放箭头,或者执行“Run/all”

 

例题分析(摘自张文彤《高级教程》)

例6.3现测得22例胎儿的身长、头围、体重和胎儿受精周龄,具体数据见文件ridgereg.sav。研究者希望能建立由前三个外形指标推测胎儿周龄的回归方程。(陈峰《医用多元统计分析方法》P46)

程序:

INCLUDE ‘ C:\Program Files\SPSS\Ridge Regression.sps’

ridgereg enter=long touwei weight

/dep=y

/inc=0.01.

spss岭回归分析结果:–例题解析以及结果分析

岭回归的共线性的处理_岭回归 spss步骤

可见当k=O.04~O.06时,回归系数开始趋于稳定。如选择k=0.05,则三个变量的系数分别为0.317746、O.1 113和0.537 699,可写出方程如下:zy=0.311 746 xzlong+0.111 3 xztouwei+0.537 699 xzweight相应的决定系数为0.949 32,虽然没有原方程的0.975 42高,但方程中三个变量的系数均为正,符合专业知识。也就是说,岭回归通过丢弃少量的信息,换来了方程系数的合理估计。

岭回归 spss步骤

图6.6为将不同k值时各变量的回归系数连成的曲线,该曲线被形象地称为岭迹(Ridge Trace),这就是岭回归名称的由来。可见当k到达0.05附近时,三条岭迹都开始变得平稳,这和前面的结论相一致。

图6.7为不同k值时决定系数的下降情况,为了便于观察,笔者在k=0.05处添加了一条参考线,可见决定系数一开始明显下降,但当k超过0.05后,决定系数一直处于缓慢下降中,没有出现明显的波动。图6.7反映出的信息也支持前面做出的结论。

转载请注明:数据分析 » 岭回归的共线性的处理_岭回归 spss步骤

喜欢 (0)or分享 (0)

您必须 登录 才能发表评论!