本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

SPSS单因素方差分析(ANOVA检验)

spss培训 wangjing 15296℃

SPSS单因素方差分析(ANOVA检验)

方差分析

方差分析是一种假设检验,它把观测总变异的平方和与自由度分解为对应不同变异来源的平方和与自由度,将某种控制性因素所导致的系统性误差和其他随机性误差进行对比,从而推断各组样本之间是否存在显著性差异,以分析该因素是否对总体存在显著性影响。方差分析法采用离差平方和对变差进行度量,从总离差平方和分解出可追溯到指定来源的部分离差平方和。方差分析要求样本满足以下条件:

  1. 可比性:资料中各组均数本身必须具有可比性,这是方差分析的前提;
  2. 正态性:方差分析要求样本来源于正态分布总体,偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析;
  3. 方差齐性:方差分析要求各组间具有相同的方差,即满足方差齐性。

单因素方差分析

单因素方差分析用于分析单一控制变量影响下的多组样本的均值是否存在显著性差异。

单因素方差分析的原理

单因素方差分析也称为一维方差分析,用于分析单个控制因素取不同水平时因变量的均值是否存在显著差异。单因素方差分析基于各观测量来自于相互独立的正态样本和控制变量不同水平的分组之间的方差相等的假设。单因素方差分析将所有的方差划分为可以由该因素解释的系统性偏差部分和无法由该因素解释的随机性偏差,如果系统性偏差明显超过随机性偏差,则认为该控制因素取不同水平时因变量的均值存在显著差异。

单因素方差分析的SPSS操作

例:

step1 建立数据文件

在SPSS中建立数据文件

step2 命令选项

在菜单栏中选择“分析”→“比较平均值”→“单因素ANOVA检验”命令,打开如图所示的“单因素ANOVA检验”对话框。

step3 选择变量

“因变量列表”列表框:该列表框中的变量为要进行方差分析的目标变量,称为因变量,因变量一般为度量变量,类型为数值型。 “因子”列表框:该列表框中的变量为因子变量,又称自变量,主要用来分组。如果要比较两种教学方法下学生的数学成绩是否一致,则数学成绩变量就是因变量,教学方法就是因子变量。自变量为分类变量,其取值可以为数字,也可以为字符串。因子变量值应为整数,并且为有限个类别。 此题中,“重量”应选入“因变量列表”列表框中,“机器”为因子,选入“因子”列表框中,如图所示。

step4 进行相应的设置

(一)“对比”设置

  1. “多项式” 复选框: 该复选框用于对组间平方和划分成趋势成分,或者指定先验对比,按因子顺序进行趋势分析。选中“多项式”复选框,则“等级”下拉列表框就会被激活,然后就可以对趋势分析指定多项式的形式,如“线性”“二次项”“立方”“四次项”“五次项”。
  2. “系数” 文本框: 该文本框用于对组间平均数进行比较定制,即指定的用t统计量检验的先验对比。为因子变量的每个组(类别)输入一个系数,每次输入后单击“添加”按钮,每个新值都添加到系数列表框的底部。要指定其他对比组,可单击“下一页”按钮。利用“下一页”和“上一页”按钮在各组对比间移动。系数的顺序很重要,因为该顺序与因子变量类别值的升序相对应。列表框中的第一个系数与因子变量的最低组值相对应,而最后一个系数与最高值相对应。

本题中,选中“多项式”复选框,并将“等级”设为了“线性”。

(二)“两两比较”设置

  1. “假定等方差” 选项组:该选项组主要用于在假定等方差下进行两两范围检验和成对多重比较,共有14种检验方法
  1. “不假定等方差” 选项组: 该选项组主要用于在不假定等方差下进行两两范围检验和成对多重比较,选项组中含有4个复选框:塔姆黑尼T2,选中该复选框,表示输出基于t检验的保守成对比较结果。邓尼特T3,选中该复选框,表示执行学生化最大值模数的成对比较检验。盖姆斯-豪厄尔,选中该复选框,表示执行方差不齐的成对比较检验,且该方法比较常用。邓尼特C,选中该复选框,表示执行基于学生化范围的成对比较检验。
  2. “显著性水平” 文本框: 该文本框用于指定两两范围检验和成对多重比较检验的显著水平,输入范围是0.01~0.99,系统默认为0.05。

本题选择了“邦弗伦尼”复选框。

(三)“选项”设置

  1. “统计” 选项组: 该选项组主要用于指定输出的统计量,包括: ①描述:表示要输出每个因变量的个案数、平均值、标准差、均值标准误差、最小值、最大值和95%置信区间。 ②固定和随机效应:表示把数据看作面板数据进行回归,以计算固定效应模型的标准差、标准误和95%置信区间,以及随机效应模型的标准误、95%置信区间和成分间方差估计。 ③方差齐性检验:即莱文方差齐性检验。 ④布朗-福塞斯:表示计算布朗-福塞斯统计量以检验组均值是否相等,特别是当莱文方差齐性检验显示方差不等时,该统计量优于F统计量。 ⑤韦尔奇:计算Welch统计量以检验组均值是否相等,与布朗-福塞斯类似,当莱文方差齐性检验显示方差不等时,该统计量优于F统计量。
  2. “缺失值” 选项组: 该选项组主要用于当检验多个变量,有一个或多个变量的数据缺失时,可以指定检验剔除哪些个案,有两种方法: ①按具体分析排除个案:表示给定分析中的因变量或因子变量有缺失值的个案不用于该分析,也不使用超出因子变量指定范围的个案。 ②成列排除个案:表示因子变量有缺失值的个案,或者在主对话框“因变量列表”列表框中缺失的个案都排除在所有分析之外。如果尚未指定多个因变量,那么这个选项不起作用。
  3. “平均值图” 复选框: 该复选框用于绘制每组的因变量平均值分布图,组别是根据因子变量控制的。

在本题中,选择了“方差齐性检验”和“平均值图”。

step5 分析结果输出

单击“确定”按钮,即可在SPSS Statistics查看器窗口得到单因素方差分析的结果。

实验结果及分析

上图输出结果中给出了方差齐性检验的结果,从中可以看出,莱文方差齐性检验的显著性为0.456,大于显著水平0.05,因此基本可以认为样本数据之间的方差是齐次的。

上图是单因素方差分析的结果,从中可以看出,组间平方和是176.533、组内平方和是22.800,其中组间平方和的F值为46.456,显著性是0.000,小于显著水平0.05,因此我们认为不同的机器类型对产品重量有显著的影响。 另外,这个表中也给出了线性形式的趋势检验结果,组间重量被机器类型所能解释(对比)的部分是48.400,被其他因素解释(偏差)的有128.133,并且组间重量被其他因素所能解释的部分是非常显著的。

上图给出了多重比较的结果,*表示该组均值差是显著的。因此,从中可以看出,机器1和机器2、机器3的产品重量均值差是非常明显的。另外,还可以得到每组之间均值差的标准误差、置信区间等信息。

上图给出了各组的均值图。从图中可以清楚地看到不同的机器类型对应的不同的产品质量均值。可见,机器1的产品重量最低,且与其他两组的质量均值相差较大,这个结果和多重比较的结果非常一致。

转载请注明:数据分析 » SPSS单因素方差分析(ANOVA检验)

喜欢 (41)or分享 (0)