独立样本T检验
# 1、作用
独立样本t检验用于分析一个定类变量与一个或者多个定量变量之间有无明显差异,需要特别注意的是,该定类变量为二分类变量(三分类及以上使用方差分析),各分类频数可以不相等。
# 2、输入输出描述
输入:一个定类变量 X(如学校字段,包括甲学校、乙学校)与定量字段 Y(如甲 40 名学生与乙学校 60 名学生的高考数学成绩)。
输出:模型检验的结果,如甲学校与乙学校的学生高考数学成绩存在/不存在显著性差异。
# 3、案例示例
示例:如研究不同学校的学生(各学校学生数不一定相等)成绩是否存在差异性。
# 4、案例数据
独立样本t检验案例数据
# 5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
Step4:选中上传的数据或者之前上传过的数据进入分析页面进行分析;
step5:选择【独立样本 t 检验】;
step6:查看对应的数据数据格式,【独立样本 t 检验】分组项要求输入数据为定类变量,且至少有一项;
step7:查看对应的数据数据格式,【独立样本 t 检验】汇总项要求输入数据为定量变量,且至少有一项;
step8:点击【开始分析】,完成全部操作;
# 6、输出结果分析
输出结果 1:正态性检验结果
变量名 | 样本量 | 平均值 | 标准差 | 偏度 | 峰度 | S-W 检验 | K-S 检验 |
---|---|---|---|---|---|---|---|
成绩 | 49 | 622.122 | 62.285 | -0.027 | -0.82 | 0.978(0.496*) | 0.084(0.853*) |
图表说明:上表展示了定量变量成绩描述性统计和正态性检验的结果,包括中位数、平均值等,用于检验数据的正态性。
因为成绩的数据量小于 5000,故采用 S-W 检验其正态性,显著性 P 值为 0.496,P 值大于 0.05,水平上不呈现显著性,不能拒绝原假设,因此数据满足正态分布。其峰度(-0.82)绝对值小于 10, 并且偏度(-0.027)绝对值小于 3,可以结合正态分布直方图、PP 图或者 QQ 图进行进一步分析。
输出结果 2:正态性检验直方图
图表说明:如图所示,图片基本呈现钟形(中间高,两端低)的形状,且其峰度绝对值小于 10,偏度绝对值小于 3,故可以认为其具有正态性,故我们可以采用独立样本 T 检验进行检验。
输出结果 3:方差齐性检验
图表说明:
因为独立样本 t 检验需要满足方差齐性,满足方差齐性的数据比较才具有意义,故我们进行方差齐性检验。
上表展示了方差齐性的结果,包括标准差、F 检验结果、显著性 P 值。方差齐性检验的结果显示, 对于成绩,显著性 P 值为 0.393,水平上不呈现显著性,不能拒绝原假设,因此数据满足方差齐性,可以采用独立样本 t 检验。
输出结果 4:独立样本 T 检验均值对比图
图表说明:上表展示了独立样本 T 检验的均值的结果,发现均值大致一致。
输出结果 5:独立样本 T 检验分析结果表
变量名 | 变量值 | 样本量 | 平均值 | 标准差 | t 值 | p 值(双尾) | 平均值差值 | Cohen's d 值 |
---|---|---|---|---|---|---|---|---|
成绩 | 一中 | 24 | 634.375 | 62.908 | 1.361 | 0.180 | 24.015 | 0.389 |
二中 | 25 | 610.36 | 60.597 | |||||
总计 | 49 | 622.122 | 62.285 |
图表说明:上表展示了独立样本 T 检验的结果,包括均值 ± 标准差的结果,t 检验结果,显著性 P 值、效应量 Cohen's d 值。
一中,二中在成绩上的均值分别为:634.375/610.36,基本差距不大。
T 检验结果 p 值为 0.18>=0.05,因此统计结果不显著,说明一中的学生和二中的学生的成绩上不存在显著差异。
且 Cohen's d 值为 0.389,差异幅度不算大。
# 7、注意事项
- 独立样本 T 检验仅仅支持呈现正态性的两分类样本,两分类样本数量可以不一样,如果超过三个分类,则采用方差分析。
- 独立样本 T 检验需要定量字段呈现正态性,若不呈现正态性则需要采用非参数检验,如两两配对时采用 MannWhitney U 检验。
- 独立样本 T 检验需要满足方差齐性,如果不满足可以使用非参数模型,或者使用 SPSSPRO 的数据处理方法将其对数化,检查是否可以转为方差齐性。
- 各差异性分析模型的使用场景如下总结:
# 8、模型理论
独立样本 t 检验是比较两组数据之间的差异,有无统计学意义,其前提是,两组数据来自正态分布的群体,数据的方差齐,满足独立性。独立样本 t 检验(各实验处理组之间毫无相关存在,即为独立样本),该检验用于检验两组非相关样本被试所获得的数据的差异性。其步骤如下:
step1 假设:
零假设:独立样本 A 和独立样本 B 无差别,即 A 平均值=B 平均值。
备选假设:A 和 B 有差别,也就是 A 平均值不等于 B 平均值。
step2:抽样分布类型
独立样本 A 和独立样本 B 近似正态分布,故符合 t 分布条件。
step3:检验方向
备选假设是 A 和 B 有差别,不管大于还是小于,所以肯定是使用双尾检验。
step4:求解 T 值
基于当前零假设和当前样本,计算 t 值,通过 t 值及比该数值更极端的值出现的概率来代表抽到目前这个样本及更极端的样本的概率。
step5:计算样本量、自由度求解 p 值
独立样本 t 检验使用以下统计量:
S12 和 S22 为两样本方差;n1 和 n2 为两样本容量。
step6:求解均值置信区间
置信区间下限= 两个平均值差值 - t 值*标准误差
置信区间上限 = 两个平均值差值+ t 值*标准误差
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2]Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52.