列联(交叉)分析
# 列联(交叉)分析
# 1、作用
列联分析,也称为交叉分析(Cross-tabulation Analysis),是一种统计分析方法,用于探索和描述两个或多个分类变量之间的关系。它通常通过制作交叉表(Cross-tabulation Table)来展示不同变量之间的关联性和分布情况。
其应用广泛,例如在市场调研中,用于分析不同消费者群体对产品偏好的差异;在医学研究中,用于探索不同治疗方法在不同人群中的效果;在社会科学研究中,用于分析社会群体中不同特征的分布和关联。
# 2、输入输出描述
输入:一个定类变量X与一个或者多个字段Y。
输出:两两分组变量之间的交叉分布情况。
# 3、案例示例
案例:不同地区(城市/农村)和性别的同学在玩电脑游戏的分布状况。
# 4、案例数据
列联(交叉)分析算法案例数据
一个定类变量X与一个或者多个字段Y指的是:定类变量X(性别)作为分组变量,多个字段Y(地区/玩电脑游戏情况)指的是待分析变量。若输入多个定类/定量变量,则为以已经拖入的分组变量对多个定类/定量变量重复分析。
# 5、案例操作
Step1:新建分析;
Step2:上传文件;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
Step4:选择【列联(交叉)分析】;
Step5:查看对应的数据数据格式,【列联(交叉)分析】要求输入数据一项为定量变量,其他定量/定类变量,选择对应分析类型(当变量为定量变量时,会自动进行四分位分组);
Step6:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果 1:列联表
图表说明:上表展示了以性别为分组项,以地区、玩电脑游戏情况为分析项的列联交叉分析结果,包括变量、频数、百分比等,需要注意的是:
- 若交叉表过大(列超过15项),请点击右上角下载按钮导出查看;
- 若分析项为定量变量(样本量N≥8),系统默认以四分位进行分组,若想生成更多分组,请使用数据处理—>数据编码;
- 若想分析基于分组项下,各分析项是否存在差异以及程度,可以选择卡方分析。
结果分析:由图可见,一周玩电脑游戏 4 个小时以上的同学占比最多。
且虽然女性本身数量比男性多约百分之十,但是男女玩游戏情况比例差距不大,可认为男同学稍微更热衷于电脑游戏。而来自城市的同学比来自农村的同学多出很多,城市和农村内部的男女比例则基本跟总的男女比例一致。
输出结果 2:交叉图
图表说明:上图展示了列联交叉分析结果,包括变量、频数、百分比等。
# 7、注意事项
- 若分析项为定量变量,SPSSPPRO 默认以四分位进行分组,若想生成更多分组,请使用数据处理—>数据编码。
- 若想分析基于分组项下,各分析项是否存在差异以及程度,可以选择卡方分析。
# 8、模型理论
列联表(contingency table) 将一个或多个变量的每个取值分别列出,并统计另一个或多个变量在每个取值下的频数或频率。
一般,若总体中的个体可按两个属性
列联表的行和列分别代表不同的变量和它们的取值,交汇处的数据则表示对应组合的频数或频率。
当我们在使用列联分析时,还可以结合其他统计检验方法,如卡方检验(Chi-square Test),来评估变量之间的关系是否显著。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2] 贾俊平、何晓群、金勇.统计学(第四版):中国人民大学出版社,2009 年:246
[3] 胡良平, 陶丽新. R×C 列联表资料的统计分析与 SAS 软件实现(一)[J]. Journal of Integrative Medicine(结合医学学报(英文)), 2009, 7(08):784-787.