对数线性模型
# 对数线性模型
# 1、作用
对数线性模型用于处理多个分类变量的关系,通过估计各个变量水平及交互水平的系数来检验各变量及其交互效应的作用大小;卡方分析只能通过列联表分析两个分类变量,对于多个分类变量无能为力,由此建议使用对数线性模型。
# 2、输入输出描述
输入:一个或多个的定类变量以及可选的协变量。
输出:预测频数和实际频数的差异以及各个变量水平对频数的影响。
# 3、案例示例
案例:某公司的员工的基本信息:学历、文科理科、收入水平,使用对数线性模型对这三个变量的关系进行分析。
# 4、案例数据
对数线性模型案例数据
# 5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【对数线性模型】;
step5:查看对应的数据数据格式,按照【对数线性模型】要求拖入变量;
step6:设置主效应和交互项;
step7:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果1:拟合优度检验
值 | 自由度 | P | |
---|---|---|---|
似然比 | 13.606 | 11 | 0.256 |
皮尔逊卡方 | 10.839 | 11 | 0.457 |
图表说明:上表展示了拟合优度检验结果。
● 若当检验结果P≥0.05时,说明模型拟合较好,数据预测频数接近观测频数,结果准确性强。
● 但如果检验结果P<0.05,就说明模型拟合程度不好,提示应适当调整模型,重新进行对数线性分析。
以上结果拟合优度检验P=0.256,不呈现显著性,说明模型拟合较好,数据预测频数接近观测频数。
输出结果2:效应值估计
图表说明:上表展示了各个水平的效应值。效应值代表水平对因变量的频数的影响系数;
输出结果3:实际统计与期望统计
图表说明:上表展示了各个分类变量水平组合的实际频数、预测频数及其占总样本例数的比例,实际频数与预测频数越接近,说明该模型拟合得越好。
# 7、注意事项
输出结果2效应值估计可能会缺少分类水平,这是由于模型中涉及到泊松回归模型,待分析项作为定类自变量,会按照哑变量进行处理,n个分类水平会有(n-1)个哑变量;比如学历:小学、初中、高中、本科,处理之后会有1个水平作为基准项,最终只保留三个分类水平。
# 8、模型理论
对数线性模型是线性模型的一种扩展形式,它采用了对数函数来建模因变量的期望和自变量之间的关系。其形式如下:
其中,λi 是第 i 个观测的期望计数。这个数值需要对分类变量进行频数统计,然后将频数作为因变量,待分析变量为自变量建立泊松回归模型。
模型的参数_β_0,_β_1,…,βk 可以通过最大似然估计等方法估计得到,它们的解释与普通线性模型相似,表示因变量对自变量的影响。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.