熵值法
# 1、作用
熵值法根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,其信息熵值越小,指标的离散程度越大, 该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。因此,可利用信息熵这个工具,计算出各个指标的权重,为多指标综合评价提供依据。
# 2、输入输出描述
输入:至少两项或以上的定量变量(可以做正、负向处理,但是不要做标准化)。
输出:输入定量变量对应的权重值
# 3、案例示例
案例:数据是 100 个客户的各方面(能力,品格,担保,资本,环境)评分,利用熵值法来计算各个变量(能力,品格,担保,资本,环境)的重要性,即所占的权重。
(注意:若是各个指标之间的单位和量级(即计量指标的数量级)不同,在进行分析前需要自行对数据进行归一化)
# 4、案例数据
# 5、案例操作
Step1:新建分析;
Step2:上传数据;
Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;
step4:选择【熵值法】;
step5:查看对应的数据数据格式,【熵值法】要求特征序列为定量变量,分为正向指标变量和负向指标变量,且正向指标变量和负向指标变量的个数之和大于等于两项。
step6:点击【开始分析】,完成全部操作。
# 6、输出结果分析
输出结果 1:权重分析计算结果
图表说明:熵值法的权重计算结果显示,能力的权重为10.484%、品格的权重为19.313%、担保的权重为28.014%、资本的权重为18.062%、环境的权重为24.128%,其中指标权重最大值为担保 (28.014%),最小值为能力 (10.484%)。
输出结果 2:指标重要度直方图
图表说明:上图以直方图形式展示了指标的重要度排序(降序)。
输出结果 3:综合得分表
图表说明:上表格为综合得分。
# 7、注意事项
- SPSSPRO默认会对指标进行正、负向指标处理,通过处理,数据就无需再进一行标准化;
- 熵值法的计算公式上会有取对数,因此如果小于等于 0 的数字取对数,则会出现 null 值,系统采用非负平移进行处理,即如果某列(某指标)数据出现小于等于 0,则让该列数据同时加上一个‘平移值’【该值为某列数据最小值的绝对值+0.01】,以便让数据全部都大于 0,因而满足算法要求。
# 8、模型理论
熵是信息论中的概念,是对不确定性的一种度量。信息量越大,不确定性越小,熵就越小;信息量越小,不确定性越大,熵也越大。根据信息熵的定义,对于某项指标可用熵值来判断某个指标的离散 程度,其熵值越小,指标的离散程度越大,该指标对综合评价的影响(即权重)也越大。
其步骤为:
(1) 对各个因素按照每个选项的数量进行归一化处理
由于平台存在“正向指标”、“负向指标”,将分别对这两类数据做预处理 。这里对最小值减去0.0001,对最大值加上0.0001是为了兼容一整列都为相同的值的情况,对整体结果影响不大,可忽略不计
对于正向指标:
对于负向指标:
(2) 计算第J项指标的熵值
(3) 计算信息熵冗余度(差异):
(4) 计算各项指标的权重:
(5) 计算各样本的综合得分:
其中,Xij为归一化后的数据。根据每个影响因素的得分,即可得到所有因素的重要性排序。
# 9、参考文献
[1] Scientific Platform Serving for Statistics Professional 2021. SPSSPRO. (Version 1.0.11)[Online Application Software]. Retrieved from https://www.spsspro.com.
[2] 甘浪雄,张怀志,卢天赋,等. 基于熵权法的水上交通安全因素[J]. 中国航海,2021,44(2):53-58.