熵权法

熵的概念：

数据全面，但缺少文献或主观依据的题目
- 例如，评价河流的水质，已知河流的含氧量、pH值、细菌密度、生物密度等数据
- 但缺乏评价水质的文献资料，或者文献内的说法不一
- 即文献很难帮助我们确定影响水质最重要的因素是哪一个，也很难告诉我们其余指标的重要程度如何衡量
- 此时即可使用熵权法，根据数据本身建立评价体系

1.数据标准化

标准化的原因：

正向指标标准化：

$ a_{ij} = \frac{ x_{ij}- \min(x_{1j},…,x_{nj} )}{\max(x_{1j},…,x_{nj})-\min(x_{1j},…,x_{nj})} $

负向指标标准化：

$ a_{ij} = \frac{ \max(x_{1j},…,x_{nj}) - x_{ij} }{\max(x_{1j},…,x_{nj})-\min(x_{1j},…,x_{nj})} $

不难发现，标准化之后，$a_{ij}$ 所有值在 $[0,1] $ 区间之内，且都是数值越大、现实意义越好。

2.指标的熵值和变异程度

①每个评价对象在各个指标中的比重：

②熵值

对于第 $i$ 个指标，其熵值 $e_j$ 为：

$e_j = -\frac{1}{\ln n} \sum_{i=1}^{n} p_{ij} \ln p_{ij}$

③变异系数

3.权重与评分

变异系数求权重

综合评分