基金项目:西安市科学基金项目(SF1232-5)
通讯作者:李军民(1959-),男,陕西西安人,教授,E-mail:ljmfyy@vip.sina.com
(College of Computer Science and Engineering,Xi'an University of Science and Technology,Xi'an 710054,China)
environmental quality; principal component analysis; eigenvalues; comprehensive evaluation
DOI: 10.13800/j.cnki.xakjdxxb.2016.0324
According to the environmental quality monitoring and statistics of the 31 regions in China in 2011 and 2012,this article uses principal component analysis method to screen the four principal component factor,with 13 secondary indicators specific data as sample factor.Using the proportion of the eigenvalues of the each principal component to the total as the weight,to get an evaluation model of regional environment quality,and then to evaluate the environment quality level of the regions.The results show that the distribution of environmental quality among different regions is unbalanced with obvious difference; the comprehensive environmental quality in the western region is the best,the eastern and northeastern regions are slightly lower than the national average level,and the central region is the worst.It is also indicated that the method is basically consistent with the evaluation results of other methods.It can be used to evaluate the regional environment quality.And the process is simple and easy to operate.
环境质量是一个地区生态环境、空气质量、环境治理及公共绿化设施等的综合体现。创建良好的城市环境,是一项涉及面宽、工作量大的系统工程,也是一项复杂而艰巨的工作,但是对其研究又有一定的实用价值。环境质量是环境系统客观存在的一种本质属性,并能用定性和定量的方法加以描述的环境系统所处的状态。环境始终处于不停的运动和变化之中,所以环境质量也是处于不停的运动和变化之中,由于人类的生活、生产行为和自然的原因都会引起环境质量的变化,通过环境质量评价可以反映部分变化。
环境质量评价概念是从环境卫生学角度按一定评价标准和评价方法对一定区域范围内的环境质量加以调查研究并在此基础上作出科学、客观和定量的评定和预测。通过环境评价可以揭示环境质量状况及其变化趋势,找出污染治理的重点对象,为环境规划和环境综合治理方案提供依据。因此,迫切需要建立一个科学、合理且简便易行的综合评价方法,来评价与衡量各地区的环境质量综合水平及差距。
在综合评价分析环境质量状况时,常常涉及到众多指标变量,有些指标变量就会被其他变量的信息所掩盖,出现信息重叠,这样会丢失一些重要信息,影响研究对象的本质和准确性[1-3]。目前,常用的环境质量综合评价的方法有单元面积法、指数法、模糊综合评价法、灰色数学法、神经网络法、动态评价法等等[4-6]。虽然这些方法都能用于环境质量的评价,但上述方法会存在计算量大过程复杂、信息重叠的问题。文中采用主成分分析法,首先从多个指标变量中去除有相关性的变量因子,筛选出少数独立的,但却能代表大部分信息的主成分因子,然后以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重,得到各地区的环境质量评价模型,进而对各地区环境质量综合水平进行评价。
影响环境质量评价的因素有很多,为了科学合理地进行环境质量水平评价,全面真实地反映各地区城市环境质量现状并进行比较,文中依据2012,2013年《中国统计年鉴》[7-8]的数据(数据量较大,没有列出),主要从31个省域的生态环境、环境污染、污染物处理3个方面具体选取了3个一级指标,13个二级指标,来研究各地区环境质量水平,评价指标体系见表1.
为了使主成分分析具有的客观性和科学性,文中对指标做了处理
1)正向指标保持不变。正向指标是指标值越大对城市环境质量评价越有利的指标,在分析时不需要对其做处理。正向指标有:城市绿地面积、林地面积、森林覆盖率、生活垃圾无害化处理率、城市污水日处理能力、工业固体废物综合利用率;
2)逆向指标的同向化。逆向指标:二氧化硫、氮氧化物、烟(粉)尘排放量、废水排放总量、工业固体废物产生量、生活垃圾清运量、化肥施用量。采取最大值减逆向指标数值的方法对逆向指标进行同向化处理。
由于各指标的单位不同,量纲不统一,数量上有很大差异,为了使主成分分析能够消除量纲和数量级的影响,将原始数据进行标准化,将其转化为均值为0,方差为1的无量纲数据[9-11]。对数据进行z-score标准化处理,将省份j对应的环境指标Xi的原始值Xij使用z-score标准化为X*ij.
X*ij=(Xij-(-overX))/S,i=1,2,…,13; j=1,2,…,n.
其中均值(-overX)=1/nnj=1Xij,标准差为S=(1/(n-1)nj=1(Xij-(-overX))2)1/2,文中有31个省份n=31.
数据标准化处理后,对2011,2012年变量之间的相关程度进行检验,计算其相关系数矩阵,2 a的相关系数矩阵都不是一个单位阵,并且各系数矩阵的数据表明各项指标的相关性比较大,说明可以用主成分分析来进行研究。然后进行KMO检验和球形Bartlett检验[12],进一步判断样本数据是否适用于主成分分析法。在采用Bartlett对数据进行检验时,如果KMO值>0.5,且P<0.05(P为Bartlett球体检验的χ2统计值的显著性概率),说明可以运用主成分因子分析方法来对指标进行分析。根据分析可知,文中选定的各项指标2011,2012年的KMO值分别为0.723,0.692,且P<0.05,因此可以对所选数据的因子进行主成分分析。
由于多个变量存在一定的相关性,可能会出现信息的重叠,使用主成分分析法,用较少的变量来代替较多的变量,并可以反映多个变量的大部分信息。主成分分析是考察多个变量间的相关性,是研究如何通过少数几个主成分来解释原变量间的内部关系结构,其数学模型是:设p个指标变量构成的p维随机向量为X=(X1,…,Xp)'.对X作正交变换,令Y=T'X,其中T为正交矩阵,要求Y的各个分量是不相关的,并且Y的第一个分量的方差是最大的,第二个分量的方差次之,……[13]; 文中采用主成分分析法来研究地区环境质量的综合评价。设由累积方差贡献率确定主成分个数为m,指标变量的个数为p,研究对象的个数为q,则其各主成分的表达式为
Yn,j=Tn,iX*i,j,(n=1,2,…,m; i=1,2,…,p; j=1,2,…,q).
其中Yn,j为第j个省份对应的第n个主成分; Tn,i为第n个特征向量的第i个元素,是利用因子载荷矩阵和相关系数矩阵的特征根计算的特征向量,做权重系数。X*i,j为原始变量标准化后的值。由因子载荷阵计算出特征向量矩阵,以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重计算,得各省份环境影响竞争力综合模型
Yj=mn=1(λn)/(mn=1λn)Yn,j,(j=1,2,…,31).
其中Yj是第j个省份的综合评价函数; λn是第n个主成分对应的特征值。
由于这13个指标变量可能存在一定的相关性,会出现信息的重叠,因此首先用主成分法提取几个公共因子来反映原变量的大部分信息。具体分析2011年的数据,由上节知,已经对数据进行了标准化处理和相关性检验。下面利用BartlettS19.0统计软件进行主成分分析,得出特征值和方差贡献率,见表2.
表2 主成分对应的特征值和方差贡献率
Tab.2 Eigenvalues and cumulative variance contribution ratio of the principal components
特征值以1为标准,如果主成分对应的特征值小于1,说明这个主成分的影响力度不如一个基本的变量,主成分大于1说明它在变量中占据重要地位。从表2可以看出,前4个主成分的特征值都大于1,从第5个特征值开始下降较快,且前4个主成分累计贡献率就达到了85.664%,因此提取出4个主成分因子便可以反映原变量的大部分信息,由Yn,j=Tn,iX*i,j,计算出4个主成分因子向量:Y1,j,Y2,j,Y3,j,Y4,j(n=1,2,…,4; i=1,2,…,13; j=1,2,…,31),这4个因子是13个原变量因子的线性组合,并尽可能多地保留原来指标变量的信息,且彼此间不相关。
利用主成分分析法得到的部分省份环境质量综合评价模型公式Yj=4n=1(λn)/(4n=1λn)Yn,j(其中λ1=5.606,λ2=2.989,λ3=1.354,λ4=1.187是4个主成分对应的特征值,Yn,j是计算出的主成分向量),分别计算出2011,2012年各省环境质量的综合评价指数Yj(j=1,2,…,31),由于在进行主成分分析时,对数据作了标准化处理,把各个标价指标的平均水平当作零来处理,所以Y的大小只表示环境质量程度的大小,结果见表3.
表3 2011,2012年部分地区环境质量
主成分分析综合评价指数值
Tab.3 Comprehensive evaluation index of principal component analysis to regional environment quality in 2011 and 2012
1)在样本区间内2012年环境质量较好的省份(评价指数排名前10位)依次为:海南、西藏、北京、天津、上海、重庆、福建、青海、宁夏、吉林。最差的省份(评价指数排名后5位)为:内蒙古、山西、河南、山东、河北;
2)不同地区之间环境质量分布很不均衡。有近一半的地区环境质量评价指数集中在0~1之间,整体上看得分都比较分散,而且呈现偏态分布。各省份间的差距也比较明显,2011年靠前的11个省份的平均评价指数为1.18,中间的10个省份的平均评价指数为0.25,靠后的10个省份平均评价指数为-1.26,比差为1:0.21:-1.07,2012年的比差为1:0.20:-1.30; 2011年与2012年相比评价指数相对稳定;
3)从全国区域间环境质量评价指数来看,2011年全国4大区域环境质量的平均评价指数为:东部地区-0.31,中部地区-0.55,西部地区0.56,东北地区-0.11,比差为-0.55:-0.98:1:-0.2,2012年比差为-0.01:-1.68:1:-0.11.2年数据都显示,西部地区的综合环境质量最好,东部和东北地区略低于全国均值水平,中部地区最差。环境评价指数靠后的10个省份中,中东部省份占到7~8个(其中,东部4个,中部3~4个)。
将文中计算的2011,2012年地区综合环境质量评价结果与文献[14]中的结果做对比(图1,图2)结果显示,总体上排名趋势一致,统计曲线基本吻合,误差较小。2 a数据都显示,西部地区的综合环境质量最好,东部和东北地区略低于全国均值水平,中部地区最差,与文献[14]结果一致。文中2011年综合环境质量排序前十名:海南、北京、青海、天津、宁夏、福建、重庆、甘肃、上海、江西,除了江西以外,其余9个省份和文献[14]中的一致,排序后十位(评价指数排序在21~30位的省份):湖北、安徽、内蒙古、辽宁、山西、广东、河南、江苏、河北、山东,与文献[14]完全一致; 文中2012年综合环境质量排序前10名:海南、北京、天津、上海、重庆、福建、青海、宁夏、吉林、江西,除了江西以外,其余9个省份和文献[14]中的一致,排序后十位:安徽、新疆、广东、辽宁、江苏、内蒙古、山西、河南、山东、河北,除了新疆以外,其余9省份与文献[14]完全一致。综上所述,说明文中所采用的方法与文献[14]中的结果基本一致,可以达到评价地区综合环境质量的目的,并且过程简单易操作,是一种较好的评价方法。
根据2012年中国环境保护数据库中的数据显示,空气质量排名前3的是海南、西藏、福建的省会城市(海口、拉萨、福州),评价中这些地区环境质量排名也是靠前的; 从历年中国31个省市区(除台湾和港澳地区)的环境污染治理投资总额的数据显示,环境污染治理投资总额持续增加,在2013年治理投资排名靠前的是山东、江苏、河北、内蒙古,这些地区在文中2012年的环境质量综合评价指数都相对较低,因此表现出在2013年环境污染治理投资力度大,以上相关部门的数据也都与文中的评价结果一致。
1)通过对中国 31个地区的生态环境、环境污染、污染物处理3个方面进行系统的研究,将复杂的信息简单化,通过分析建立相关的综合评价模型,对中国各地区环境质量状况做了评价分析,也取得了较好的评价结果。对地区环境质量的研究有助于各地区探索既能保护生态环境,又能符合自身经济快速发展的道路,以改善环境质量。评价结果也启示各地区要继续增强环境保护意识,加快转变经济发展形式,把节能减排作为经济发展的约束指标; 要控制污染物排放,以改善大气环境质量优化经济增长,以科学发展来提升环境保护水平; 将新的科学技术应用到环境优化上,产研结合,用新能源技术改造传统产业,开发清洁环保产品,构建低耗环保的生产方式和生活模式; 增加环境保护投入,拓宽城市绿化资金来源,提高环境管理能力和资源利用率; 积极提倡环保出行,增强公民环保理念,自觉维护公共环境,以人为本,实现环境和经济协调发展,从而使环境质量得到显著提升;
2)同时,因为注意到环境质量的评价因素是很多的,对其界定与研究是个系统而又繁杂的工程,涉及到诸多的因素与条件。文中对地区生态环境、环境污染、污染物处理的研究也存在诸多不足,如在指标选取的全面性、分类界定的普适性、环境的独特性等方面还存在着较大的改进之处,这也是本研究今后需要进一步努力的方向。