基金项目:国家自然科学基金(51404189,51404190); 陕西省自然科学基础研究计划(2015JQ51191)
通信作者:徐 刚(1981-),男,河南南阳人,博士,副教授,E-mail:408247198@qq.com
(1.西安科技大学 安全科学与工程学院,陕西 西安 710054; 2.西安科技大学 西部矿井开采及灾害防治教育部重点实验室,陕西 西安 710054)
(1.College of Safety Science and Engineering,Xi'an University of Science and Technology,Xi'an 710054,China; 2.Key Laboratory of Western Mine Exploitation and Hazard Prevention,Ministry of Education,Xi'an University of Science and Technology,Xi'an 710054,China)
gas emission prediction; Factor Analysis; factor selection; BP neural network; network training
针对工作面瓦斯涌出量的影响因素众多且难以筛选的问题,提出了基于因子分析法与BP神经网络的工作面瓦斯涌出量预测方法。首先运用因子分析法对矿井瓦斯涌出量的影响因素降维处理,并筛选出3个主因子作为BP神经网络的输入端神经元,然后构建出基于BP神经网络的工作面瓦斯涌出量预测模型,并进行网络训练,最后对预测模型的可靠性进行检验。结果 表明:因子分析处理后变量作用在影响因子上的权重得到了重新分配,并且变量的维数得以减少,错综复杂的变量关系被优化成3个主因子之间的线性组合关系,使得BP神经网络模型预测的瓦斯涌出量结果更合理,精度更高; 工作面瓦斯涌出量预测值与实测值的相对误差均在5%以下,平均相对误差为3.25%,误差波动范围小,稳定性较好,为复杂因素影响下的工作面瓦斯涌出量预测提供了一条新的思路。
To solve the problem that the influence factors of gas emission in working face are numerous and difficult to screen,a prediction method of gas emission in facewas proposedbased on factor analysis method and BP neural network.Firstly,the factor analysis method was used to reduce the influence factors of mine gas emission with three main factors selected as the input neurons of BP neural network,and the prediction model of gas emission in working facewas constructedbased on BP Neural network with the network training carried out preformed.The reliability of the prediction model was finally tested.The results showed that the weight of the variable situated on the influence factor after factor analysis was redistributed,the dimension of the variable was reduced,and the complex variable relationship was optimized into alinear combination between the three main factors,which made the gas gushing result predicted by the BP neural network model more reasonable and the precision was higher.The relative error of the surface gas out prediction value and the measured value was below 5%,the average relative error was 3.25%,the error range was small,the stability was better,which provides a new way of thinking for the prediction of the surface gas gushing volume under the influence of complex factors.
瓦斯涌出量预测是以煤层瓦斯含量、自然因素和开采技术因素为基础,并结合不同的方法对工作面瓦斯涌出量进行预测。矿井瓦斯灾害不仅影响煤矿安全生产,而且威胁井下人员生命和矿井设施安全,针对以上问题国内外学者对瓦斯涌出量提出了不同的预测方法。中国最早在90年代提出了梯度预测法预测瓦斯涌出量; 1982年邓聚龙提出了灰色系统理论对矿井瓦斯涌出量预测[1]; 赫斯特于1965年提出R/S(Rescaled-range)分析法,该理论应用时间序列分析法预测瓦斯涌出量[2-3]; 1986年Rumelhart和McCelland的科学家小组提出BP网络(Back Propagation)模型,之后将BP神经网络模型应用于矿井瓦斯涌出预测[4]; 目前中国应用最广泛的是分源预测法,且已发展到实用化阶段[5]; 张子戌等提出瓦斯地质数学模型法对矿井瓦斯涌出量进行预测[6]。这些方法有各自的特点,但预测结果不能有效包含所有变量的信息,均是对瓦斯涌出量的影响因素进行量化而得到的结果,并且瓦斯涌出量一直处于动态变化过程,受诸多因素的影响,单一的瓦斯涌出量数据具有明显的波动性和信息不完全性[7]。
工作面瓦斯涌出量既是制定煤矿瓦斯灾害防治的重要依据,也是合理进行煤与瓦斯共采的关键参数[8]。由于我国煤层受多期构造影响,煤层瓦斯赋存规律极其复杂,导致影响瓦斯涌出的因素较多且影响程度存在较大差异,工作面回采过程中瓦斯涌出呈现出显著的不确定性、动态性和复杂性的特征[9],影响因素和瓦斯涌出量之间没有明确的影响关系,难以用确定的数学模型表示,给瓦斯涌出量的预测带来了巨大的困难。因子分析法是一种信息处理方法,它既可避免信息量的重复,又可避免权重确定的主观性,能将众多变量所载的信息浓缩并转存到主因子上,使分析结果具有客观性和唯一性[10]; 而BP神经网络具有强大的非线性函数逼近能力、自适应学习能力,对不确定性问题的处理和非线性系统的预测有明显的优势[11-13]。因此,文中将因子分析法与BP神经网络预测模型相耦合,首先对影响工作面瓦斯涌出量的因素降维处理并归类,然后提取出主因子,将提取出的主因子作为BP神经网络的输入端神经元[14],构建出矿井回采工作面瓦斯涌出量预测模型。该耦合模型可以充分利用各自的优势提高预测值的可靠性,对于科学合理地制定矿井瓦斯灾害防治措施具有重要意义。
因子分析法是一种从变量群中提取共性因子的统计技术,能对多维变量进行简化降维和自优化处理[15-16],能够在众多变量中找出隐藏的具有代表性的因子,将具有共性变量归入一个因子,从而以较少的几个因子反映原数据的大部分信息,从而达到合理解释变量的相关性和筛选变量的目的[17]。
建立如下因子分析法的数学模型
设有n个关于瓦斯涌出量的变量X1,X2,…,Xn,n个瓦斯涌出量的变量是由m个因子F1,F2,…,Fm和一个An×m阶因子载荷矩阵的乘积加上一个特殊因子ε(ε1,ε2,…,εn)组成(n≥m)[18],建立的因子分析数学模型为:Xn = An×m Fm+εn,即式(1)。
[X1
X2
Xn]=[a11 a12 … a1m
a21 a22 … a2m
an1 an2 … anm][F1
F2
Fm]+[ε1
ε2
εn](1)
F1,F2,…,Fm为m个公共因子,公共因子之间相互独立; 矩阵An×m称为因子载荷矩阵; anm表示第n个变量在第m个因子变量上的权重,模型中的特殊因子εn相对于式中主因子Fm影响很小,在实际研究中忽略不计。因子分析法的主要步骤如下[19]
为了消除各变量数量级的差异,使变量之间更具可比性,将数据标准化法处理,即Z-Score法,避免数量级给计算结果带来的影响。
因子分析前首先对样本数据进行标准化处理,然后对样本数据是否适用因子分析法进行检验。一般采用Kaiser-Meyer-Olkin检验和巴特莱特(Bartlettde)球形检验。适用性检验的判定依据是样本变量的KMO(Kaiser-Meyer-Olkin)度量值和显著性概率Sig值,当KMO值大于0.6且显著性概率Sig值小于0.01时,样本达到了显著性水平,样本矩阵间有共同因素存在,适合进行因子分析。
设Q为X=(X1,X2,…,Xn)'的协方差阵,Q的全部特征根为λ1≥λ2≥…≥λm≥0,标准正交特征向量为Ui(i = 1,2,…,m)[20]。
由于协方差矩阵Q为实对称矩阵,有标准正交特征向量构成的矩阵U=(u1,u2,…,um),使得U-1QU=Λ,也就是U'QU=Λ,故
Q=U[λ1 … 0
λ2
〖3〗
0〖4〗λm]U1(2)
当特殊因子方差等于0时,根据式(2)可求得载荷矩阵A,即
A=[(λ1)1/2u1,(λ2)1/2u2,…(λm)1/2um](3)
将载荷矩阵A的前k列向量作为因子载荷矩阵,且因子累积贡献率满足式(4)时可以确定出因子的个数。
∑ki=1λi/∑mi=1λi≥80%(4)
公因子提取选用主成分中的相关性矩阵分析法,公因子提取的目的是用提取出来的较少几个因子解释样本原始变量,较少几个因子的累积方差覆盖了原始数据超过80%的信息,减少了样本变量包含的重叠信息,使不同变量的因子归属更加清晰。
公因子旋转选用最大方差法。具体方法是对公式(5)中的正交矩阵Γ左乘载荷矩阵A,得到的新载荷矩阵B.即
B=AΓ(5)
[Γ]=[cosθ -sinθ
sinθ cosθ](6)
记B的第i行第j列元素为bij,则有
{bir=aircosθ+airsinθ
big=-aigsinθ+aigcosθ(7)
式中 θ为正交旋转角度,i=(1,2,…,p); r,j=(1,2,…,n)。
为了让矩阵B的结构简化,要求b2ir,b2ig2组数据尽可能地分散,分散程度用样本的方差(V1,V2,…,Vn)表示,并且应使正交旋转的角度θ满足式(8)条件
V1+V2+…+Vn=V=max(8)
当公共因子有m(m>2)个时,一般只能迭代求得正交矩阵Γ,便可得到满足因子旋转条件的正交矩阵Γ.
因子得分是由各因子方差贡献百分比与各因子系数乘积的线性组合表示[21]。计算因子得分目的是减少变量的维数,以便在进一步分析中用较少的因子代替原有变量进行数据建模,因子得分可采用下式得到
Fi=∑nj=1Cij·Xi(9)
式中 Fi为主因子(表3中成分i=1,2,3); Cij为因子得分系数(表5); Xi为原始变量的标准化值(FAC值)。
随着我国煤矿开采深度的不断增加,影响矿井瓦斯涌出量的因素越来越复杂,但其主要影响因素有自然因素和开采技术因素2部分组成。自然因素包括煤层与围岩瓦斯含量、煤层埋深、煤层厚度、顶底板岩性、地下水条件、工作面长度、大气压和温度等; 开采技术因素包括采煤方法、通风压力、回采速度、日产量、工作面风量和回采率等。
崔家沟煤矿位于陕西省焦坪矿区,在回采过程中由于地质条件复杂瓦斯涌出规律不明显,瓦斯涌出量忽高忽低,多元线性回归等预测方法难以有效的适用,严重影响煤矿的安全生产。因此拟采用因子分析法与BP神经网络对工作面瓦斯涌出量进行预测,提高预测的准确度,以采取针对性的瓦斯治理措施。经过对工作面瓦斯涌出量的影响因素分析,考虑到崔家沟煤矿的大气压力、温度、通风压力、工作面风量及工作面长度等影响因素基本保持不变,对工作面瓦斯涌出量影响较小,所以这几个因素在建模时忽略不计; 并且崔家沟煤矿煤层地质条件较好,工作面是厚煤层及特厚煤层,回采率变化较稳定,基本保持在85%左右,对瓦斯涌出量影响较小,在建模时忽略不计。最终确定出工作面的瓦斯涌出量与本煤层瓦斯含量、煤层厚度、煤层埋深、煤层倾角、日产量、邻近层瓦斯含量、煤层间距、回采速度等因素相关。通过分析矿井地质资料、矿井通风瓦斯报表及现场实测可得各相关影响因素的数据,用X1~X8分别为上述相关影响因素,X9为绝对瓦斯涌出量,可得瓦斯涌出量及其相关影响因素统计表(表1)。
SPSS 20 是大型一种数据处理及统计软件,内置有因子分析模块,可以对8个影响瓦斯涌出量的因素进行因子分析处理。因子分析前首先对原始数据进行标准化处理,然后根据因子分析法的具体步骤对样本数据进行分析,即可得到检验值表(表2)、特征值及累积方差统计表(表3)、旋转后成分统计表(表4)和因子得分系数统计表(表5)。
由表2可知,KMO(Kaiser-Meyer-Olkin)度量值为0.631>0.6,说明各样本变量之间具有较强的相关性。样本变量显著性概率Sig.值为0.000<0.01,说明样本数量充足,且KMO值和Sig值都符合要求,说明原始变量适合进行因子分析并能实现降维简化。
由表3可知,前3个主成分的特征值大于1,并保留了超过80% 原始变量携带的信息,较好的解释了变量之间的关系。现提取特征值大于1的成分作为影响因子,且前3个主成分的累计方差为81.842%>80%,而每个成分的方差所占比例为:45.206%,20.684%,15.951%,由此确定出前3个因子为所提取的3个影响因子。
由表4可知,通过因子旋转使因子的归属更加清晰。旋转后成分中主成分1集中体现了:本煤层瓦斯含量和邻近层瓦斯含量对瓦斯涌出量的影响; 将其解释为与瓦斯含量有关的影响因子; 主成分2集中体现了:煤层埋深、煤层倾角、煤层间距、回采速度对瓦斯涌出量的影响; 主成分3集中体现了:煤层厚度和日产量对瓦斯涌出量的影响。通过因子旋转将复杂无规律的影响因素分为3个主成分,减少了变量的维数。
由表5可知,经过因子分析后重新分配了变量作用在影响因子上的权重,降低了各指标之间的相关性,减少了相关性较差的变量对几个因子的同时影响,为瓦斯涌出量预测模型的建立奠定了基础。
由式(9)可得出因子得分式(10)。
F1=0.419X1+0.090X2-…-0.009X8
F2=-0.116X1-0.049X2+…+0.348X8
F3=-0.095X1+0.495X2+…-0.042X8(10)
根据经验公式建立模型为3-6-1三层BP神经网络模型,其中输入端神经元节点数为3个,将因子分析得出主因子F1,F2,F3作为BP神经网络模型的输入端神经元; 隐含层节神经元点数为6个; 输出端神经元节点数为1个,即矿井瓦斯涌出量值[22]。由式(10)计算出主因子F1,F2,F3总得分作为BP神经网络模型的输入端神经元(表6)。
采用MATLAB神经网络工具箱中traingdm()函数对样本数据进行训练。其中tansig()作为隐含层神经元的传递函数,purelin()作为输出端神经元传递函数[23]。所训练时模型主要参数设定为:学习速率为0.01,训练误差精度为0.000 1.将表6中X9的前14组瓦斯涌出量作为训练样本,后4组瓦斯涌出量作为检验样本,用训练好的BP神经网络模型对后4组瓦斯涌出量进行预测,经过1 500次训练后函数收敛,可得训练结果及相对误差(表7)和神经网络最佳训练成绩(图1)。
根据表1原始数据,用式(11)计算多元回归方程,使用Matlab软件得到煤层瓦斯含量与各影响因素之间的多元回归方程
y=a0+a1X1+a2X2+…+amXm(11)
X9=8.973+0.707X1-0.182X2-0.002X3+0.067X4-0.001X5-0.097X6-0.327X7+1.283X8
多元回归方程的决定系数R2=SSreg/SStotal.这里R2=0.688,可知该方程拟合较好,但精度不能满足工程要求。运用Matlab软件计算得到影响崔家沟煤矿2303工作面瓦斯涌出量的各因素相对误差结果(表7)。
表7 瓦斯涌出量预测值对比及误差分析
Table 7 Comparison and error analysis of gas emission forecast values m3·min-1
由表7可知,采用多元线性回归法预测的瓦斯涌出量平均误差为8.98%,最大误差达到13.4%.而因子分析法预测的瓦斯涌出量误差均在5%以下,平均误差为3.25%,有效地提高了预测精度; 综合对比2种方法,因子分析法对BP神经网络输入端变量进行了降维优化,预测值的可靠性较强,预测效果较好。
1)提出了一种将因子分析法与BP神经网络耦合的工作面瓦斯涌出量预测方法。经因子分析处理后变量的维数减少,变量之间相互影响的程度降低,变量作用在影响因子上的权重重新分配,使神经网络预测模型的收敛速度更快,为BP神经网络模型预测工作面瓦斯涌出量奠定了基础。
2)采用因子分析法与BP神经网络相结合的瓦斯涌出量预测模型对后4组瓦斯涌出量值进行了预测和误差分析。结果表明瓦斯涌出量预测值与实测值的相对误差均在5%以下,平均相对误差为3.25%,且误差波动范围小; 而采用多元线性回归法预测的瓦斯涌出量平均误差为8.98%,最大误差达到13.4%,误差波动范围较大,稳定性差。说明训练好的BP神经网络模型预测效果较好,因子分析法与BP神经网络相结合的工作面瓦斯涌出量预测方法是行之有效的。