浅析基于粗糙集神经网络的企业财务风险
摘要:本文在对企业财务风险的涵义和特点进行分析的基础上,提出了一种基于粗糙集BP神经网络预测方法。该方法克服了单纯的BP神经网络方法因为数据量太大、处理速度慢、解释能力差等缺点。结果表明,与传统的logistic回归模型相比,粗糙集——神经网络系统对检验样本预测精度更高,是一种更为有效和实用的分类方法。
关键词:粗糙集 BP神经网络 信用风险 logistic
一、问题的提出
信贷风险是商业银行面临的主要风险。商业银行作为现代金融体系的主体部分,其信贷风险管理水平将对国家经济安全产生直接的影响。目前,我国对信贷风险的管理与量化研究尚处在起步阶段,在理论上尚有许多问题值得探讨。
从国内外信用风险模型的应用来看,主要流行实用的方法要数多元判别模型、Logistic回归模型和神经网络模型。王春峰,万海晖,张维等人(1998)应用多元线性判别模型对某国有商业银行的企业客户短期贷款的偿还情况的分类分析;Logistic回归模型方面,Ohlson首先将Logistic回归模型LR应用于信用风险评估领域,此外神经网络作为人工智能的一种分类方法,也应用于信用风险评估的领域,Chen and Huang(2003)实证认为神经网络相对优越于线性判别分析法。Huang andHsnchun(2004)通过对美国和台湾银行信贷数据对信用评级分析发现,采用神经网络对信用等级的预测准确率达到 80%,但对不同地区的样本,变量会不同。
信用风险受多种因素影响,单纯的线性模型难以实现准确分类,人工神经网络技术具有高度的非线性,能够进行复杂的逻辑操作和实现复杂的非线性关系,但是输入维数的确定及解释能力上还有诸多不足。本文利用粗糙集理论对神经网络的输入进行预处理,利用知识约简的方法对财务指标进行重要度的提取,消除冗余信息,降低了神经网络的输入维数,缩减了网络训练时间,增加了模型的解释能力。
二、粗糙集理论——BP神经网络
(一)粗糙集
1.知识表达系统。粗糙集理论的要点是将知识与分类联系在一起。一个知识表达系统定义为:
S= (1)
该式中,U是对象的集合,C∪D=R是属性集合(等价关系集合),子集C和D分别称为条件属性和结果属性,V=∪a∈AVa是属性集的集合,Va表示了属性a∈A的范围,f:U×A→V是一个信息函数,它指定U中的每一对象x的属性值。
2.不可分辨关系和边界。若P∈R,且P≠?椎,则∩P(P中全部等价关系的交集)也是一种等价关系,称为P上的不可分辨关系,且记为:
ind(P):[X]ind(P) =∩[X]R P R (2)
设给定知识库,对于每个子集和一个等价关系,可以根据基本集合描述来划分集合:
R_(X)=∪{Y∈U/R:Y X} (3)
Rˉ(X)=∪{Y∈U/R:Y∩X≠?椎} (4)
BNR(X)= Rˉ(X)-R_(X) (5)
上式中,R_(X)和Rˉ(X)分别称为X的R近似和上近似,BNR(X)称为X的R边界。显然,当BNR(X)≠?椎时,X是一个不确定的概念。
令card为该集合的基数,且X≠?椎,则将从U中划分的一个子集合X的不确定程度定义为粗糙度,即
μr(x,X)=card([x]R∩X)/card([x]R) (6)
3.知识约简。对于一个给定的决策系统S,条件属性集合C的约简是C的一个非空子集C',它满足:
(1)ind(C',{d})=ind(C,{d}) (7)
(2)不存在C''∈C',使ind(C'',{d})=ind(C,{d}) (8)
C的所有约简的集合记作REDD(C)。C的所有约简的交集叫作核(CORE),记作
CORED(C)=∩REDD(C) (9)
根据约简和核的概念,粗糙集理论提供了分析多余属性的方法,对知识的处理是通过对决策表中的属性值的处理实现的。具体步骤如下:(1)删除重复的实例;(2)删除多余的属性;(3)删除每个实例多余的属性值;(4)求出最小约简;(5)根据最小约简,求出逻辑规则。
(二)BP神经网络
BP(Back Propagation)神经网络模型即误差反向传播神经网络是目前应用最为广泛的一种神经网络模型,体现了人工神经网络最精华的部分。BP网络可看作是一个从输入到输出的高度非线性映射,它通过对简单的非线性函数进行多次拟合,可逼近复杂的高度非线性函数。
1.BP神经网络。BP 神经网络是目前发展比较成熟的一种人工神经网络,它由一个输入层、一个输出层以及一个或多个隐含层组成,每一层可以有若干个节点,常见为3 层BP 网络。BP网络的学习训练过程由网络输入信号正向传播和误差信号反向传播两部分组成,经过反复学习直至样本总误差达到某个精度要求,即E<ε,ε为预先设定的精度。样本误差:
E=■■(yk-ck)2 (10)
其中,yk为网络期望输出,ck为网络实际输出,m为样本学习个数。BP网络的结构如图1所示:
(图略)
2.BP神经网络建模步骤。对神经网络进行训练,利用神经网络的函数逼近特性,实现预测值和实际值的最佳拟合。具体建模步骤为:
(1)权值和阀值的初始化。将BP网络各层之间的初始连接权值ωij(0)和阀值θj(0)随机的赋以[0,1]区间的值。
(2)输入学习样本。将粗糙集筛选过的10组财务指标为BP神经网络的输入向量,标示ST和非ST的0-1变量作为BP神经网络的输出向量。
(3)确定网络结构。根据经验公式
p=(0.43r2+0.12s2+2.54r+0.77s)0.5+0.51 (11)
或Hornk经验公式
p∈[(2r+s)0.5,(2r+s)] (12)
确定隐藏节点的个数,一般认为有经验公式确定的隐藏节点数的中位值,在此基础之上增减P值以确定最优的隐藏节点数。设r和s分别为输入层、输出层节点数。
(4)选择网络函数。网络的激活函数为Sigmoid函数:f(x)=1/[1+exp(-x)],其极限值为0-1之间。通过选用的Sigmoid函数计算隐含节点间的权重矩阵以及网络的输出:
Opj=fj(netpj)=fj(■ωijopj)-θj (13)
(5)样本误差控制。
输出层误差:δpj=opj(1-opj)(tpj-opj) (14)
隐藏层误差:δpj=opj(1-opj)■δpjωjt (15)
在样本训练的同时对权值和阀值进行修正,修正公式为:
ωij(n+1)=ωij(n)+ηδpjopj+α[ωij(n)-ωij(n-1)] (16)
θij(n+1)=θij(n)+ηδpjopj+α[θij(n)-θij(n-1)] (17)
η和α是学习参数,可以事先给定。样本误差,E=■■(tRj-oRj)2,其中tRj为目标输出。控制样本误差,当训练样本所得的误差小于给定误差时则训练停止输出训练结果。否则继续训练样本。
三、实证研究过程及结果分析
(一)样本的选取
本文是以我国A股市场的上市公司为研究对象,数据来源于国泰安的CSMAR系列研究数据库。将公司因财务状况异常而被特别处理(ST)作为陷入财务危机的标志,标记为“0”,非ST的标记为“1”。从2006年的上市公司中选出1 422家,剔除财务数据有问题的上市公司,最终确定为931家。其中620家作为训练样本,用来训练网络,剩下的三分之一共311家作为预测样本,来检验模型的预测能力。
(二)财务指标的筛选
在借鉴前人研究成果的基础上,本文分别从营运能力、盈利能力、负债水平、偿债能力、风险水平和发展能力六个方面初步选取了22个财务指标作为研究变量。
利用粗糙集理论,通过对决策表中的冗余属性值进行约化处理,经过进一步筛选,最终保留的财务指标为:流动资产周转率、固定资产周转率、营业毛利率、资产负债率、利息保障倍数、营运资金对资产总额比率、资本积累率、固定资产增长率和净利润增长率。
(三)模型的建立及结果
在神经网络输入层单元节点数的选择上,是依据粗糙集约简后的10个财务指标为基准。首先对输入数据进行标准化变换,最小的训练速率为0.1,动量参数为0.6,Sigmoid参数为0.8,最大迭代次数为1 000。由Hornk经验公式确定隐藏节点的个数的区间,从中挑选精度最高的隐藏层神经元的个数,最终确定网络结构为10-17-1,即有一个隐藏层和17个隐藏神经元BP网络结构。待训练稳定后,在该网络结构下,输入待预测的311个上市公司的财务数据,以此来甄别ST和非ST,得出的预测值与实际值极为接近,限于篇幅,本文只选取了前10个进行说明,如下页表2。
在测试样本中,ST的一共有30家,非ST的有281家,基于传统的logistic回归模型,虽然非ST组全部甄别正确,而ST组全部判断错误,综合准确率为90.4%,误判率为9.6%,但将ST的误判为非ST后果较为严重。
而基于粗糙集神经网络的预测方法,把ST误判为非ST的有2家,把非ST误判为ST的有5家,综合准确率达到了97.5%,可见基于粗糙集和神经网络的预测精度之高。见表3。
四、结论
本文把粗糙集理论和神经网络技术应用商业银行信贷风险的研究中,利用粗糙集理论的数据挖掘能力,对神经网络输入端的财务指标进行属性约简,大大降低了数据维数,提高了研究效率。而人工神经网络技术具有高度的非线性,能够进行复杂的逻辑操作和实现复杂的非线性关系,通过粗糙集预处理的财务指标作为神经网络的输入层,不仅大大简化了网络模型的结构,提高了模型的预测精度,而且也增强了神经网络结构的解释能力。实证分析部分表明,与传统的logistic回归模型相比,粗糙集—神经网络系统对检验样本预测精度更高,是一种更为有效和实用的分类方法。
我国银行业对信贷风险评估和管理的整体水平还很低,不同银行管理机构对信贷风险评估和管理的差异也比较大,因此借鉴国际银行业先进的信贷风险评估和管理方法的同时,基于粗糙集和神经网络的风险评估,也为信贷管理模型化提供了一种新的思路。J
参考文献:
1.王春峰,万海晖,张维.商业银行信用风险评估及其实证研究[J].管理科学学报,1998,(1).
2.Ohlson J. Financial rations and the probabilistic prediction of bankruptcy.J.1980.
3.Chen,Mu-Chen,Huang,Shih-Hsien.Credit scoring and rejected instances reassigning. 2003.
4.through evolutionary computation techniques.
5.Zan Huang,Hsnchun Chen,Chia-Jung Hsu,etc.Credit Rating Analysis with Support Vector.2004.
6.Machines and Neural Networks:A Market Comparative Study.