利用数据挖掘技术分析上市公司财务状况
[摘 要] 利用数据挖掘技术中的聚类分析方法进行财务分析。选取几个核心的财务指标数据,利用SPSS分析软件对我国上市房地产公司进行聚类分析,将其分类,为投资者提供最佳的决策依据。
[关键词] 数据挖掘;聚类分析;财务分析
[中图分类号]F275[文献标识码]A[文章编号]1673-0194(2009)03-0030-03
1 数据挖掘技术
从商业角度来看数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性信息。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程[2]。
数据挖掘的分析方法有许多,如关联分析、聚类分析、人工神经网络和决策树等。它被应用到公司客户关系管理、投资项目决策、银行风险评估和金融市场股价分析等众多领域。
2 聚类分析
聚类分析是数据挖掘技术中的重要分析技术,是通过数据建模简化数据的一种方法,研究成果主要集中在基于距离和相似度的聚类方法。就数据挖掘功能而言,聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步的分析,聚类分析主要针对的数据类型包括区间标度变量、二元变量、标称变量、序数型变量、比例标度变量以及由这些变量类型构成的符合类型[5]。
称为数据矩阵。数据矩阵是对象—变量结构的数据表达方式。
相异度矩阵(Dissimilarity Matrix),按n个对象两两间的相异度构建n 阶矩阵,又因为相异度矩阵是对称的,只需写出上三角或下三角即可:
其中d(i, j)表示对象i与j的相异度,它是一个非负的数值。当对象i与j越相似或“接近”时,d(i, j)值越接近0;反之,d(i, j)值越大。相异度矩阵是对象—对象结构的一种数据表达方式。多数聚类算法都是建立在相异度矩阵基础上,如果数据是以数据矩阵形式给出的,就要将数据矩阵转化为相异度矩阵。对象间距离是经常采用的求相异度方法。
3 房地产类上市公司聚类分析研究
3. 1确定挖掘对象
财务分析是管理中不可缺少的工具,是在会计信息供给与会计信息需求之间架起的一座桥梁,它通过对会计信息的透视与剖析,满足会计信息需求者的不同要求[1]。财务状况反映了公司的运营状况。本文选取了我国上市公司中20家具有代表性的房地产公司进行分析:招商地产(000024)、万科A(000002)、栖霞建设(600533)、荣盛发展(002146)、中粮地产(000031)、中华企业(600675)、华发股份(600325)、保利地产(600048)、金地集团(600383)等,分别用X1,X2,X3,…,X20表示。可以预测大部分公司属于一类,也即表现一般,它们将归为一类;很少一部分归为一类,也即表现业绩优良或是较差。再利用其他辅助指标就可以判定哪些是值得投资的。
3. 2数据准备
3. 2. 1数据选取
以2008年3月31日为时点,选取20家上市房地产公司以下关键财务数据:流动资产合计、总资产合计、流动负债合计、长期负债合计、资本公积、盈余公积、未分配利润7个财务数据,分别用L1,L2,L3,…,L7表示(见表1)。
表3反映了聚类分析的凝聚过程。
第一列表示聚类分析的步骤,在本次分析中共进行了19次。第二和第三列表示哪两个样本聚成了一类。第四列表示两个样本的相似系数。第五列表示参与聚类的是样本还是类,0表示样本,非零数字N表示第N步产生的聚类参与本步聚类。第七列表示本步骤聚类结果将在以后的第几步中用到。 第一行表示8和9两个样本最先进行了聚类,样本间相似系数为0.998,本次聚类结果将在以后的第四步中用到;以此类推,将20个样本全部聚类。
表4是最终聚类结果的类成员表,在利用SPSS分析过程中,本文设置分为2~4类,从而输出了划分2~4类时每个样本属于某一类的结果。
4 结 论
聚类分析事前并没有制定分类的标准。本文中,当划分为两类的时候,只有银基发展和其他不同类,通过传统的财务分析方法可以得出,其总资产增长率为负;当划分为3类时,天伦置业各项指标表现都较差,其总资产周转率是最低的;当划分为4类时,华业地产的总资产周转率和净资产报酬率都不错,尤其是速动比率最大。聚类分析对于通过财务指标理性选择值得投资的上市公司起到了积极的作用,但一个企业的价值衡量并不限于此,聚类分析只是提供了一个可以横向比较同类上市公司的工具。
主要参考文献
[1] 葛家澍. 财务会计理论、方法、准则探讨[M]. 北京:中国财政经济出版社,2002.
[2] 〔加〕 Jiawei Han,M kamber. 数据挖掘技术与概念[M]. 北京:机械工业出版社,2001.
[3] 李剑锋,李一军,祁威,等. 数据挖掘在公司财务分析中的应用[J]. 计算机工程与应用,2005(2).
[4] 林伟林,林有. 数据挖掘在上市公司财务状况分析中的应用[J]. 市场周刊:财经论坛,2004(10).
[5] 李雄飞,李军. 数据挖掘与知识发现[M]. 北京:高等教育出版社,2003.
[6] 章文波,陈红艳. 实用数据统计分析及SPSS 12.0应用[M]. 北京:人民邮电出版社,2006:179-192.