有关会计信息失真识别的成本控制型支持向量机模型毕业论文写作资料-论文写作网

简介:关于对不知道怎么写识别模型论文范文课题研究的大学硕士、相关本科毕业论文识别模型论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

识别模型论文范文

一、引言
二、基于成本控制的支持向量机分类模型
三、数据实验
1.样本及指标选取
2.备选指标的检验
3.研究方案设计思路
4.实验结果分析
3.在两类错误分类成本为5:1的情况下,降低了第一类样本的错分个数,突出了成本控制的效果.
模式识别:计量经济学_第10讲1_第四章_联立方程模型的概念和识别1.wmv

[摘要]在会计信息失真识别问题中,考虑到决策失误所付出的不同错误分类成本以及样本数据的不平衡分布等特点,使得基于总体准确率的数据挖掘方法不能获得理想的识别效果.本文针对会计信息失真识别问题的特点,建立了一种成本控制型支持向量机模型,利用粒子群算法进行特征选择和参数优化,从而降低总体的错误分类成本.实验证明,该模型能够有效的识别出虚假的财务报告.

[关键词]财务报告支持向量机成本

一、引言

财务报告所反映的会计信息是对企业经营活动中资金运动的状态、方式的客观描述,一旦财务报告存在人为的虚假信息,各方利益都将受到不同程度的损害.因此正确的识别出虚假会计信息显得非常重要.

目前国内外主要运用传统的会计经验分析方法、计算机辅助审计方法和定量的模型识别方法来识别虚假会计信息.传统的会计经验方法大多数依赖于分析性程序方法来识别上市公司会计信息的论文范文行为.这种方法虽然能够对每个财务报表进行细致审查,但是在对大型上市公司进行审计时效率不高.计算机辅助审计和定量的模型识别方法可以大幅提升审计效率.其中计算机辅助审计方法主要是应用审计软件来开展审计工作.在审计软件中,可以根据电子数据进行查询、查账和图形分析等操作来辅助审计工作,也可以调用审计方法库来实现审计功能.定量的模型识别方法主要是利用上市公司公开的财务数据,建立数学模型来识别虚假会计信息.可以将这些模型嵌入到审计方法库中,帮助人们快速识别虚假会计信息.其中一些模型采用多元线性回归方法、逻辑回归方法、多元统计分析中的主成分分析方法等传统统计方法来预测虚假会计信息,但传统统计方法在面对大规模多变量问题时会遇到“维数灾难”的现象,而且很难处理和分析复杂非线性模型.随着人工智能技术的发展,机器学习技术,如人工神经网络(ANN)和支持向量机(SVM)．开始应用于企业分类问题,并获得了超越传统统计方法的实验效果.如Fanning和Cogger(1998)利用人工神经网络建立了一个识别虚假财务信息的高信都侦测模型,但人工神经网络无法避免局部极值的问题.支持向量机( SVM)方法是由Vapnik等提出一种针对分类和回归问题的新型机器学习方法.它与传统的研究方法相比,在解决小样本、非线性以及高维模式识别问题方面具有突出的优势；而且能够解决神经网络中不可避免的局部极值问题.因此,使用支持向量机方法来识别虚假会计信息能够取得比其他方法更好的效果.邓庆山和梅国平将基本的支持向量机模型应用到虚假会计信息识别领域中,取得了较好的效果.但在虚假会计信息识别问题中,将可信的财务报告错误的判定为虚假的财务报告和将虚假的财务报告错误的判定为可信的财务报告,在所付出的错误分类成本上是截然不同的,前者只会使利益相关人的盈利减少,而后者则会对利益相关人造成直接的经济损失.此外,在数据特征上,财务数据间的勾稽关系非常明显,存在过多的冗余属性.而基本模型并没有考虑到分类问题中的错误分类成本和数据的冗余属性问题,并且基本模型中的惩罚参数以及核函数参数的不同取值,会影响模型的精度.因此,本文尝试将错误分类成本引入到支持向量机模型中,并且利用粒子群算法自动控制模型中的参数以及进行特征选择消除样本数据的冗余属性,来识别虚假会计信息.

模式识别:计量经济学_第10讲1_第四章_联立方程模型的概念和识别1.wmv

本文的结构安排如下：首先提出了一种基于成本控制的支持向量机模型以及求解过程,其次建立了虚假会计信息识别的指标体系,最后用实验数据检验了模型的效果.

二、基于成本控制的支持向量机分类模型

三、数据实验

1.样本及指标选取

本文的实验数据主要来源于中国证券之星网站、wind资讯数据库及上海、深圳证券交易所网站.在分析了1999-2008年中众多上市公司公开财务报告的基础上,我们将审计意见为“拒绝表示意见”和“否定意见”的财务报告作为虚假财务报告,审计意见为“无保留意见”的财务报告,作为可信样本.我们无法确定审计意见为“有保留意见”的财务报告是属于虚假财务报告还是可信的财务报告,所以没有将该类财务报告作为样本数据,按照以上原则,确定了包括117个虚假财务报告．143个可信的财务报告,共计260个样本的数据集.

上市公司常利用关联交易、虚增收入和虚增应收账款等手段进行论文范文,这些手段的目的是增加公司的收入,或者降低支出,从而使上市公司实现盈利.如2001年的银广夏通过伪造票据等手段虚增了7.45亿元的利润.因此选取了销售利润率、收益比率等指标来衡量上市公司的收入与支出是否合理.在偿债能力方面,高负债的资本结构更容易有论文范文的嫌疑,我们选取流动比率、资产负债率、营运资金比率、速动比率4个指标.虚拟资产和资产重组等论文范文手段通常从资产类的指标入手,我们选取资产周转率等指标来衡量.此外,上市公司的重要指标是否连续,也能反映其是否论文范文,如果一家公司的股票突然从垃圾股变成绩优股,那么往往存在论文范文的嫌疑.我们选取资产周转率增长率等指标来反映上市公司运营的连续性.因此,得到了如表1所示的备选指标.

2.备选指标的检验

我们对备选指标进行了T检验,T检验结果由于篇幅限制省略.剔除掉T检验不显著的指标,最终选择了主营业务收入论文范文率、资产负债率、营运资金比率、收益留存累计比率、实际所得税率、资产增长速度、流动资产增长速度、资产周转率、资产收益率、净收益营业论文范文率、资产论文范文率、资产财务论文范文率、流动资产财务论文范文率、应收账款周转率、资产周转率增长率、资产收益率增长率、资产负债率增长率、资产论文范文率增长率、资产财务论文范文率增长率、营运资金比率增长率、收益留存累计比率增长率、实际所得税率增长率、流动资产财务论文范文率增长率、净收益营业论文范文率24个指标.

3.研究方案设计思路

4.实验结果分析

本文实验环境是一台运行Window XP操作系统的512M内存的个人计算机,用MATLAB7．O实现.实验1是用PSO优化算法对本文提出的模型进行特征选择和参数优化,具体的实验参数设置如下：在样本数据中,随机选取其中的70%作为训练样本,另外30%作为测试样本,粒子规模设置为50个,学习因子都为2,惯性权重取1．迭代次数为100次,α、β、Δ三个参数的取值范围分别为[0.01,10000]、[10000,20000]、[0.0001,32]．我们在两类样本错误分类成本之比为1：1到10:1之间,做了多次试验,发现在错误分类成本之比为5:1的情况下,实验效果最好.实验2是用PSO优化算法对本文提出的模型进行参数优化,但没有做特征选择,实验参数设置与实验1相同.实验3是标准的SVM算法,利用PSO进行参数优化,粒子规模我50个,迭代次数为100次,错分样本惩罚参数C的范围为[0.01,10000],Δ的范围为[0.0001,32]．实验4是标准的SVM算法,错分样本惩罚参数C取10．选择高斯核函数作为支持向量机的内核函数,Δ2为2.在实验之前我们对数据进行了归一化处理,将所有数据都归一化到[1、1]以消除不同量纲较大差异对模型算法的影响.四组实验都分别做了10次试验,测试样本正确识别个数、识别准确率取10次实验的平均值.实验结果的比较如下表所示.

通过实验,可以得出以下结论：

1．实验1中的测试样本的识别准确率为98.72%,优于其他模型.说明本文提出的模型可以很好的识别出虚假会计信息,并且具有很好的预测能力,与其他方法相比,具有显著的优势.

2．实验1与实验2相比,总体识别精度提高了5.13%,说明样本数据中存在的冗余特征影响了识别的准确率,通过特征选择部分将不必要的特征剔除掉,能够大幅提升准确率.实验1的平均特征约减率为40%.其中10次试验都未选择的特征为：资产负债率、营运资金比率、净收益营业论文范文率.说明这三个特征在会计论文范文中并不重要.10次试验中全部选择的特征分别为：收益留存累计比率、流动资产增长速度、净收益营业论文范文率、流动资产财务论文范文率增长率.说明这四个特征在进行会计审查时应格注意.