基于分类回归树的会计信息失真识别研究.docVIP

下载本文档

1
0
约4.59千字
约 7页
2017-01-19 发布于北京
举报
版权申诉

基于分类回归树的会计信息失真识别研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于分类回归树的会计信息失真识别研究.doc

基于分类回归树的会计信息失真识别研究　　[摘要] 会计信息失真现象将给投资者、政府、公司所有者等众多会计信息使用者带来很大的损失和麻烦。因此，科学地识别会计信息是否失真就很重要。本文选取2008年的159家上市公司的财务数据作为训练样本建立分类回归树模型，并以该模型对2009年沪深上市公司的1 862家企业进行了检测，实证研究表明：分类回归树算法具有很高的会计信息失真识别能力。　　[关键词] 分类回归树；会计信息失真；审计意见　　[中图分类号] F234；F276.6 [文献标识码] A [文章编号] 1673 - 0194（2013）06- 0002- 02 　　1 文献综述　　目前会计信息失真识别研究较多集中在2个方面：多元统计分析方法发现会计信息失真企业的特征和利用特征指标变量建立识别模型对企业会计信息失真的可能性进行识别和预测。国内外学者都基于这两类方法通过建立多种模型对会计信息失真问题进行了研究。　　多元统计分析方法被用来作为会计信息失真的侦测方法已经有较长的历史，并且取得了较好的识别效果。而利用特征指标变量来建立会计信息识别模型的国内外研究在近年来得到了快速发展。Imran Kurt等[1]学者比较了分类回归树模型、logistic模型、神经网络在预测方面的作用，发现分类回归树算法具有很高的准确率。Belinna Bai[2]证明分类回归树模型对财务欺诈具有较高的识别能力。国内学者中，刘君[3]、张玲[4]等也都运用特征变量建立会计信息分析模型。　　本文就是运用分类回归树算法来进行会计信息的识别，首先选取2008年的159家沪深上市公司的财务数据作为训练样本建立分类回归树模型，然后对2009年沪深上市公司的1 862家企业利用建立的分类回归树模型进行检测，进一步证实利用分类回归树算法进行会计信息失真识别的有效性和准确性。　　2 分类回归树的构建步骤　　分类回归树算法（CART）是一种有监督学习算法，即用户在使用CART进行预测之前，必须首先提供一个学习样本集对 CART 进行构建和评估，然后才能使用。根据给定的样本集构建分类回归树的步骤由以下3部分组成：　　（1）使用L构建树Tmax，使得Tmax中每个叶节点要么很小（节点内部所包含的样本个数小于给定的值Nmin），要么它是纯节点（节点内部样本的Y同属于一类）；要么是只有唯一的属性向量可以作为分支向量。本文在计算过程中采取最大杂度削减算法――基尼系数寻找最佳的分支向量。从根结点开始进行分割，递归地对每个结点重复进行分割：首先对每一个结点选择每个属性最优的分割点，若基尼系数最小，则Xi就是当前属性的最优分割点；接着在这些最优的分割点中选取使上式最小的作为这个结点的最优的分割规则；最后继续对由该结点分割出来的两个结点继续进行分割。分割过程一直持续下去，直到具备以下任一条件时停止：①每一个叶节点很小；②纯节点（节点内部样本的Y 属于同一个类别）；③仅有唯一属性向量作为分支选择。　　（2）使用修剪算法构建一个有限的节点数目递减的有序子树序列。修剪是为了获得误分率低、大小合适、评估准确率高的子树。该过程应用最小代价―复杂度算法，生成一系列Tmax的修剪子树。修剪过程主要完成生成有序树序列和确定叶节点的所属类两步骤工作。　　（3）使用评估算法从第2步产生的子树序列中选出一棵最优树，作为最终的决策树。本文将使用2009年所有沪深上市公司年度报告中的财务数据进行对所建分类回归树的识别和评估。　　3 基于分类回归树的会计信息识别实证研究　　3.1 样本选择　　将上市公司年度审计报告中被出具标准无保留审计意见的公司划分为会计信息真实的企业样本，将年度审计报告中被出具非标准无保留审计意见的公司划分为会计信息失真的企业样本。本文的样本数据主要来自CCER中国经济金融数据库和RESSET金融研究数据库。　　训练样本的选择中，会计信息失真的企业样本为沪深证券交易所2008年年报被出具非标准无保留意见的53家上市公司，其中上交所31家，深交所22家，具体审计意见包括保留意见、拒绝表示意见和保留意见带解释性说明。此外，训练样本中会计信息真实的企业样本为2008年沪深证券交易所中年报审计意见为标准无保留意见的106家上市公司，其中上交所62家，深交所44家。　　测试样本的选择中，将用2009年沪深证券交易所的1 862家上市公司作为测试样本，对所建立的分类回归树模型进行评估和检验，其中136家上市公司在年报中被出具了非标准无保留意见，即会计信息失真。　　3.2 财务指标初选与处理　　本文选择反映企业经营状况的财务指标来判定会计信息的失真。初步选取了一些常用的典型的可以反映这几个方面的财务指标，初步选取的规则是在反映企业