基于上市企业财务数据贝叶斯统计及知识推理.docVIP

基于上市企业财务数据贝叶斯统计及知识推理.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于上市企业财务数据贝叶斯统计及知识推理

基于上市企业财务数据贝叶斯统计及知识推理   【摘要】本文主要使用matlab和R自带软件包对上市企业财务数据建立贝叶斯网。用matlab对建立好的贝叶斯网络进行参数学习,利用多种推理引擎进行精确推理,并对结果进行比较分析 【关键词】贝叶斯网 精确推理 财务数据 一、引言 在上个世纪80年代以前,人工智能学术界普遍认为用概率论的方法来处理较大规模不确定问题是不切实际的,因为它在计算上太?驮樱?使其没有现实价值。然而,随着人工智能的不确定性问题专题会议的召开,研究者提出几种概率近似的变换方法,特别是贝叶斯网络等概率模型在实际中成功地应用(如专家系统和故障分析系统等),使贝叶斯技术被确立为处理不确定性问题的一种主要技术。但是关于贝叶斯网络的学习和推理还存在一些理论和应用方面的问题,随着今二十年的研究深化,这些问题逐步解决,贝叶斯网络已成为当前一种重要的智能化数据分析与处理工具。贝叶斯网络与其他数据挖掘方法(如决策树,神经网络,关联规则等)相比,贝叶斯网络有以下特点:贝叶斯网络可以表示变量间的因果关系,这种联系的置信度是以概率的形式来表达;贝叶斯网络能够充分利用专家经验和样本数据的信息;贝叶斯网络能够方便处理有缺失值的数据;贝叶斯网络具有灵活的双向推理能力,能够有效避免数据的过度拟合和局部最优的问题 二、数据处理 133只股票、31个因素变量的4年数据记录,共532条记录。其中符号表示的含义如表2-1所示 为唯一标识每一股票数据,对股票重新编号,作为一个股票数据编号。如,第一只股票2003年的数据赋予编号1,第一只股票2002年的数据赋予编号2,以此类推 首先对数据进行类型一致化和归一处理,在本文把极小型、居中型和极大型的变量统一化成极大型,下面是对每种类转计算公式: 把极小型指标转化为大的计算公式: 其中M是变量x的最大值 把中间型指标转化为极大型指标的计算公式为: 其中m、M分别是变量x的最大值和最小值 然后“标准化”处理法。即取 其中Xij为标准观测值,其平均值和均方差分别为0和1。式中j(j=1,2,...,31)为第j项指标原始观测值的平均值,Sj(j=1,2,...,31)为第j项指标原始观测值的均方差 不考虑变量为连续性的情况,所以必须把是连续型通过离散化处理变成离散型的变量,在这里我们通过等距对数据进行把每一个连续性的变量离散出三值1,2,3,最后经过类型一致化、标准和离散化处理数据 三、贝叶斯网络的构建 (一)K2法建立贝叶斯网络结构 Matlab中的贝叶斯网络工具箱(BNT)提供了丰富的参数学习函数,K2是其中的一种。函数调用如下: data=xlsread(’课程论文.xlsx’); data_train=data’; N=size(data,2); ns=3*ones(1,N); order=[19 24 25 29 23 28 13 18 14 20 22 30 10 11 12 8 16 9 4 1 2 3 5 31 17 6 7 15 21 27 26]; max_fan_in=4; discrete_nodes=1:N; dag_K2=learn_struct_K2(data_train,ns,order,’discrete’,discrete_nodes,’max_fan_in’,max_fan_in); 建立的结构图如下图所示: (二)爬山法建立贝叶斯网络结构 Matlab同时也提供爬山法学习函数learn_struct_hc(),所有条件都采用默认条件,调用形式如下: data=xlsread(’课程论文.xlsx’); data_train=data’; N=size(data,2); ns=3*ones(1,N); dag=learn_struct_hc(data_train,ns); dag_pashan=dag; 建立的网络结构图如下: R软件也提供贝叶斯网络结构的学习,下面是采用R中的爬山法建立的贝叶斯网络结构 在使用matlab和R两种软件辅助建立贝叶斯网络结构中,均采用爬山法,默认条件下,R的结构学习时间大大小于matlab的结构学习时间,其中R只需要几秒钟的时候,matlab却用了2个多小时 (三)贝叶斯网络的精确推理 为了提高运算速度,使各种推理算法能够有效应用,BNT工具箱采用了引擎机制,不同的引擎根据不同的算法来完成模型转换、细化和求解。这个推理过程如下: BNT中提供了多种推理引擎,都有: 1.不同推理引擎对K2法建立贝叶斯网的精确推理比较 使用

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档