- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于上市企业财务数据的贝叶斯统计与知识推理..doc
基于上市企业财务数据的贝叶斯统计与知识推理
【 】本文主要使用matlab和R自带软件包对上市企业财务数据
建立贝叶斯网。用matlab对建立好的贝叶斯网络进行参数学习,利用多
种推理引擎进行精确推理,并对结果进行比较分析。
【关键词】贝叶斯网精确推理财务数据
一、引言
在上个世纪80年代以前,人工智能学术界普遍认为用概率论的方法
来处理较大规模不确定问题是不切实际的,因为它在计算上太?驮樱?使其
没有现实价值。然而,随着人工智能的不确定性问题专题会议的召开,研
究者提出几种概率近似的变换方法,特别是贝叶斯网络等概率模型在实际
屮成功地应川(如专家系统和故障分析系统等),使贝叶斯技术被确立为
处理不确定性问题的一种主要技术。但是关于贝叶斯网络的学习和推理还
存在一些理论和应用方面的问题,随着今二十年的研究深化,这些问题逐
步解决,贝叶斯网络己成为当前一种重要的智能化数据分析与处理工具。
贝叶斯网络与其他数据挖掘方法(如决策树,神经网络,关联规则等)相
比,贝叶斯网络有以下特点:贝叶斯网络可以表示变量间的因果关系,这
种联系的置信度是以概率的形式来表达;贝叶斯网络能够充分利用专家经
验和样本数裾的信息;以叶斯网络能够方便处理有缺失值的数裾;以叶斯
网络具有灵活的双向推理能力,能够有效避免数据的过度拟合和局部最优
的问题。
二、 数据处理
133只股票、31个因素变量的4年数据记录,共532条记录。其中符
号表示的含义如表2-1所示。
为唯一标识每一股票数据,对股票重新编号,作为一个股票数据编号。
如,第一只股票2003年的数据赋予编号1,第一只股票2002年的数据赋
予编号2,以此类推。
首先对数据进行类型一致化和归一处理,在本文把极小型、居中型和
极大型的变量统一化成极大型,下是对每种类转计算公式:
把极小型指标转化为大的计算公式:
其屮M是变量x的最大值。
把中间型指标转化为极大型指标的计算公式为:
其巾m、M分别是变量x的最大值和最小值。
然后“标准化”处理法。即取
其中Xij为标准观测值,其平均值和均方差分别为0和1。式中j(j=l,
2,...,31)为第j项指标原始观测值的平均值,Sj (j=l, 2, ...,31)
为第j项指标原始观测值的均方差。
不考虑变量为连续性的情况,所以必须把是连续型通过离散化处理变
成离散型的变量,在这里我们通过等距对数据进行把每一个连续性的变量
离散出三值1,2, 3,最后经过类型一致化、标准和离散化处理数据。
三、 災叶斯网络的构建
K2法建立贝叶斯网络结构
Mat lab中的贝叶斯网络工具筘(BNT)提供了丰富的参数学习函数,
K2是其中的一种。函数调用如下:
data=xlsread (’课程论文? xlsx’);
data_train=data,;
N二size (data, 2);
ns=3*ones (1, N);
order=[19 24 25 29 23 28 13 18 14 20 22 30 10 11 12 8 16 9 4
1 2 3 5 31 17 6 7 15 21 27 26];
max_fan_in=4;
discrete_nodes=l: N;
dag_K2=learn_struct_K2 (datatrain, ns, order, ’discrete’,
discrcte_nodcs, ’max_fan_in’ , max_fan_in);
建立的结构图如下图所示:
爬山法建立贝叶斯网络结构
Matlab同吋也提供爬山法学习涵数learn_struct_hc (),所冇条件
都采用默认条件,调用形式如下:
data=xlsrcad (’课程论文.xlsx’);
data train=data,;
N=size (data, 2);
ns二3*ones (1, N);
dag=learn_struct_hc (datatrain, ns);
dag_pashan=dag;
建立的网络结构图如下:
R软件也提供贝叶斯网络结构的学习,下面是采用R中的爬山法建立
的贝叶斯网络结构。
在使用matlab和R两种软件辅助建立贝叶斯网络结构中,均采用爬
山法,默认条件下,R的结构学习时间大大小于matlab的结构学习时间,
其屮R只需要几秒钟的时候,matlab却用了 2个多小时。
(三)贝叶斯网络的精确推理
为了提高运算速度,使各种推理算法能够有效应用,BNT工具筘采用
了引擎机制,不同的引擎根据不同的算法来完成模型转换、细化和求解。
这个推理过程如下:
BNT屮提供了多种推理引擎,都有:
不同推理引擎对K2法建立贝叶斯网的精确推理比较。
使用软件是matlab,以K2法建立的贝叶斯网络结构进行精确推理,
采用不同的参数学和推理引擎,结果如下表所示:
不同
文档评论(0)