- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Logistic回归变量筛选BP神经网络及应用
基于Logistic回归变量筛选BP神经网络及应用
摘要摘要:BP神经网络是一种使用非线性可导函数作为传递函数的前馈神经网络,具有较高的精确度,但过多的预测变量会影响BP神经网络的准确性。采用Logistic回归变量筛选方法能在一定程度上提高分类准确性,提高模型效率。对2013年沪深两市A股分类评级进行了研究,证明基于Logistic回归变量筛选的神经网络提高了两极类别分类的准确性。
关键词关键词:BP神经网络;Logistic回归;变量筛选
DOIDOI:10.11907/rjdk.151010
中图分类号:TP301
文献标识码:A文章编号文章编号2015)004003504
0引言
人工神经网络的数据拟合是通过对输入和输出的分析,来更新各神经元间的连接权重,是一种非线性的统计模型,具有较高的精确度[1]。但是,对于多种因素共同决定的复杂问题来说,由于影响因变量的预测变量过多,将全部预测变量加入模型进行分析,一些重要性较低的变量噪声就会影响整个模型的精度,达不到分析效果[2]。由此,本文提出一种优化的基于Logistic回归变量筛选的神经网络分析方法。
1原理
1.1BP神经网络
BP神经网络是一种基于有监督的学习、使用非线性可导函数作为传递函数的前馈神经网络[3]。BP神经网络具有较强的非线性映射能力、较高的自学习和自适应能力、将学习成果应用于新环境和新知识的能力以及相当的容错能力[4]。
BP算法(Error Back Proragation)学习过程由信号的正向传播与误差的反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层[5]。若输出层的实际输出与期望的输出不符,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各单元权值的依据[6]。这种信号正向传播与误差反向传播的各层权值调整过程,是周而复始进行的。权值不断调整的过程,也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止[78]。如图1所示,向量X为输入层输入向量,向量Y为隐层输出向量,向量O为输出层输出向量,矩阵V为输入层到隐层之间的权值矩阵,矩阵W为隐层到输出层之间的权值矩阵。
1.3基于Logistic回归变量筛选的BP神经网络实现方法
使用IBM SPSS Modeler 15.0构建模型[11]。用Logistic回归分析方法拟合数据,提取出符合变量筛选条件的预测变量[12]。构建Logistic回归模型时使用分区数据并为每个分割构建独立的模型;选用多项式过程,变量提取方法使用步进法并使用主效应模型,目标基准类别使用第一类别,迭代次数上限为20次。挑选出满足给定显著水准的预测变量后,将这些预测变量加入数据流作为BP神经网络输入层变量,目标选择创建标准模型,并使用BP算法建立MLP神经网络模型,停止条件为最大训练时间10分钟,防止过度拟合集合设为30%。使用上述权值调整算法建立神经网络进行分类分析,具体模型如图2所示。
2实例分析
股票评级是股票资信评估的一个重要项目,它可以为投资者提供股票的风险信息,降低投资者的风险成本,是投资者决策的重要依据[13]。由于股票价格受到政治、经济、社会等多种因素影响,使用传统的模型拟合往往无法达到令人满意的效果[14],本文提出的模型正好能解决此难题。
2.1数据准备
选取2013年度上证A股、深证A股所有股票,导出2013年1月4日至2013年12月31日间股票交易数据,并从锐思数据库、中国证券报网站、新浪财经数据中心等平台汇总上市公司四季度报(年报)数据。其中年报数据保留盈利能力(包括净资产收益等7项指标)、运营能力(包括应收账款周转率等6项指标)、成长能力(包括主营业务收入增长率等6项指标)、偿债能力(包括流动比率等6项指标)、现金流量(包括现金流量比等5项指标),共计30项财务分析指标。
2.2数据清理
由于样本含量足够大,将近2 500例,对于存在缺失值的实例,将整条数据删除,不作分析使用。
2.3数据变换及离散化
(1)考虑到个别股票在2013年度存在除权除息,如果直接按市场价格计算股票涨跌幅,就会偏离实际情况,因此对这部分股票需要按实际收益计算其涨跌幅度。
(2)计算出年度股票涨跌幅后,将其离散化处理,涨跌幅(-∞,-20%],(-20%,0%],(0%,20%],(20%,+∞)分别离散为0,1,2,3四个数值。
2.4数据集成
将股票价格及涨
您可能关注的文档
- 基于KST视角中医药院校本科毕业生需求调.doc
- 基于Kubernetes分布式ELK日志分析系统.doc
- 基于KVM虚拟机网络性能优化研究.doc
- 基于KWL通用学术英语课程教学范式构建探索.doc
- 基于K―Means和SVM流行中文钓鱼网站识别研究.doc
- 基于k―means和关联度分析网络招聘信息数据挖掘.doc
- 基于K―means和布谷鸟算法流程模型聚类.doc
- 基于K―means图像文字识别与提取研究.doc
- 基于K―MEANS聚类电商店铺经营策略分析.doc
- 基于K―means聚类算法信号源识别分类研究.doc
- 基于Logistic回归模型我国网络购物发展研究.doc
- 基于Logistic回归模型农村居民养老方式选择意愿及影响因素研究.doc
- 基于logistic回归模型打车软件市场规模影响因素研究.doc
- 基于Logistic回归茶树越冬期冻害气象因素分析.doc
- 基于Logistic方程医药企业和第三方医药物流研究.doc
- 基于logistic回归模型大数据精准营销应用.doc
- 基于Logistic模型中小上市公司财务风险预警研究.doc
- 基于Logistic曲线我国私人汽车拥有量长期预测研究.doc
- 基于Logistic模型乡村旅游住宿需求影响因素分析.doc
- 基于Logistic模型医疗网络舆情监控与预警系统研究.doc
最近下载
- 江苏开放大学公文写作与处理050008过程性考核作业三.docx VIP
- 运维规范试题.docx VIP
- 《先进纺织技术》课件.ppt VIP
- 2025秋数学人教二年级(上) 身体上的尺子:第1课时 身体上的长度.pptx VIP
- 保定动力19秋网络运维班知识测试_A.docx VIP
- 高速铁路概论单元四第节高速铁路通信课件.pptx VIP
- HFC网络(光机及以下)调试运维培训试题.docx VIP
- 化学-海南省天一大联考2023-2024学年高三学业水平诊断(二)带答案.docx VIP
- 高考数学培优---椭圆、双曲线的焦点弦被焦点分成定比.docx VIP
- 福建省电子技术基础应试指南测试卷答案.docx VIP
原创力文档


文档评论(0)