- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
股价预测研究的理论基础与模型构建综述
由于股价预测具有建模复杂、多尺度、多来源且异质的特点,本文采用数值
数据和文本数据相融合,使用半监督学习方法对股价预测模型进行训练,建立具
有自注意力机制的LSTM模型。本章对深度学习、半监督学习、行为金融学、
文本情感分析等基础理论进行阐述,同时介绍本文建模将会使用到的基础核心深
度模型Self-Attention,LSTM和多源数据融合。
1.1深度学习
一般来说,机器学习是从输入数据中学习并总结规律从而进行预测错误!未找到引用
。。在机器学习领域中,深度学习是其中的一种方法。相比于传统的机器学习算
法在训练之前需要预处理和特征提取,其使用多层映射出输入和输出之间的非线
性关系,提高其对原始数据学习的能力错误!未找到引用。。可以当成是由许多简单函数
复合而成的高级函数。通过设计建立适量的神经元计算节点和多层运算结构,选
择合适的输入层和输出层,组合低层特征形成有价值的高层特征,使模型具有更
好的学习能力。目前,深度学习广泛应用于图像识别领域和自然语言处理领域,
在人脸识别、机器翻译等领域创造了巨大的价值错误!未找到引用。。
同时,金融也是深度学习研究最多的应用领域之一,深度学习方法如CNN、
RNN、LSTM等都取得了巨大的成绩,主要应用领域由金融文本情感分析、金融
风险评估、投资组合管理等问题。其中,金融文本挖掘和情感分析应用尤为广泛,
通常利用其对财经新闻、社交媒体等文本信息进行分析,从而实现对股票价格、
趋势等的预测。
1.2半监督学习
传统机器学习仅包含监督学习和无监督学习,其区别在于数据是否具有标签。
监督学习的方法分为回归和分类,其具体是指已知数据间关系即标签,同时具有
数据特征,通过训练,得出最优映射关系。得出的模型在输入无标签数据时,判
断出其所属标签。而无监督学习是指数据仅有特征而没有标签,不断学习后寻找
数据间的规律。相比于监督学习,无监督学习更像是自学。错误!未找到引用。。
而在现实问题中,常常会出现少量样本有标记和较多样本无标记的情形。有
标签数据获取成本高或无法获取足够多的具有标签的数据促使有标签数据和无
标签数据相结合的半监督学习技术不断发展并被广泛应用错误!未找到引用。。
在金融领域内,可收集的数据总量少、数据收集的时间成本高、数据的人工
标注成本高等导致可使用的数据量太少。标签太少,模型就不够准确,而增加标
签,又会显著增加风控成本错误!未找到引用。。在这种情况下,金融专家常会利用少量
有标签数据和大量无标签数据进行半监督学习,以达到目标。
1.3行为金融学
行为金融学是行为经济学的一个研究分支,提出金融市场中投资人的非理性
行为。行为金融学指出,投资者的决策行为容易受到知识、所获信息以及心理等
因素影响,导致其做出感性决策错误!未找到引用。。行为金融学的主要理论包括认知后
悔理论、期望理论、行为组合理论和羊群效应理论。行为金融学将人的心理因素
加入金融问题的研究中,二者结合产生很多投资策略如差异化策略、投资组合策
略、反向投资策略等。
1.4文本情感分析
文本情感分析是将爬取挖掘的文本对其进行分词获得情感词汇,然后对其进
行归纳和推理。随着互联网的日益发展,论坛等交流平台上产生了大量的有价值
意义的评论信息。这些评论信息可以表达用户的情感倾向,如积极、消极、中立
等。基于此,其他使用者可以通过已经发布的信息综合考虑后了解人们对某一事
件的情感。而越来越多持股者也开始通过互联网论坛来发表自己对该支股票买或
卖或者财经新闻等的看法,并与其他股民进行互动交流,从而得到想要知道的信
息。股吧论坛有着大量股民投资情感倾向文本和股票市场等新闻数据,因此论坛
媒体等相关信息对股民是否持有该股有着重大的影响。基于此,借助文本情感分
析得到量化后的投资者情绪加入股票预测模型中进一步提高预测准确率具有重
大意义错误!未找到引用。
1.5SA-LSTM模型
1.5.1长短期记忆神经网络LSTM
长短期记忆神经网络(LSTM)是在循环神经网络(RNN)上的一种改进提
升。为了解决传统RNN模型长期依赖所导致的梯度消失或爆炸的问题,
您可能关注的文档
- 人教部编版四年级语文上册第四单元作业设计 (5) .pdf
- 【八年级历史下册核心素养教案】第18课 科技文化成就 .pdf
- 部编版道德与法治四年级下册 全册教案(表格版) .pdf
- 【八年级历史下册核心素养教案】第12课 民族大团结 .pdf
- 【《注意力机制探析1100字》】 .pdf
- 人教PEP版四年级下册英语Unit 6 Shopping 教案 .pdf
- 2024年崇左市左江治旱工程管理中心招聘工作人员考试真题 .docx
- 湖南省2023年普通高等学校对口招生考试英语试卷 .pdf
- 2025浙美版(2024)美术小学一年级下册教学计划 .docx
- 宁波市北仑区春晓街道招聘笔试真题2024 .pdf
文档评论(0)