- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
股价预测研究的理论基础与模型构建综述
由于股价预测具有建模复杂、多尺度、多来源且异质的特点,本文采用数值数据和文本数据相融合,使用半监督学习方法对股价预测模型进行训练,建立具有自注意力机制的LSTM模型。本章对深度学习、半监督学习、行为金融学、文本情感分析等基础理论进行阐述,同时介绍本文建模将会使用到的基础核心深度模型Self-Attention、LSTM和多源数据融合。
1.1深度学习
一般来说,机器学习是从输入数据中学习并总结规律从而进行预测错误!未找到引用源。在机器学习领域中,深度学习是其中的一种方法。相比于传统的机器学习算法在训练之前需要预处理和特征提取,其使用多层映射出输入和输出之间的非线性关系,提高其对原始数据学习的能力错误!未找到引用源。可以当成是由许多简单函数复合而成的高级函数。通过设计建立适量的神经元计算节点和多层运算结构,选择合适的输入层和输出层,组合低层特征形成有价值的高层特征,使模型具有更好的学习能力。目前,深度学习广泛应用于图像识别领域和自然语言处理领域,在人脸识别、机器翻译等领域创造了巨大的价值错误!未找到引用源。
同时,金融也是深度学习研究最多的应用领域之一,深度学习方法如CNN、
RNN、LSTM等都取得了巨大的成绩,主要应用领域由金融文本情感分析、金融风险评估、投资组合管理等问题。其中,金融文本挖掘和情感分析应用尤为广泛,通常利用其对财经新闻、社交媒体等文本信息进行分析,从而实现对股票价格、趋势等的预测。
1.2半监督学习
传统机器学习仅包含监督学习和无监督学习,其区别在于数据是否具有标签。监督学习的方法分为回归和分类,其具体是指已知数据间关系即标签,同时具有数据特征,通过训练,得出最优映射关系。得出的模型在输入无标签数据时,判断出其所属标签。而无监督学习是指数据仅有特征而没有标签,不断学习后寻找数据间的规律。相比于监督学习,无监督学习更像是自学。错误!未找到引用源。o
而在现实问题中,常常会出现少量样本有标记和较多样本无标记的情形。有标签数据获取成本高或无法获取足够多的具有标签的数据促使有标签数据和无标签数据相结合的半监督学习技术不断发展并被广泛应用错误!未找到引用源。
在金融领域内,可收集的数据总量少、数据收集的时间成本高、数据的人工标注成本高等导致可使用的数据量太少。标签太少,模型就不够准确,而增加标
签,又会显著增加风控成本错误!未找到引用源。。在这种情况下,金融专家常会利用少量有标签数据和大量无标签数据进行半监督学习,以达到目标。
1.3行为金融学
行为金融学是行为经济学的一个研究分支,提出金融市场中投资人的非理性行为。行为金融学指出,投资者的决策行为容易受到知识、所获信息以及心理等因素影响,导致其做出感性决策错误!未找到引用源。行为金融学的主要理论包括认知后悔理论、期望理论、行为组合理论和羊群效应理论。行为金融学将人的心理因素加入金融问题的研究中,二者结合产生很多投资策略如差异化策略、投资组合策略、反向投资策略等。
1.4文本情感分析
文本情感分析是将爬取挖掘的文本对其进行分词获得情感词汇,然后对其进行归纳和推理。随着互联网的日益发展,论坛等交流平台上产生了大量的有价值意义的评论信息。这些评论信息可以表达用户的情感倾向,如积极、消极、中立等。基于此,其他使用者可以通过已经发布的信息综合考虑后了解人们对某一事件的情感。而越来越多持股者也开始通过互联网论坛来发表自己对该支股票买或卖或者财经新闻等的看法,并与其他股民进行互动交流,从而得到想要知道的信息。股吧论坛有着大量股民投资情感倾向文本和股票市场等新闻数据,因此论坛
媒体等相关信息对股民是否持有该股有着重大的影响。基于此,借助文本情感分析得到量化后的投资者情绪加入股票预测模型中进一步提高预测准确率具有重大意义错误!未找到引用源。。
1.5SA-LSTM模型
1.5.1长短期记忆神经网络LSTM
长短期记忆神经网络(LSTM)是在循环神经网络(RNN)上的一种改进提升。为了解决传统RNN模型长期依赖所导致的梯度消失或爆炸的问题,1997年
Hochreiter提出LSTM模型错误!未找到引用源。LSTM记忆单元包括三个门结构:遗忘门ft、输入门it和输出门0t,以及单元状态Ct和候选态Ct。具体训练过程是指首先将输入数据xt与之前的输出数据ht-1经过遗忘门,决定所要遗忘的特征;然后通过输入门和候选态对数据进行更新,同时根据xt与ht-1以及之前单元状态Ct-1对目前单元状态Ct进行更新;最后经过输出门输出当
您可能关注的文档
- 2024年江苏淮安英语中考试题(含答案解析) .pdf
- 2024年靖江市人民医院招聘考试真题 .pdf
- 2024年黔南州龙里县冠山街道播箕村社会招录村干部考试真题 .docx
- 湖州银行股份有限公司招聘笔试真题2024 .pdf
- 2025年法律知识竞赛判断题库及答案(精) .pdf
- 人教版(2025版)七年级下册地理第七章《我们生活的大洲——亚洲》集体备课教案 .pdf
- 统编版语文四年级上册第六单元大单元整体教学设计 (2).docx
- 2025年度健康知识竞赛题库及答案(精选50题) .pdf
- 2024年各地市青年人才引进考试真题 .docx
- 2025年度上海市高校大学《辅导员》招聘高频考题汇编 .pdf
- 2025年福州外语外贸学院单招职业技能考试题库汇编.docx
- 2025年西安航空职业技术学院单招职业适应性测试题库及参考答案.docx
- 2025年襄阳科技职业学院单招职业适应性考试题库完整.docx
- 2025年河南工业贸易职业学院单招职业适应性测试题库带答案.docx
- 2025年哈密职业技术学院单招职业倾向性考试题库完整.docx
- 2025年辽宁特殊教育师范高等专科学校单招职业适应性测试题库最新.docx
- 2025年重庆移通学院单招综合素质考试题库一套.docx
- 2025年新疆科信职业技术学院单招综合素质考试题库学生专用.docx
- 2025年太原幼儿师范高等专科学校单招职业倾向性考试题库1套.docx
- 2025年四川电力职业技术学院单招职业适应性测试题库1套.docx
最近下载
- 2024年江苏省淮安市中考数学试卷附答案解析.docx
- 2025山东省高校毕业生“三支一扶”计划招录1000人左右笔试备考题库及答案解析.docx
- 2022年口腔主治医师《专业实践能力》口腔内科学口腔黏膜病.doc
- DBJT14-101-2013 膨胀玻化微珠浆料复合保温板外墙外保温系统应用技术规程 .docx VIP
- 江苏省淮安市小升初数学试卷(上午场).doc VIP
- 江苏省淮安市小升初数学试卷.docx VIP
- 2025年山东省烟草专卖局校园招聘笔试备考试题及答案解析.docx
- 牙周病学思维导图.pdf VIP
- 江苏省淮安市2024届小升初数学试卷.doc VIP
- 计算机辅助药物设计专家讲座.pptx
文档评论(0)