郑州大学-机器学习 文献3.pptxVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

汇报人:秦文静朱曼

摘要及研究背景数据选取,数据规范化特征提取机器学习算法评价指标

01摘要及研究背景

摘要研究目的预测股票价格的走向和走势是帮助投资者在股票市场上做出金融决策的一项重要任务。构建一个智能的基于决策树的集成机器学习模型,使预测误差最小,该模型能够从过去的股市数据中学习并估计股价走势的方向,降低投资风险。研究方法在本文中,我们比较了基于决策树的集成ML模型(随机森林(RF)、XGBoost分类器(XG)、Bagging分类器(BC)、AdaBoost分类器(Ada)、ET分类器(ET)和Votting分类器(VC))在预测股价走势方面的有效性。本文随机收集来自三个证券交易所(纽约证券交易所(NYSE)、全国证券交易商协会自动报价系统(NASDAQ)和印度国家证券交易所有限公司(NSE))的8个不同的股票数据用于研究。每个数据集被分成训练集和测试集(0.7,0.3),在训练集上,使用十折交叉验证精度对的ML模型进行评估。此外,在测试集上使用准确度、查准率、查全率、F1、特异度和受试者工作特征曲线下面积(AUC-ROC)对ML模型进行了评估。使用KendallW一致性检验对基于树的机器算法的性能进行排序。

研究结论对于训练集,AdaBoost模型比其他模型表现得更好。对于测试集,准确度、精查准率、F1和AUC指标等结果对模型进行了排名,极端随机树分类器(ET)在所有排名中的表现都优于其他模型。关键词Keywords:stockprice;machinelearning;technicalindicators;featureextraction

研究背景1.预测股票价格走势和方向是帮助投资者在股票市场上做出金融决策的一项重要任务。然而,由于政治事件、经济因素、投资者情绪等因素的影响,这些影响股票市场行为的因素以极快的速度不断变化,它们受到高度噪声的极大影响。执行这项任务是非常艰巨的。2.多年来,投资者和研究人员都认为股票价格是不可预测的。随机游走理论的支持者认为,股票价格将沿着随机游走的路径移动,任何对股票走势的预测都将将达到为50%左右。此外,有效市场假说认为,股票市场反映了目前所有可用的信息,因此,不能预测它,使得投资者持续获得超过整体市场平均水平的经济收益。

3.然而,大量的研究提供证据表明股票市场在一定程度上是可以预测的。金融市场时间序列是非参数的、动态的、噪声的和无序的,投资股票市场有很大的风险。投资者已经能够通过击败市场获得利润。4.预测股票价格行为的方法有技术分析、基本面分析、时间序列预测和机器学习(ML)等。在本文中,我们着重于使用ML模型在预测股票价格行为,因为从文献中得知,ML模型通常比统计和计量经济学模型产生更好的结果,而且与比其他方法相比,更好地捕捉了股票市场的非线性特征。此外,使用ML技术,可以将单个模型组合起来使方差降低,从而提高模型的性能。

02数据选取及数据规范化

数据选取从三个不同的证券交易所(纽约证券交易所(NYSE)、全国证券交易商协会自动报价系统(NASDAQ)和印度国家证券交易所有限公司(NSE))随机收集了八个股票数据集。使用了以下股票的数据:美国银行公司(BAC)、埃克森美孚公司(XOM)、标准普500指数(INX)、微软公司(MSFT)、道琼斯工业平均指数(DJIA指数)、CarMax,Inc.(KMX)、塔塔钢铁有限公司(TATASTEEL)和HCL科技有限公司(HCLTECH)。

从收集的OHLCV数据中计算出不同技术指标(即动量指标、成交量指标、价格转换、重叠研究)的七十五项技术指标,并将其用作输入特征。重叠研究指标描述BollingerBands(BBANDS)布林线(BBANDS)描述特定期限内金融工具的不同高点和低点WeightedMovingAverage(WMA)加权移动平均线(WMA)与过去的数据点相比,为最近的数据点分配更大权重的移动平均线ExponentialMovingAverage(EMA)指数移动平均线(EMA)加权移动平均线对当前数据点施加更大的权重和重要性,但是,价格与其先前价格之间的下降率并不一致。DoubleExponentialMovingAverage(DEMA)双指数移动平均线(DEMA)它基于EMA,并试图提供比EMA滞后更短的平滑平均值。KaufmanAdaptiveMovingAverage(KAMA)考夫曼自适应移动平均线(KAMA)移动平均线旨在响应市场趋势和波动MESAAdaptiveMovingAverage(MAMA)MESA自适应移动平

文档评论(0)

zhhg001hkdl + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档