- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《R 语言》
实验报告
专业班级: XXXX
成员姓名: XXXX XXX XXX XXX
指导教师: XXX
日 期: XXXX-XX-XX
1
一、问题重述 3
1.1 问题背景 3
二、问题分析 3
2.1 问题一的分析 3
2.2 问题二的分析 3
三、数据预处理 4
3.1 数据选取 4
3.2 缺失值处理 5
3.3 数据统一化 5
3.4 数据去极值 7
3.5 数据标准化 7
四、模型的建立与求解 7
4.1 问题一模型的建立与求解 7
4.1.1 模型的建立 8
4.1.2 模型的求解 9
4.1.3 模型的结果 10
4.2 问题二模型的建立与求解 11
4.2.1 模型的建立 11
4.2.2 模型的求解 13
4.2.3 模型的结果 14
五、模型评价与改进 15
六、附录 16
附录 1 16
附录2 18
2
一、问题重述
1.1 问题背景
量化投资是指通过数量化方式及计算机程序化发出买卖指令,以获取稳定收益为目
的的交易方式。投资者通过数据分析探索市场运行规律,并预测市场走势,从而进行决
策交易。随着大数据技术的发展,量化投资在全球金融交易市场上的地位愈加重要。但
是由于市场信息十分庞杂,同时产品的价格也受到其他诸多因素的影响,如何从海量的
市场信息中提取出有效指标,制订交易策略,是一个具有挑战性的工作。
1.2 问题提出
基于 2021 年 7 月 14 日至2022 年 1 月 28 日每5 分钟的“数字经济”板块给出的数
据信息,解决以下问题:
问题一:在所提供的 49 项指标中,筛选出与“数字经济”板块有关的主要指标。
问题二:建立模型对每 5 分钟的“数字经济”板块指数进行预测。
二、问题分析
2.1 问题一的分析
针对问题一,由于所给数据中含有缺失值且时间标度不同,故应对所给数据进行预
处理。对于缺失值数据,根据不同的情况采用不同的处理方法,例如,数值拟合法、分
段插值法等;对于时间标度不同,由于大部分数据是以日作为单位,故将其余单位均化
为天。将时间标度统一后,将会产生新的缺失值,再次使用上述处理缺失值的方法处理
新的缺失值。再将数据中的极值通过百分位法和拉依达准则予以替代,最终使用零均值
标准化法将数据标准化。为筛选出符合条件的主要指标,首先进行相关性分析,由于数
据近似正态分布,故采用皮尔逊相关系数对 49 个指标进行相关性检验,筛选出相关性
较强的指标后进行主成分分析,得到最终的指标。
2.2 问题二的分析
针对问题二,通过第一问筛选出来的指标,建立数学模型
文档评论(0)