《R 语言》实验报告.docx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE PAGE 10 《R 语言》实验报告 专业班级: XXXX 成员姓名: XXXX XXX XXX XXX 指导教师: XXX 日 期: XXXX-XX-XX 一、问题重述 3 1.1 问题背景 3 二、问题分析 3 问题一的分析 3 问题二的分析 3 三、数据预处理 4 数据选取 4 缺失值处理 5 数据统一化 5 数据去极值 7 数据标准化 7 四、模型的建立与求解 7 问题一模型的建立与求解 7 模型的建立 8 模型的求解 9 模型的结果 10 问题二模型的建立与求解 11 模型的建立 11 模型的求解 13 模型的结果 14 五、模型评价与改进 15 六、附录 16 附录 1 16 附录 2 18 一、问题重述 问题背景 量化投资是指通过数量化方式及计算机程序化发出买卖指令,以获取稳定收益为目的的交易方式。投资者通过数据分析探索市场运行规律,并预测市场走势,从而进行决策交易。随着大数据技术的发展,量化投资在全球金融交易市场上的地位愈加重要。但是由于市场信息十分庞杂,同时产品的价格也受到其他诸多因素的影响,如何从海量的市场信息中提取出有效指标,制订交易策略,是一个具有挑战性的工作。 问题提出 基于 2021 年 7 月 14 日至 2022 年 1 月 28 日每 5 分钟的“数字经济”板块给出的数据信息,解决以下问题: 问题一:在所提供的 49 项指标中,筛选出与“数字经济”板块有关的主要指标。 问题二:建立模型对每 5 分钟的“数字经济”板块指数进行预测。 二、问题分析 问题一的分析 针对问题一,由于所给数据中含有缺失值且时间标度不同,故应对所给数据进行预处理。对于缺失值数据,根据不同的情况采用不同的处理方法,例如,数值拟合法、分段插值法等;对于时间标度不同,由于大部分数据是以日作为单位,故将其余单位均化为天。将时间标度统一后,将会产生新的缺失值,再次使用上述处理缺失值的方法处理新的缺失值。再将数据中的极值通过百分位法和拉依达准则予以替代,最终使用零均值标准化法将数据标准化。为筛选出符合条件的主要指标,首先进行相关性分析,由于数据近似正态分布,故采用皮尔逊相关系数对 49 个指标进行相关性检验,筛选出相关性较强的指标后进行主成分分析,得到最终的指标。 问题二的分析 针对问题二,通过第一问筛选出来的指标,建立数学模型来预测股票数据。“数字经济”板块的数据波动幅度较大,进行线性回归的效果不理想。故首先将每天每 5 分钟开盘价与收盘价之差的和定义为差价,同时将差价以零为分界线划分为两部分,采用Logistic 回归模型进行拟合,但 Logistic 回归模型对指标的多重共线性非常敏感、计算 过程复杂。Lasso 方法是将惩罚函数转化为绝对值的形式,通过对回归系数进行压缩, 将某些指标的系数压缩为 0 以此来达到变量筛选的效果。但 Lasso 方法存在对指标压缩过度的问题。因此,Hui Zou 于 2006 年在此基础上提出了对不同指标进行不同程度压缩的 Adaptive Lasso 方法,它能有效减弱指标系数估计的有偏性。下文将使用 Lasso 方法来对 Logistic 回归模型中的指标进行筛选,以此解决 Logistic 回归模型在识别过程中存在的指标多重共线性和计算复杂等问题。 三、数据预处理 数据选取 本文选取“数字经济(CSI:931582)”板块股票信息以及 49 个股票量化指标作为 研究对象,研究区间为 2021 年 7 月 14 日至 2022 年 1 月 28 日。将所选取的 49 个量化指标分为五大类:宏观市场指标、国内股票市场指标、技术指标、国际股票市场指标、其他板块信息(见表 1)。数据来源于同花顺 iFinD 和国家统计局,具有一定的权威性, 且数据质量较高。数据分析软件和编程软件为 EXCEL、SPSS 与R。 表 1 量化指标分类 宏观市场指标 采购经理指数、社会消费品零售总额、居民消费价格指数、人民币贷款利率 国内股票市场指标 上证综合指数成交量、上证综合指数成交金额、沪市股票流通市值、深市股票流通市值、沪深 300 指数、上证综合指数、中证 500 指数、创业板指数、上证 50 指数、上证 A 股指数、深证成份指数、 深证综合指数、股票市场总值 技术指标 VMA、VMACD、ARBR、OBV、BBI、DMA、MA、EXPMA、MTM、MACD、BIAS、KDJ、RSI、BOLL 国际股票市场指标 道琼斯工业指数、纳斯达克综合指数、标准普尔 500 指数、美国 证交所指数、香港恒生指数、东京日经 225 指数、伦敦金融时报100 指数、法国巴黎 CAC40 指数、荷兰 AE

文档评论(0)

暗伤 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档