- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PAGE
PAGE 10
《R 语言》实验报告
专业班级: XXXX 成员姓名: XXXX XXX XXX XXX 指导教师: XXX 日 期: XXXX-XX-XX
一、问题重述 3
1.1 问题背景 3
二、问题分析 3
问题一的分析 3
问题二的分析 3
三、数据预处理 4
数据选取 4
缺失值处理 5
数据统一化 5
数据去极值 7
数据标准化 7
四、模型的建立与求解 7
问题一模型的建立与求解 7
模型的建立 8
模型的求解 9
模型的结果 10
问题二模型的建立与求解 11
模型的建立 11
模型的求解 13
模型的结果 14
五、模型评价与改进 15
六、附录 16
附录 1 16
附录 2 18
一、问题重述
问题背景
量化投资是指通过数量化方式及计算机程序化发出买卖指令,以获取稳定收益为目的的交易方式。投资者通过数据分析探索市场运行规律,并预测市场走势,从而进行决策交易。随着大数据技术的发展,量化投资在全球金融交易市场上的地位愈加重要。但是由于市场信息十分庞杂,同时产品的价格也受到其他诸多因素的影响,如何从海量的市场信息中提取出有效指标,制订交易策略,是一个具有挑战性的工作。
问题提出
基于 2021 年 7 月 14 日至 2022 年 1 月 28 日每 5 分钟的“数字经济”板块给出的数据信息,解决以下问题:
问题一:在所提供的 49 项指标中,筛选出与“数字经济”板块有关的主要指标。
问题二:建立模型对每 5 分钟的“数字经济”板块指数进行预测。
二、问题分析
问题一的分析
针对问题一,由于所给数据中含有缺失值且时间标度不同,故应对所给数据进行预处理。对于缺失值数据,根据不同的情况采用不同的处理方法,例如,数值拟合法、分段插值法等;对于时间标度不同,由于大部分数据是以日作为单位,故将其余单位均化为天。将时间标度统一后,将会产生新的缺失值,再次使用上述处理缺失值的方法处理新的缺失值。再将数据中的极值通过百分位法和拉依达准则予以替代,最终使用零均值标准化法将数据标准化。为筛选出符合条件的主要指标,首先进行相关性分析,由于数据近似正态分布,故采用皮尔逊相关系数对 49 个指标进行相关性检验,筛选出相关性较强的指标后进行主成分分析,得到最终的指标。
问题二的分析
针对问题二,通过第一问筛选出来的指标,建立数学模型来预测股票数据。“数字经济”板块的数据波动幅度较大,进行线性回归的效果不理想。故首先将每天每 5 分钟开盘价与收盘价之差的和定义为差价,同时将差价以零为分界线划分为两部分,采用Logistic 回归模型进行拟合,但 Logistic 回归模型对指标的多重共线性非常敏感、计算
过程复杂。Lasso 方法是将惩罚函数转化为绝对值的形式,通过对回归系数进行压缩, 将某些指标的系数压缩为 0 以此来达到变量筛选的效果。但 Lasso 方法存在对指标压缩过度的问题。因此,Hui Zou 于 2006 年在此基础上提出了对不同指标进行不同程度压缩的 Adaptive Lasso 方法,它能有效减弱指标系数估计的有偏性。下文将使用 Lasso 方法来对 Logistic 回归模型中的指标进行筛选,以此解决 Logistic 回归模型在识别过程中存在的指标多重共线性和计算复杂等问题。
三、数据预处理
数据选取
本文选取“数字经济(CSI:931582)”板块股票信息以及 49 个股票量化指标作为
研究对象,研究区间为 2021 年 7 月 14 日至 2022 年 1 月 28 日。将所选取的 49 个量化指标分为五大类:宏观市场指标、国内股票市场指标、技术指标、国际股票市场指标、其他板块信息(见表 1)。数据来源于同花顺 iFinD 和国家统计局,具有一定的权威性, 且数据质量较高。数据分析软件和编程软件为 EXCEL、SPSS 与R。
表 1 量化指标分类
宏观市场指标
采购经理指数、社会消费品零售总额、居民消费价格指数、人民币贷款利率
国内股票市场指标
上证综合指数成交量、上证综合指数成交金额、沪市股票流通市值、深市股票流通市值、沪深 300 指数、上证综合指数、中证 500 指数、创业板指数、上证 50 指数、上证 A 股指数、深证成份指数、
深证综合指数、股票市场总值
技术指标
VMA、VMACD、ARBR、OBV、BBI、DMA、MA、EXPMA、MTM、MACD、BIAS、KDJ、RSI、BOLL
国际股票市场指标
道琼斯工业指数、纳斯达克综合指数、标准普尔 500 指数、美国
证交所指数、香港恒生指数、东京日经 225 指数、伦敦金融时报100 指数、法国巴黎 CAC40 指数、荷兰 AE
您可能关注的文档
- 《R 语言》实验报告.pdf
- Java学科面试宝典.pdf
- 202X墨尔本大学本科申请条件.doc
- 单片机课程设计--基于蜂鸣器的简易播放器.doc
- Java 学科面试宝典.docx
- 寒假家务手抄报模板.docx
- 计算机基础知识.docx
- 《岳阳楼记》课件完整.pptx
- 2023年经理年终总结.pptx
- 冬季用电防火安全指南.pptx
- 2023年助理医师资格证考试之公共卫生助理医师综合提升训练试卷含答案讲解.docx
- 2022-2023年中级会计职称之中级会计财务管理通关训练试卷含答案讲解.docx
- 助理医师之中医助理医师综合提升模拟考试试卷包括详细解答.docx
- 2022-2023年中级会计职称之中级会计财务管理练习题附答案.docx
- 初级经济师之初级经济师人力资源管理考前冲刺练习题库附有答案详解.docx
- 2022-2023年中级会计职称之中级会计经济法练习题包括详细解答.docx
- 2023年企业人力资源管理师之三级人力资源管理师考前冲刺测试卷含答案讲解.docx
- 资产评估师之资产评估基础通关检测卷附有答案详解.docx
- 2022-2023年健康管理师之健康管理师三级练习试题和答案.docx
- 2022-2023年银行招聘之银行招聘综合知识综合提升测试卷附答案.docx
1亿VIP精品文档
相关文档
最近下载
- 江苏海洋大学毕业答辩通用PPT模板.pptx
- DB36/T 1039-2018 水利建设工程质量监督规程(完整).pdf
- 内燃机车钳工测试题【附答案】.doc
- 高中数学新教材《8.6.3平面与平面垂直》优质课课件.ppt
- 作业活动风险分级管控清单(纺织企业).pdf VIP
- 中国共产党纪律处分条例解读党课课件.pptx VIP
- 露天煤矿行政管理制度.docx VIP
- 小学体育与健康人教课标版三~四年级(2013)_浙江省体育与健康教案模板3.0(后滚翻) 公开课.doc
- 贵州教育出版社六年级下册综合实践活动教案.pdf
- 危害分析与关键控制点(HACCP)体系 认证要求(V1.0)管理手册.docx
文档评论(0)