- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汇添富基金 吴振翔
量化投资与机器学习
2018.5.6
0. 量化投资需要什么技术?
量化投资与机器学习,问题的定义是什么?
需要先定义量化投资,进而才能思考机器学习技术在其中的应用。
我们如何看待量化投资
2018-10-29
汇添富基金
量化投资的应用场景
2018-10-29
汇添富基金
量化投资需要解决的问题
2018-10-29
汇添富基金
传统量化投资技术
2018-10-29
汇添富基金
量化投资需要什么技术?
2018-10-29
汇添富基金
1. 我们感兴趣的机器学习技术
机器学习技术发展日新月异,但在狭义的量化投资领域的应用才刚刚开始。
数据获取与数据处理
2018-10-29
汇添富基金
Source: Big Data and AI Strategies: Machine Learning and Alternative Data Approach to Investing, J.P.Morgan
从海外经验来看,投资领域对于另类数据的使用已经起步,数据使用范围可谓相当多样。
从数据获取来看,主要来源如下:舆情文本、卫星图像、交通信息、物流信息、网络搜索、电商信息等。
对应于这些数据来源,所需要的数据处理技术包括:自然语言处理、计算机视觉等。
自然语言处理技术
2018-10-29
汇添富基金
从数据处理和特征提取角度来看,目前自然语言处理技术已经较为成熟,可以对诸如新闻、公告等文本信息进行大规模处理。
中文分词技术是处理中文文本数据的基础;词向量技术是将高维且正交的one-hot向量,转变为低维且具有几何意义的向量的技术。
自然语言处理技术
2018-10-29
汇添富基金
海外某公司现在已经开始提供实时的Twitter舆情数据,直观来看,Tweet Volume和Sentiment都没有很强的领先性,但也不排除精细化处理后对投资能够起到作用。
Source: /charts/#charts-10
计算机视觉技术
2018-10-29
汇添富基金
卷积神经网络(CNN)为处理具有空间结构的数据提供了极大可能。
GPU硬件技术的突飞猛进大大提升了CNN的数据处理能力,使得工业界目前已经可以处理大规模的图像和视频数据。
计算机视觉技术
2018-10-29
汇添富基金
海外某公司通过计算机视觉技术,识别卫星图像等原始图像当中的停车场停车数量信息,进而构建零售、餐饮、酒店等场景的高频经营数据。通过这些高频经营数据可以构建相应的交易信号。
该公司提供了一种交易方法:计算每月的停车量同比增速,季度计算累计同比增速,计算过去6个月同比增速的布林带,当季度累计同比增速穿越布林带上下轨时,触发买入卖出交易。
Source: Big Data and AI Strategies: Machine Learning and Alternative Data Approach to Investing, J.P.Morgan
机器学习模型
2018-10-29
汇添富基金
通过对大量非结构化的数据进行处理,成为数字化、向量化的数据集,进而通过机器学习算法进行建模和训练,是目前机器学习领域的主要方法论。
工业界的机器学习模型主要解决以下问题:
分类(classification)
回归/预测(regression)
其他,如生成模型,强化学习模型等
机器学习模型的表述能力
2018-10-29
汇添富基金
以深度神经网络模型为例,早在1993年,就有学术研究从数学上证明:多层神经网络+非线性激励函数可以近似任何函数。
近期实证研究表明,随着神经网络层数的增加,测试集的准确度逐渐提升;此外,在不增加神经网络层数,仅仅增加参数个数的情况下,模型的效果提升不明显;而在不改变参数个数的情况下,将层数从3层增加至11层,则可以显著提升模型效果。
Source: Goodfellow, I. J., Bengio, Y., Courville, A. (2017). Deep Learning
2. 量化投资与机器学习
我们的实践以及思考
存在的障碍
2018-10-29
汇添富基金
存在的障碍
2018-10-29
汇添富基金
将量化投资和机器学习相提并论是不适合的……
机器学习,从入门到放弃?
2018-10-29
汇添富基金
数据少,噪声大,投入还小,只能做toy model?
我们对股票市场有独到的理解!不需要大量数据和大量投入就能搞出好模型!
相比于现有的量化模型,机器学习的模型和方法能够更好克服人为观测的偏差,如:
市值因子为什么是市值取对数?
反转因子为什么是区间收益率?
风险为什么可以用标准差表示?
现有量化投资的模型都是基于简单的人为观测逻辑,进行历史检验,获得较好效果之后进行使用的。
而机器学习方法论是:对更为广
您可能关注的文档
最近下载
- 最新初中语文教学:第14课《大雁归来》(新人教版八下)市公开课获奖课件省名师示范课获奖课件.pptx VIP
- 雷神游戏手柄TC-G50用户手册.pdf
- 高折射率光学树脂:分子设计、合成工艺与多元应用的深度探究.docx
- 徐锻冲床PSP80说明书.pdf VIP
- 第五单元 走向近代 总结与提升教学设计 2024-2025学年统编版九年级历史上册.docx VIP
- 网架安装施工方案.pdf VIP
- 安川变频器-安川变频器 T1000V.pdf VIP
- 网架安装施工方案.pdf VIP
- 2024教学心得体会:初中数学跨学科主题学习的设计与实施.docx VIP
- 《GB/T 18887-2023土工合成材料 机织/非织造复合土工布》.pdf
原创力文档


文档评论(0)