2018年量化投资与机器学习精选版.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汇添富基金 吴振翔 量化投资与机器学习 2018.5.6 0. 量化投资需要什么技术? 量化投资与机器学习,问题的定义是什么? 需要先定义量化投资,进而才能思考机器学习技术在其中的应用。 我们如何看待量化投资 投资 收益 / 风险 量化投资 ? 根据不同的资金端收益风险需求,使用量化 手段进行资产端配置,为客户提供投资管理 服务。 ? 量化手段主要体现于资产端的投资管理。 资金端 资产端 量化投资的应用场景 ? 绝对收益目标 ? 相对收益目标 按照投资目标划分 ? 权益类资产 ? 固定收益类资产 ? 商品期货类资产 ? 大类资产配置 按照投资标的划分 ? 长期 ? 短期 ? 日内高频 按照投资期限划分 投资标的 期限 目标 量化投资需要解决的问题 无论是绝对收益目标还是相对收益目标,无论何种投资期限, 量化投资需要解决的问题都可以总结为 “挖掘收益”和“控制风险” ? 维度之一:选股, what ? 维度之二:择时, when ? 维度之三:交易执行, how 挖掘收益 ? 市场风险:市场波动风险,跟踪误差风险 …… ? 黑天鹅风险:财务造假,负面新闻 …… ? …… 控制风险 传统量化投资技术 ? 历史行情数据 ? 历史财务数据 ? 历史研究、舆情、公告 …… ? …… 历史数据 ? 将数据结构化,提取特征 ? 按照特定逻辑,通过统计方法对特征建立模 型: ? 因子选股:要统计因子 IC 等指标,传统 因子模型也是基于对收益率的线性回归; ? 择时策略:要统计信号的胜率、赔率、 频率,并在样本内样本外做比对; ? 交易策略:类似于择时; ? 风险控制:绩效分析是基于线性模型的, 其他风险控制手段也基于一些风险特征 在历史上的表现。 经典统计学方法论 ? 将基于历史数据的统计模型应用于当时的投 资问题 ? 为什么模型失效? ? 历史不重演了? ? 历史不会完全重演; ? 模型是历史的不完全表述; ? 我们认为,除非市场出现重大变故 (类似熔断,股指期货限仓),历史 规律不会断然变化,而连续变化的历 史规律是可以捕捉的。虽然历史不会 完全重演,但量化投资仅需要把握部 分重演的历史。 ? 让模型更好表述历史、预测未来,是 量化投资研究的努力方向。 量化投资 量化投资需要什么技术? 数据 处理 建模 大数据 = 新世界 异构数据的流水线 特征工程 ? 结构工程 大数据时代来临,量化投资可以使用的基础 数据充满可能性,大数据有望提升模型表述 能力。 利用工程学方法构造数据分析的流水线, 不断提高数据的时效性。 统计模型基于人类对于数据的观测,依赖 于经营性的特征提取,深度学习可以通过 定义结构进一步挖掘信息。 1. 我们感兴趣的机器学习技术 机器学习技术发展日新月异,但在狭义的量化投资领域的应用才刚刚开 始。 数据获取与数据处理 Source: Big Data and AI Strategies: Machine Learning and Alternative Data Approach to Investing, J.P.Morgan ? 从海外经验来看,投资领域对于另类 数据的使用已经起步,数据使用范围 可谓相当多样。 ? 从数据获取来看,主要来源如下:舆 情文本、卫星图像、交通信息、物流 信息、网络搜索、电商信息等。 ? 对应于这些数据来源,所需要的数据 处理技术包括:自然语言处理、计算 机视觉等。 自然语言处理技术 ? 从数据处理和特征提取角度来看,目 前自然语言处理技术已经较为成熟, 可以对诸如新闻、公告等文本信息进 行大规模处理。 ? 中文分词技术是处理中文文本数据的 基础;词向量技术是将高维且正交的 one-hot 向量,转变为低维且具有几何 意义的向量的技术。 自然语言处理技术 ? 海外某公司现在已经开始提供实时的 Twitter 舆情数据,直观来看, Tweet Volume 和 Sentiment 都没有很 强的领先性,但也不排除精细化处理后对投资能够起到作用。 Source: /charts/#charts-10 计算机视觉技术 ? 卷积神经网络( CNN )为处理具有 空间结构 的数据提供了极大可能。 ? GPU 硬件技术的突飞猛进大大提升了 CNN 的数据处理能力,使得工业界目前已经可以处理大规模的图像 和视频数据。

文档评论(0)

jinzhuang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档