不可不知的N种量化策略模型.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
不可不知的 N 种量化策略模型 量化之星-策略模型研究小组 近一两年来 ,机器学习这个话题在量化投资界可谓是炙手可热,小编身边非常多的朋友都在 讨论、研究,甚至是把机器学习直接应用到量化交易当中。当然,也有另外一批朋友持完全 相反的意见,认为机器学习根本不可靠~ 因此,今天小编就来跟大家一起探讨一下这个话题。 机器学习 所谓机器学习,其实就是根据样本数据寻找规律,然后再利用这些规律来预测未来的数据(结 果)。 但是,直到今天,机器学习也没有一种被大家广泛认同的理论框架产生,这个也是机器学习 被大家诟病的原因之一:它是没有理论基础的。 目前机器学习的方法大概可以分为以下几种: 1、经典的参数统计估计方法 :基于传统统计学,需要已知的样本分布形式,局限性比较大。 2、经验非线性方法 :利用已知样本建立非线性模型(如人工神经网络),克服了传统参数 估计方法的困难,但缺乏统一的数学理论。 3、统计学习理论 (SLT ):专门研究小样本情况下机器学习规律的理论,核心概念是 VC 维 概念,解决了神经网络结构选择、局部极小点等问题。支持向量机(SVM )就是基于这一 理论产生的。 SVM 支持向量机择时策略 支持向量机 支持向量机(SVM )这名字听上去就挺高端的,跟小编本人的气质非常配! 老有人要小编爆照,现在你们满意了么? ! 所以,到底支持向量机是啥呢? 请看以下解释: “支持向量机是用来解决分类问题的。 先考虑最简单的情况,豌豆和米粒,用晒子很快可以分开,小颗粒漏下去,大颗粒保留。用 一个函数来表示就是当直径 d 大于某个值 D ,就判定为豌豆,小于某个值就是米粒。 dD, 豌豆 ;dD, 米粒 在数轴上表现为 d 左边就是米粒,右边就是绿豆,这是一维的情况。 但是实际问题没这么简单,考虑的问题不单单是尺寸。 一个花的两个品种,怎么分类? 假设决定他们分类的有两个属性,花瓣尺寸和颜色。单独用一个属性来分类,像刚才分米粒 那样,就不行了。这个时候我们设置两个值 :尺寸 x 和颜色y。 我们把所有的数据都丢到 x-y 平面上作为点 ,按道理如果只有这两个属性决定了两个品种, 数据肯定会按两类聚集在这个二维平面上。 我们只要找到一条直线,把这两类划分开来,分类就很容易了,以后遇到一个数据,就丢进 这个平面,看在直线的哪一边,就是哪一类。 例如 :x+y-2=0 这条直线,我们把数据(x,y)代入,只要认为 x+y-20 的就是A 类,x+y-20 的就是 B 类。 以此类推,还有三维的,四维的,N 维的属性的分类,这样构造的也许就不是直线,而是 平面,超平面。 例如:一个三维的函数分类 :x+y+z-2=0 ,这就是个分类的平面了。 有时候,分类的那条线不一定是直线,还有可能是曲线,我们通过某些函数来转换,就可以 转化成刚才的那种多维的分类问题,这个就是核函数的思想。 例如:分类的函数是个圆形 x^2+y^2-4=0。这个时候令x^2=a; y^2=b,还不就变成了 a+b-4=0 这种直线问题了。 这就是支持向量机的思想。 机的意思就是算法,机器学习领域里面常常用 “机”这个字表示算法。 支持向量意思就是数据集种的某些点,位置比较特殊,比如刚才提到的x+y-2=0 这条直线, 直线上面区域x+y-20 的全是A 类,下面的 x+y-20 的全是 B 类,我们找这条直线的时 候,一般就看聚集在一起的两类数据,他们各自的最边缘位置的点,也就是最靠近划分直线 的那几个点,而其他点对这条直线的最终位置的确定起不了作用,所以我姑且叫这些点叫 “支持点” (意思就是有用的点),但是在数学上,没这种说法,数学里的点,又可以叫向 量,比如二维点(x,y)就是二维向量,三维度的就是三维向量(x,y,z)。所以 “支持点”改叫 “支持向量” ,听起来比较专业,NB。 所以就是”支持向量机”了。” 【1】 当然了,SVM 的实际理论要复杂的多,如果大家有兴趣,就自行去搜索一下参考资料来看 啦,由于篇幅关系,这边就不赘述了。 核函数分类 目前应用最多的四类核函数分别为:线性核函数、多项式核函数、高斯核函数和 Sigmoid 核函数。 选择不同的核函数和参数,SVM 的性能会有很大的差异,因此核函数及其参数的选择是 SVM 理论和应用研究中的一个重要课题。 SVM 看上去是比较复杂,但是在实际应用当中还是比较简单的,因为 Matlab 本身就已经 提供了 SVM 的工具箱(函数),我们直接调用就可以了,当然,大家也可以自行

文档评论(0)

yuxiufeng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档