- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《大数据时代量化投资:功能、挑战与解决路径》.pdf
大数据时代量化投资:功能、挑战与解决路径
黄吉平
摘要:本文介绍了大数据时代量化投资的功能和依据,阐述了大数据时代量化投资面临的挑
战,提出了“基于真实市场的众包预测”和“基于实验室市场的物理学研究方法应用”两种解决路
径,并给出了出具体的例证。
关键词:大数据 量化投资 众包预测 物理学研究方法
中图分类号:F832 文献标识码:A 文章编号:1009-1246(2015)04-0010-06
一、大数据时代量化投资的功能与依据 数据相比,这些数据是多维的,这就使得它们
(一)从“小数据”到“大数据” 变得更为有用。例如:因为我购买的《十万个
随着计算机和互联网的普及,人类已经从 为什么》(第六版)属于科普读物,当当网的系
小数据时代正式迈入大数据时代。大数据出 统就会自动推荐一些科普读物给笔者,并同时
现在我们生活中的各个方面,它涉及众多学科 基于笔者的博士学位推荐一些专业书籍。这
或领域,例如金融经济、医疗卫生、基因组学、 个推荐系统本身就是基于系统掌握的所有数
物理天文、政治、教育、工业等。那么,什么是 据,这些数据属于大数据,它们的用途远远超
小数据?举例来简要说明。在20世纪90年 过“小数据”。
代初,互联网尚未普及,笔者从新华书店购买 当然,以上仅仅是网络销售应用大数据的
了一套《十万个为什么》(第四版),营业员在 一个例子,事实上大数据价值的覆盖范围远远
账簿上能够记录的数据仅包括书名、购买数 超出网络销售,甚至常常超出人们的想象。例
量、价格等。这些数据诚然有用,但是用途较 如,针对手机信号的集体异常(如集体震荡
为有限,所以,不妨把它们称为“小数据”。 等),科学家可以立即推知某个地方正在发生
相比之下,如果今天笔者从当当网上购买 地震;当新电影刚刚入市,科学家可以针对微
一套《十万个为什么》(第六版),当当网的销 博上影迷的转发规律来推知该电影未来的票
售系统能够记录的数据不仅有书名、购买数量 房收入。这些应用与人们的生活密切相关,基
和价格,还可以包括笔者身份信息(性别、年 于先前的小数据无法实现这些应用,可以预
龄、学历等)在内的很多其他数据,与先前的小 见,大数据时代的到来对金融投资领域也会有
本文根据作者2015年4月8日在江苏省扬州市金融学会讲座上的内容整理而来,仅代表作者个人观点,不代表所在
机构的观点。复旦大学硕士生刘璐对本文亦有所贡献,特此致谢。
10
额外的影响。 在大数据时代的量化投资对象方面,量化
(二)从“大数据+投资”到“量化投资” 投资者可能会面临“数据陷阱”,大数据可能
通常所说的“投资”是指定性投资,它属 会使量化投资者有“不识庐山真面目,只缘身
于主观判断型投资,是基于现象的预判而进行 在此山中”的迷茫,除此之外“数据陷阱”还包
的投资。例如:投资经理看到国际金价已经跌 括“尽信数据不如无数据”。例如:有人分析
至生产成本,会预测未来国际金价上升,并出 了淘宝的网络营销数据,发现一些内陆省份通
于此类预测而购买黄金以待升值。主观判断 过网络销售出去的泳衣远远超过广东等沿海
型投资或定性投资的一个最大问题在于,投资 省份,于是得出结论:“泳衣广告的重点应该放
过程中投资者情绪会显著影响投资进程,投资 在新疆和内蒙古,而非广东等沿海省份”。但
者情绪很可能会导致整个投资过程中对于风 这个结论其实是站不住脚的,一方面,在一些
险不能做到客观准确的度量。相比之下,量化 内陆省份,泳衣并非常用物品,当地超市出于
投资运用现代统计学、数学的方法,从大量的 销量的考虑不太乐意销售,这时老百姓如果想
历史数据中寻找价值洼地,构建能够带来高收 购买的话,也只能到网上购买了;另一方面,在
益的各种“大概率”投资策略,并依其所构建 广东等沿海省份,超市里有大量的泳衣,到网
的数量化模型的运行结果进行决策,力求获得 上去购买泳衣的人自然会少很多。这个例子
稳定、持续、高于平均的投资回报。 说明,拘泥于数据本身进行分析并据此作出决
基于大数据
文档评论(0)