互联网大数据在投资中的商业价值(更新数据至最近).docxVIP

互联网大数据在投资中的商业价值(更新数据至最近).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网大数据在投资中的商业价值(更新数据至最近)

互联网大数据在投资中的商业价值 【摘要】 【关键词】互联网;大数据;投资;新闻选股 一、 引言 21世纪是互联网的时代,互联网对人们生活方方面面的影响已经有目共睹,股票市场也不例外。中国股市是名副其实的“政策市”,个股和指数的上涨与下跌主要受到国家政策的影响,而个股对应公司的经营状况可能还不如政策有效。什么是政策?政策就是新闻。对于股指,政策是政府对金融市场、宏观经济、利率的调控;对于个股,”政策”就是公司新闻或者事件。尽管事件驱动就是研究股票价格随着一些特定上市公司事件的变动,而公司新闻的研究就要比事件驱动更广,比如说事件驱动只是涉及像定向增发、高管增持、收购等,而公司新闻则可能是A公司与B公司合作、遭监管部门调查、高管进军某一领域等等。因此,我们需要实证地检验新闻选股的有效性,也就是个股新闻对股票价格的影响。下面几个部分是按照整个模型搭建的顺序依次阐述,分别为:关键词库的搭建与利好新闻的筛选、关键词的重新筛选、新闻选股策略的回测、加入其他筛选条件的对比、未来可能的改进。 二、 互联网大数据在投资中的应用现状 (一) 案例研究 1. 百度百发100指数 百度和广发基金合作,综合了上市公司的财务因子(ROE、EPS等)、股票的动量因子(最近一个月的收益率和波动率)、搜索因子(百度中关于股票或者上市公司的搜索总量和增量),给每只股票进行打分,取前100只股票作为成分股。指数基金于2014年10月30日成立开放申购,26小时内申购量达21亿;2015年4月10日重新开放申购,仅通过百度金融中心渠道4分钟销售量过亿元,现在规模为28亿元。 2. 南方新浪大数据指数 新浪和南方基金合作,除了利用股票的财务因子、动量因子,还利用了新浪财经中股票行情的搜索量、与股票相关新闻的点击热度、股票相关微博的多空分析。指数基金于2015年4月22日开放申购,目前规模为12亿元。 3. APP: 股票雷达、百度股市通 股票雷达:运用网络爬虫技术实时扫描各大股吧、财经微博、名家博客,抓取业内专家、民间高手的投资观点,结合券商的研究报告、行业权威新闻,帮助股民进行更有效的投资决策。 百度股市通:基于百度搜索引擎,对全网的热点新闻进行检索,通过文本分析的技术提取关键词和相关股票,比如近期的“一带一路” (二) 互联网大数据在投资中的应用模式 互联网大数据在股票投资领域有以下一些应用模式。 证券关注度:是某只股票或者对应的上市公司受关注的程度,主要方法是通过每天定时(比如早上8点)抓取前面一段时间该只股票在互联网上的热度,可以用涉及该股票的新闻点击量+微博阅读量/转载量+股吧评论数量来计算。考虑到中国股票市场的特点,在其他条件一样的情况下,受关注的股票后期涨幅更大,因此关注度可以作为一个股票因子,和其他基本面类因子(ROE、ROA、净利润、净利润增速、负债率等)、市场类因子(过去一个月的涨幅、过去半年的涨幅、Beta、波动率、换手率等)、评价类因子(机构评级、评级为买入的量、评级上调的量等),构建股票的多因子模型。 新新闻:是实时的跟踪各大新闻网站发布关于股票的新闻,考虑到现在财经类媒体数量不断增加,很多关于上市公司的新闻在一家媒体发出之后,其他媒体都会转载,这样就极大地增加了网站浏览者或者APP用户的信息搜索成本。另外不同的网站对上市公司以及新闻的侧重点不一样,因此对全网进行股票相关的新闻搜索并且和之前的搜索结果进行查重,通过自然语言处理及机器学习的方法可以很准确地判断当前发布的新闻是否有其他的网站已经发布。另外,还可以通过将不同媒体、专家、散户对同一新闻的解读总结集成到一起,就能在不丢失信息的前提下大大节省用户的时间成本。事实上,最近美国的高盛对金融数据服务商Kensho投资1500万美元,助其研发一种针对专业投资者的大规模数据处理分析平台,取代现有的各大投行分析师们的工作。类似于此,相对于Kensho整合结构化的金融数据并转化成非结构化的分析师的语言,新新闻的另一个亮点就是通过整合互联网媒体上的非结构化的新闻,并通过新闻分类,整合成更具有结构性的文本信息。 主题聚类:物以类聚,人以群分,股票也如此。股票对应的是上市公司,上市公司可以按照行业、主题、概念等来进行划分,比如上市公司可以按照行业划分为电力、酿酒、机械、电子、煤炭、银行、券商等,按照概念划分为北斗导航、特斯拉、无人机、新能源、一带一路、国企改革等。一般来说每家上市公司都有自己的主营行业,因此所属行业都比较固定;然而考虑到主题概念是由一个特定事件引起的,比如一带一路概念股就是在“一带一路”这个概念提出来之后受益的股票,实际上“一带一路”的概念也是在不断地完善,影响范围也会随着政策的变化而发生变化,因此概念股也会相应的变动。这种变动不是绝对的,通过对政策研究

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档