- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
企业并购中的对赌协议应用分析与启示以蓝色光标并购精准阳光为例
企业并购中的对赌协议:应用、分析与启示--以蓝色光标并购精准阳光为例
- 1 -
江梦成,雷钦礼**
(暨南大学经济学院,广州 510632) 5
摘要:大数据时代下海量的网络数据蕴含着消费者的行为习惯,这些数据能够实时反映着社
会经济变化状况。本文基于数据挖掘方法和网络搜索数据,建立消费者信心指数预测的模型
分析框架,构建了网络搜索关键字的进入退出机制,使用不同数据挖掘方法对消费者信心指
数进行预测。实证证明,搜索关键字的进入退出机制能够反映消费者消费行为的变化规律,10
模型预测与官方数据相比能够提高一个月。
关键词:网络搜索数据;消费者信心指数;数据挖掘;关键字筛选;移动窗口分析
Consumer confidence index forecasting based on Web
search data 15
Jiang Mengcheng, LEI Qinli
(Economics School,Jinan Uniwersity,Guangzhou 510632)
Abstract: In the big data era, massive data contains consumer habits, these data can reflect
real-time changes in the socio-economic situation. This article bases on data mining and Internet
search data, building consumer confidence index prediction model analytical framework, and 20
building network search keywords entry-exit mechanism, using different methods of data mining
to predict consumer confidence index. Empirical proof, the search keywords entry-exit mechanism
can reflect the changes of consumer behavior, compared with the official data the model
predictions can also be a month earlier.
Key words: Internet search data ; consumer confidence index; data mining ; select keywords ; 25
moving time analyzing
0 引言
随着互联网的普及,互联网已经渗透到了我们生活方式的方方面面。互联网的应用从信
息的获取、休闲娱乐,发展到衣食住行、医疗健康等民生服务,加快了相关产业的升级和改30
造。其中,搜索引擎、网络新闻作为互联网的基础应用,其使用率达到 80%以上,越来越
多的人依赖于互联网来获取相关信息。
人们在使用互联网去搜索相关信息的同时,互联网的相关应用也将人们在搜索过程当中
的行为记录下来,这些行为也在一定程度上揭示了人们的兴趣爱好,因此生产商与需求者在
商品市场表现的行为会与互联网上的搜索行为具有一定的相关性,基于网络搜索行为构建消35
费者信心指数有一定的微观基础。与传统的信息相比,互联网信息最大的特点就是其具有高
度的时效性,而传统信息在收集过程中和传播过程中需要大量的人力干预,从而导致时滞性,
也正因为这样,网络搜索信息变化会领先于传统的信息变化。利用互联网网络搜索数据的流
行性、相关型以及领先性,可以对社会的经济现象做监测以及预测。
40
- 2 -
1 文献综述
应用网络搜索数据来预测社会经济现象最早是在流行病的监控。Johnsona、Heather 通
过分析医学类网站的访问日志以及有关流感文章的访问次数,发现这些访问数据与美国疾病
监控中心公布的患流感人数有很强的相关性[1]。网络搜索数据引起广大研究者注意是始于
2009 年,这一年 Google 研究员发现每当流感爆发前,流感相关的搜索关键字搜索量会明显45
增加,背后的主要原因在于人们在患上流感或者有流感症状时会在网络上进行搜索相关信息
[2]。Google 研究员利用这一现象,从 100 个关键词当中经过相关性分析筛选得出 45 个关键
词,并通过线性模型、时间序列模型进行预测,得到的结果与美国疾病监控中心公布的患流
感人数的准确率能达到 97%,并且能够提早一周至两周的时间进
文档评论(0)