猴王大圣(毕业设计)_热搜指数平台的设计与实现.pdfVIP

猴王大圣(毕业设计)_热搜指数平台的设计与实现.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

[在此处键入]

引言

热搜指数就是一个基于搜索引擎的大数据统计并处理后展示数据的平台,他能帮助

用户做一些决策,能反映一定程度的社会趋势和发展方向,既能回顾历史也能展现未来,

探索数据的价值。在高速发展的社会,知识技术更新替代也进行了加速,“落后就会挨

打”。所以要想跟进社会的步伐,无论是个人兴趣还是企业发展或者个人规划,通过浏

览热搜指数平台就能查看社会最新发展趋势获取最新的知识技术进展,为人们提供最准

确的建议。在网络信息化的社会网民迅速增加‘大数据’也孕育而生,人们在网络上使

用的流量数据,每天呈现指数式的增长,面对庞大的数据只通过人为的分析并不是很理

智的选择,而且工作量是相当的大,要想轻松方便的探索数据的价值,开发一个热搜指

数平台是很好的方法。

华东交通大学理工学院毕业设计

1绪论

1.1背景分析

现在的各种平台都会具有检索功能,每个词条本身就具有一定的属性,但是他在不

同的环境能产线不同的新属性,在搜索的时候会结合地区,时区,用户等环境产生新的

属性,而这些属性并不是没有价值,只是不能轻易的被人们发现而已,热搜指数平台就

是旨在展示一些不能被人们轻易发现的数据价值。

1.2研究现状

国内研究现状:

在国内市场中主要有百度指数头条指数微指数阿里指数等。相比于国外市场呈

现出多而杂的场面,目前做的相对较好的指数系统就算是百度指数了,支持基于单个词

的搜索趋势、需求图谱、行情管理、人群分布;基于行业的整体发展趋势、地域数据分布、

用户属性、检索时间特征。其缺点是各家的指数数据来源都是自家单一的数据源,并不

能将所有网络数据源整合在一起,所以这些指数图谱的可靠性有待提升。比如百度的大

部分数据都是来自百度搜索,微指数的数据来源于微博,阿里指数数据源于淘宝。

国内发展趋势:

纵观国内发展状况,百度指数只是单一的百科搜索的数据,微博则是娱乐数据,微

信和头条是文章的数据,阿里也只是展示自己的淘宝数据,所以各大网络平台的通病就

是数据的单一性和不可靠性。互联网本来就是开放的世界,如果各家为了利益而争的头

1

刘威:热搜指数平台

破血流就毫无意义了,如果各家只使用自家数据这必然导致指数的可靠性大大减少,未

来各大互联网平台如果开放数据,整合全网平台的数据将会大大提升数据的可靠性和精

准性,这也必将是国内的发展趋势。

1.3研究意义和内容

通过搜索引擎市场分析,早在2010年底,国内搜索引擎市场渡过调整期开始步入

成熟期。搜索引擎商业价值获得广泛认可,整个市场内的发展会呈现出“数量”的积累

到“质量”的大幅提升。商业模式逐渐完善,市场保持发展,APRU值也会显著提升;,

2012年左右,中国搜索引擎市场将出现高质量的发展。

调查结果显示,2015年底,中国搜索引擎市场发展成熟,市场格局趋稳,2015年

各搜索引擎企业在创新领域开始加大搜索引擎的应用,社会各相关领域已经开始和搜索

引擎相结合,搜索引擎市场的发展必然会积累大量的用户数据,而这些数据记录并非无

用的,或许一两个的数据并不能说明什么,一旦几万甚至几亿人产生的数据那就变得有

很重要的参考价值了。

2015年8月31日,国务院发布“促进大数据发展行动纲要”说道大数据是以容量

大、类型多种、存取速度快和低价值密度为主要特征的数据集合,它正在迅速发展,以

大量分散的来源和不同的格式收集,存储和关联数据。从中发现新知识、创造新价值、

提升新能力的新一代信息技术和服务业态。在互联网飞速发展的社会,每天的数据流呈

现指数式的增长。2017年中国网民就已经超过7亿了,比2008年网民数量的两倍还多,

网络用户产生的数据更是超过万亿TB。随着5G技术的开始使用,预计到2025年,国

内网民用户产生的数据总量将是2017年的20倍,达到200ZB。伴随数据量的高速膨胀,

对于大数据的存储和大数据的开发需求必然快速增加。

随着信息技术的高速发展,网民的数量也急剧增加,互联网信息高速传播,这个时

代产生的数

文档评论(0)

186****1297 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档