- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络大数据——复杂网络的新挑战:如何从海量数据获取信息?.pdf
第l期 网络科学热点问题荟萃 7
网络大数据
复杂网络的新挑战:如何从海量数据获取信息?
周 涛
r电子科技大学互联网科学中心 成都 610054)
doi:lO.3969j/.issn.1001·0548.2013.O1.004
2012年3月,奥巴马政府公布了 “大数据研发计 力和数据采集能力的提升,处理全体数据将成为趋
划”,美国国家科学基金会、国防部、能源部、国 势,但抽样仍然是 目前处理海量数据问题的一种常
家健康研究所、地质勘探局和国防部先进研究计划 用方法,而网络抽样不同于从一堆数中抽样去逼近
局六个联邦部门和机构共同投资2亿美元,致力于提 原始分布,后者有明确的最优 目标,前者则无章可
高和改进人们从海量和复杂的数据中获取知识的能 循——什么样的网络抽样才算是好的呢?应该用什
力。这是美国1993年宣布 “信息高速公路”计划后 么方法抽样呢?抽样误差如何估计呢?大数据之间
又一次重大科技发展部署。2012年5月,我国召开第 需要通过关联和交叉复用展现出’l+l2的价值,以网
424次香山科学会议,这是我国第一个以大数据为主 络科学的语言来做比喻,就是希望破译 “人人网”
题的重大科学工作会议。中国计算机学会、通信学 里面的某A就是 “中国移动手机通讯网络”中的某B,
会等于今年分别成立了 “大数据专家委员会”。国 并且分析两个网络之间到底存在多少结构和功能的
家 自然科学基金委员会2013年的 《项 目指南》中, 关联性。另外,可视化展示能够帮助科学家快速从
大数据成为最热门关键词12012年12月l3日,中关 大数据中验证科学猜想并获得新的科学发现,大规
村成立大数据产业联盟,由云基地、联通、用友、 模网络的可视化也已被认为是一种有助于理解和分
联想、百度、腾讯、阿里巴巴等企业组成了第一批 析网络的有效方法。
理事单位。 除了上述提到的一些共性问题外,此处我们着
数据量的激增带来了很多共性问题,譬如数据 重介绍两个网络大数据独特的问题:一是预测问题,
的可表示、可处理和可靠性问题等等。与此同时, 二是图的快速算法问题。
各学科 自身也有各具特色的大数据问题。网络科学 预测是大数据最核心的科学问题。目前学术界
既是以网络为研究对象的一门有数百年历史的专业 主要关心两类预测问题,一是趋势预测,二是缺失
性很强的学科,又是众多学科中不同研究对象的统 信息预测。趋势预测是指通过事物的一些基本属性
一 抽象的表达方式,其所遭遇的问题和挑战往往特 信息和早期的态势分析,预测事物发展的轨迹和最
别典型、特别重要 !目前万维网具有超过万亿的统 终影响力 【。这样的例子很多,譬如通过分析社交
一 资源定位符(URL),Facebook有lO亿节点和千亿连 网络中注册一个月的用户的行为以及这些用户与其
边,大脑神经元网络有数百亿节点,中国三大运营 他用户的互动,预测哪些用户将来会成为很有影响
商的手机通讯网络无一不拥有数亿用户……如何处 力的用户;通过用户一商品二部分图中产品的早期表
理超大规模的网络数据,已经成为学术界和企业界 现,例如一首新歌或一个新歌手上线一周的情况,
亟待解决的关键科学技术问题。
文档评论(0)