- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会网络发现综述
肖韬1
(南京大学计算机科学与技术系,南京 210093 )
Comprehensive Introduction to Social Network Discovery
XiaoTao1
(Department of Computer Science and Technology, Nanjing University, Nanjing 210093, China)
Abstract: As a subdomain of data mining discipline, social network discovery concentrates on finding relationship
among objects. In contrast to traditional data mining tasks, data in social network discovery tasks do not satisfy the
assumption that they are independent, identically distributed. This paper introduces the concept of social network
discovery, the feature of concerned data, basic methods and applications as well as the concept of link mining and
its theoretical background and classical tasks.
Keywords: data mining; social network discovery; graph; relationship; link mining
摘 要: 社会网络发现是数据挖掘学科的一个子领域,致力于从数据中找出对象与对象之间的关系。与传
统的数据挖掘任务不同,社会网络发现任务中的数据不满足独立同分布的假设。本文介绍了社会网络发现
的概念、数据特征、基本方法与实际应用,并对链接挖掘的概念、理论背景及几种常见的任务做了简要阐
述。
关键词: 数据挖掘;社会网络发现;图;关系;链接挖掘
1 数据挖掘学科概述
在计算机被发明之前的时代,人类存储信息的主要载体是纸张。虽然全世界的图书(以及报纸等各种
类型的纸张)很多,但是以今天的眼光来看,当时的信息量并不算多。自从计算机被发明以来,记录信息
的方式发生了根本性的变化:计算机所独有的数据存储、输入、生成、交换功能,使得人类可以以前所未
有的低成本和高速度来存储、生成、使用和传递大量的信息,几乎可以说人类进入了信息时代。
但是真正带来信息爆炸效应的是Internet 的普及。随着目前Internet 的无孔不入,在互联网上每天都有
海量的信息在生成和传递,并且这些海量数据每天还在以越来越快的速度增长,这些数据在目前的技术条
件下已经不可能全部地进行实时处理(当然对于我们所需的部分数据是可以进行有效分析的),并且将来处
理的难度和强度将越来越大,以至于人们处理数据的速度将跟不上数据产生的速度,这就是人们惊呼的“信
息爆炸”时代的到来。
面对如此海量的数据,人们发现已有的数据处理和提炼的工具是多么地匮乏,我们迫切需要新的、更
加有效的工具来从这海量的数据中“挖掘”出对我们有价值的信息,这就是数据挖掘这门学科最根本的目
的所在。按照J. W. Han 和Micheline Kamber 的定义,数据挖掘是从巨量数据中发现有效的、新颖的、潜在
有用的并且最终可理解的模式的非平凡过程[3]。 经过几十年的研究和发展,数据挖掘学科已经在社会经
济的各个方面得到了普遍的应用,其从海量数据中挖掘出极具价值的信息的例子也是数不胜数,例如沃尔
玛超市中“啤酒和尿布”的例子就是一个典型:经过对货物的销售记录数据进行分析,沃尔玛发现很多购
买尿布的人同时也购买了啤酒,故而沃尔玛有意将尿布与啤酒的货架放在一起,大大提高了这二者的销量。
*作者简介:肖韬(生于1985 年),男,江苏省南京市人,硕士研究生在读,主要研究领域为计算机体系结构与并行计算。
经过数十年的研究与发展,数据挖掘技术已经在很多的方面取得了成功,同时,数据挖掘技术也呈现
出更加细化和专业化的发展趋势:向着各个子领域深入地发展。例如,在多媒体领域的数据挖掘、在医疗
领域的数据挖掘以及在
文档评论(0)