数据挖掘之社会网络分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会网络分析 管理科学与工程 王琛 部分互联网中的网络 纽约州电力网 神经网络 猪流感传播网络 社会网络分析 1. 什么是社会网络 2. 社会网络的特征 3. 社会网络的分析方法—链接挖掘 4. 挖掘社会网络 六度分割 Six Degrees of Separation,中文翻译包括以下几种: 六度分割理论或小世界理论等。 理论指出:你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。这就是六度分割理论,也叫小世界理论。这种现象,并不是说任何人与人之间的联系都必须要通过六个层次才会产生联系,而是表达了这样一个重要的概念:任何两位素不相识的人之间,通过一定的联系方式,总能够产生必然联系或关系。显然,随着联系方式和联系能力的不同,实现个人期望的机遇将产生明显的区别。 9.2.1 社会网络是由图表示的异构多关系的数据集。节点对应对象,边对应表示对象间的联系或相互作用的链接。节点和链接都有属性。链接可以是单向的并且不必是二元的。 社会网络分析的意义 1 利用节点的大量信息探测社会网络的结构,由结构研究网络的功能。 2 通过对已有节点的挖掘,探索新的节点。 3 通过对已有网络的研究设计新的网络。 任何一种用于建立个体之间联系的自然现象、社会活动或技术机制都可能形成一张网 “朋友关系”(对称,无向图) “知晓关系”(不对称,有向图) “文献引用关系”(不对称,有向图) co-author关系(对称,无向图,成块“clique”) 通电话,通信 病毒传染(生物、计算机) 网页链接关系(不对称,有向图) 还可以考虑不同的“尺度”:网站之间,城市之间,省份之间,国家之间,… 文献计量学(bibliometry) 研究文献的贡献程度 哪些文章是“有影响的”文章? 研究文献的聚类,从而可能得到一个领域发展的状况 co-citation分析,如果a引用了b和c,称b和c有co-citation关系 流行传染病学,侦察、谍报学 发现那些关键节点,删除它们使得其他节点之间的距离显著扩大 9.2.2 社会网络的特征 1稠化幂律 网络随时间推移越来越稠密,伴随平均度数增加,稠化遵循稠化幂律。 2收缩直径 有效直径随着网络和节点的增长而减小。 3重尾出度和入度分布 节点的出度和入度趋向于服从遵守重尾分布。 简易森林火灾模型 9.2.3链接挖掘:任务和挑战 链接挖掘的任务 1基于链接的对象分类 2对象类型预测 3链接类型预测 4预测链接的存在性 5链接基数估计 6对象核对 7组检测 8子图检测 9元数据挖掘 链接挖掘的挑战 1逻辑与统计依赖 2特征构造 3实例与类 4集体分类和集体合并 5标记和未标记数据的有效使用 6链接预测 7封闭和开放世界的假设 8多关系网络中的社区挖掘 9.2.4挖掘社会网络 1链接预测 社会网络都是动态的。在链接预测问题中,给定时刻t的社会网络快照,希望预测从t到某给定的未来时刻t‘的时间区间将纳入网络的边。 方法:基于给定的邻近性度量和输入图G,将一个连接权重score(X,Y)赋值与节点X和Y。产生一个按score(X,Y)降序排列的有秩列表。以置信度的递减序给出预测的新链接。 2挖掘传销顾客网络 顾客的网络价值是向其他顾客推销导致的销售的预期增加。 影响因素:1顾客应该在网络中具有高连通性,并且对产品 有准确的估价。2这名顾客对他人的影响力应该大于他人对他 的影响。3口传方式的递归性。 如果从该顾客那里得到预期利润大于成本, 就要向该顾客优惠。 协同过滤(Collaborative Filtering recommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。 3使用网络挖掘新闻组 网络新闻组(Usenet)是一种利用网络进行专题研讨的国际论坛。到目前为止,Usenet仍是最大规模的网络新闻组。拥有数以千计的讨论组,每个讨论组都围绕某个专题展开讨论,例如哲学、数学、计算机、文学、艺术、游戏与科学幻想等,所有你能想到的主题都会有相应的讨论组。 Usenet并不是一个网络系统,知识建立在Internet上的逻辑组织,也是Internet以及其他网络系统的

文档评论(0)

153****9595 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档