- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2014ICM讲解(西电O奖)
ICM2014用网络来衡量影响力度 参考西电Outstanding奖论文 1. 问题重述 通过对赛题进行近一步理解,最终将2014年ICM赛题归结为以下5个问题: 1.建立学者的合作网络,分析此网络属性。 2.建立学者影响力模型,确定网络中最有影响力的人。 3.建立论文的引用网络,确定网络中最有影响力的论文。 4.收集数据,将网络模型应用到其他领域。 5.讨论网络模型的科学性和实用性。 任务 从文件中抽取Erdos1的511位学者数据,建立合作网络,分析这个网络的特性。建立影响力度量模型,对学者的影响力排序。 建立论文的网络模型,设计模型,评估研究论文的影响力,对论文的影响力排序。 收集数据,将前面提出的模型和算法扩展到其他领域,检验其适用性。 讨论前面模型的科学性和实用性。 2.假设 一论文在另一论文中被引用多次,只算引用一次。 文中度量的影响力是指现在达到的影响力。 索引的平均值(measurement indexes)能够反映一篇论文或者一名影星的影响力。 和Edors的合作数能反映学者的影响度,但数量达到或超过一定值时,影响力趋于常量。 某种程度上,一篇论文的质量和它被其他论文引用的次数成正比。 :网络中结点 的重要度 :网络中结点 的影响力 :网络中学者 的H-index数 :网络中学者 的影响因子 :结点i删除前后,排序结果的偏离度 3.符号说明 注:其他符号将在论文中给出说明 4. 学者的影响力 定义两个容易混淆的概念: 网络中结点的重要度:一个结点在网络连接中起的重要性 网络中结点的影响力:一个结点和其他点相连的综合强度 问题分析 学者的影响力包含了以下两个因素: 该学者合作领域的广泛程度,即合作对象个数。 该学者与其他具有较大影响力的学者的合作次数,即与Paul Erd?s的合作的次数 与Erd?s的合作开始时间。 论文的影响力包含了以下三个因素: 该论文作者的影响力,即H指数。 发表该论文的期刊的知名度,即影响因子 该论文的被引用次数 4.1 模型1:基于网络理论的结点重要性度量模型 用结点表示学者,边表示学者间的合作关系,建立网络模型。这个模型 4.1.1 使用结点的度评价学者的重要性 结点的度: 结点8的度为4 删除结点8后,结点7、9、10变成孤立点 如果被删除结点的度很小,删除带来的影响就小。 问题:度相同的结点,影响是否相同? 删除结点2,不影响连接性;删除结点4,影响了连接性. 度相同的结点,对网络影响不同。 结点的度是度量局部连接性的指标,但是不能反映这个结点在整个网络中的影响力。 4.1.2 使用集聚系数评价结点的重要性 在好友关系网中,一个人的两个好友很可能彼此也是好友,这就是网络的聚类特征。 假设结点i的度为k, 则结点i和k个邻结点形成的三角形数最大为 。用 表示任意两个邻接点实际形成的三角形数。定义集聚系数为: 在图论中,聚集系数表明一个结点和其他结点的聚结的程度,在学者合作网中,他表示一个研究者的合作者之间的合作程度。 结点4对其他点的连接性强。 集聚系数越小,重要性相对越大 度 vs 集聚系数 度:度体现了该结点与其他结点建立直接联系的能力, 但不能反映该节点的邻居节点的连接情况。 集聚系数:集聚系数虽然在一定程度上能够反映邻居节点的连接情况, 但不能反映邻居节点的规模。 综上考虑,我们将两者综合考虑,建立了基于度指标与聚合系数的结点重要性综合评价模型。 4.1.2 使用度和集聚系数评价学者的影响力 为结点 的度, 为结点 的邻接点集合, 为结点 的集聚系数,定义: 参考文献中的 二者综合后,得到每个结点重要性的度量: 考虑每个学者和Edros的直接合作次数 得到每个节点重要性的综合评分: 评价分高的前十位学者: 结果分析: 经统计,影响力排名前十的研究者们往往很早便与Erdos有过直接合作,并且,他们的合作次数均较为频繁。 对于这一现象的合理解释为:这些研究者们由于较早的加入到Erdos的合作网络,并且与Erdos长期保持频繁的合作关系,使其自身的科研合作网络得以发展壮大,逐渐在Erdos1网络中体现出不可替代的重要性。 4.2 模型2:基于PageRank算法的结点影响力度量模型 PageRank算法的引入 Google搜索引擎因其强大的检索功能以及高质量的检索服务成为当今最受欢迎的搜索引擎之一,Google利用其PageRank算法计算出每个网页的PageRank值,通过权衡指向该搜索目标的链接数目以及这些链接的重要性大小,从而决定网页在搜索结果中出现的位置,PageRank值越高,出现的位置便越靠前。 本文受到这种思想的
您可能关注的文档
- 2013版初中英语全程复习方略课件(教材复习案)八年级下册 Units 3、4(冀教版).ppt
- 2013版人教版英语八年级上册unit 1where did you go on vacation?-Section A.ppt
- 2013版初中英语全程复习方略课件(教材复习案)八年级上册 Modules 10-12(外研版).ppt
- 2013版七年级英语下 unit9Section A.ppt
- 2013版思想道德修养与法律基础第四章学习道德理论 注重道德实践.ppt
- 2013版七年级英语下册Unit7_It’s_raining_Section_A.ppt
- 2013版四年级数学除数接近整十数的除法(四舍法试商).ppt
- 2013理综物理电磁场几道题.doc
- 2013秋11级计算机硬件技术基础课程多媒体课件(第3、4次课--MCS-51单片机的结构和工作原理).ppt
- 2013新目标八上unit1第4课时.ppt
文档评论(0)