一种基于PageRank算法的期刊评价的理论模型.docVIP

下载本文档

4
0
约5.72千字
约 6页
2016-06-11 发布于重庆
举报
版权申诉

一种基于PageRank算法的期刊评价的理论模型.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种基于PageRank算法的期刊评价的理论模型

一种基于PageRank算法的期刊评价的理论模型尹莉（西北大学数学系数学与科学史研究中心陕西西安710127）摘要基于影响因子计算过程中只考虑数量而不注重质量，从而只能反映期刊流行度而不能反映期刊的权威性的缺陷，本文借鉴网页排序的PageRank算法，从图论的角度构建了一种应用于期刊评价的理论模型，并对其进行了解释说明，与影响因子算法进行了比较分析，提出了模型的优缺点以及适用范围。关键词期刊评价 PageRank 图论影响因子中图分类号 G304 G353. 1 文献标识码 A A New Theoretical Model of Journal Evaluation Based On PageRank Algorithm Yin Li (Center for Mathematics and History of Science, Department of Mathematics, Northwest University, Xi`an 710127) Abstract The calculation of impact factor based on only considering the quantity rather than quantity, which can only reflect the popularity of the journal and can`t reflect the authority of the journal. As to this defect, the paper learned from the PageRank algorithm, build a theoretical model of journal evaluation from the perspective of graph theory , and carried out its explanations, and compared it with the impact factor algorithm ,proposed the advantages and disadvantages ,the applied scope of the model . Key words Journal Evaluation, PageRank , Graph Theory , Impact Factor 1 引言 1.1 PageRank算法当今互联网上有名的第一搜索引擎Google，自1998年问世以来，在极短的时间内声誉鹊起，超越了所有竞争对手，彻底改观了整个互联网的面貌。它的成功自然有许多商业因素，但其中最重要的却是它背后的数学因素【1】。这一数学因素的核心便是其创始人拉里·佩奇（Larry Page）和谢尔盖·布林（Sergey Brin）提出的链接分析算法PageRank。算法的初衷就是将用户需求的海量网页信息，按照重要性、相关性的大小排序提供给用户，也就是网页排序问题。佩奇和布林通过研究网页间的相互连接来确定排序，PageRank算法基于这样的假设：一个网页被其他网页链接得越多，它的排序就越靠前；一个网页越是被排序靠前的网页所连接，它的排序就也应该越靠前。即如果一个网页被一个重要的网页链接，那么它也应该是一个重要的网页【2】。正如一篇论文被诺贝尔奖获奖者引用要比被一名普通科学研究人员引用更能说明其价值。PageRank算法是综合考虑入链网页的数量和质量两个方面来进行网页分数的计算，从而进行网页排序的。 PageRank算法提出后得到了广泛地认可，并经过多年的发展和许多研究者对其存在的问题进行改进后，算法公式可以表示如下：【3】其中是k次迭代后计算得到的PR向量；为阻尼系数，通常取0.85；为悬挂模式向量，如果一个网页是悬挂网页，则，反之；n为维数，为全1行向量；为网页链接关系矩阵，表示如下：这样通过计算网页的PR值然后对网页进行排序，不仅考虑了入链网页的数量，也考虑了质量，得到的排序结果是客观的。 1.2 期刊引用网络与网页链接网络的相关性佩奇和布林在设计PageRank算法时就是借鉴了文献计量学中引文分析的基本思想，将一个超链接看作一次推荐，类似于引文分析中的一次引用，一个拥有更多超链接的网页比拥有较少超链接的网页更重要。引文分析中对论文的引用分析也是如此，一篇被更多的论文所引用的论文A，要比被更少论文所引用的论文B更重要。但是引文分析中的利用引用次数来衡量引文质量的指标通常是被认为存在问题的，比如影响因子，只考虑被引次数，而不考虑被引质量，将一篇论文的所有引用视为等同，不论引用来自于顶级的期刊如《Science》和《N