链接分析法——情报学研究新方法-.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
链接分析法——情报学研究新方法    内容提要】本文认为分析法是络信息计量学的重要研究方法,是情报学研究的新领域。它完善了情报学方法论体系,丰富了情报学理论,是情报学逐渐成熟的一个重要标志。文章简单介绍了络信息计量学,并对分析法进行了分析。 【摘??要??题】理论纵横 【关??键??词】分析法/络信息计量学/情报学/方法论…… 【??正??文】   20世纪90年代以后,以数字化技术、多媒体技术、络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的络信息资源,传统的文献计量学方法就显得力不从心,相应地络信息计量学(Webmetrics??or??Cybermetrics)就应运而生,用新的研究方法如分析法来描述和组织络信息世界。   1 络信息计量学   络信息计量学是在络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:络计量学是一门计算机科学,是一门研究互联上数据相互引用的科学,是一门对络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于络通信技术的信息测度。络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和络技术对络文献规律进行统计分析的一门科学。络信息计量学是采用数学、统计学的各种定量方法,对络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示络信息的数量特征和内在规律的一门新兴学科。它主要是由络技术、络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。   2 分析法研究现状    分析法的内容   分析法是络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在络环境中的应用。络超文本通过链可以将结点起来,一般使用两种方法——索引链和结构链进行,它既可以表示信息之间的关系,又是构成络的手段。在将络相关信息资源内容起来形成新的信息链或信息集合的基础上,融合了参考文献功能,并通过引文关系来分析络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在络信息组织、检索、评价、服务等方面起着重要作用。  分析法在络信息组织方面的作用   络信息资源生产者如页创作者使用分析,创建一些对访问者有用的,可以到不同主题或相同主题质量更优秀的页。一般来说类型大致有:合作(被站和站之间存在合作关系)、友情(站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐(被推荐站由于质量好、人气旺、访问用户多或是热门站等原因)、内容(被站和站在内容上存在着互补或相通关系等),可以起到络导航的作用,大大方便用户在上冲浪。Google还通过分析来确定络上的权威信息源来进行相关的排名。Google认为页制作者仅创建他们认为重要的页的,到另外的页就像一本书的引文,页之间的这种引文关系“像是对页进行评论的过程”。例如,页的制作者们创造了几千个Yahoo的,困此Yahoo被当作一个重要程度点;如果许多重要的页都指向Yahoo,则其重要程度会更高。这种方法的好处是页制作者不可能误导站的排序,并且扩展性极好——当络增长时,产生更多的重要页的,自然更能确定该页是否是权威的信息源。  分析法在络信息检索方面的作用   分析主要应用于络信息检索方面,如搜索引擎收集信息、检索结果的排序等。络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超的方式相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,认为搜索引擎的Robots直接访问Web提取出权威页(Authority??Page)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始页,Robot从这些源页开始收集,可以按照深度优先或广度优先的算法进行。当页提取回来后,采用分析技术(具体用递归算法)来计算出权威页。有了权威页,Robot在收集Web信息时,就有针对性地、高效率地访问Web页。搜索引擎检索结果排序方面也运用了分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前

文档评论(0)

勤能补拙 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档