基于元搜索引擎引文分析系统模型.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于元搜索引擎引文分析系统模型

基于元搜索引擎引文分析系统模型   摘要:针对现有中文引文数据库存在的问题,利用元搜索引擎的原理,提出了一种改进的中文数据库引文分析系统模型(Citation Analysis System Model,CASM)。该模型实现了分布式检索和数据互操作,具有跨库检索功能,模型加入了检索结果用户分析模块,提出了一种计算间接引用关系强度的公式,通过耦合与同被引关系矩阵的建立,进行聚类与多维标度分析,实现了耦合与同被引关系的自动挖掘,为相关研究提供了一种可供利用的工具。   关键词:引文数据库;引文分析;元搜索引擎;耦合;同被引      一、研究意义      自从20世纪60年代Garfield创立科学引文索引(SCI)以来,引文分析用于研究科学期刊、科学工作者以及科研工作等的活动日益活跃起来。当前对引文数据库的研究也非常多,各种引文数据库异常丰富,尤其国外的引文数据库已发展得十分成熟。在引文索引数据库里,检索的结果再也不是简单的排列与堆积,而是相互之间有机联系的综合,借助于这种综合的检索结果,可以发现科学研究背后的逻辑,从而提出新的创见,这才是文献数据库真正的价值所在。然而纵观中文引文数据库,还没有权威性和收录范围都让人十分满意的研究成果。   发展中文引文数据库是一件需要大量投入并需要相当长的时间才能完成的工作,针对当前的研究需要,本文提出了一个基于元搜索引擎的中文数据库引文分析系统模型(CASM),希望在利用现有中文引文数据库的基础上,提高中文引文分析的效率。CASM把元搜索引擎技术引入中文数据库引文分析系统,旨在通过检索方式的改变提高引文分析的效率和分析的准确性。      二、基于元搜索引擎原理的CASM功能模块      为了能实现各数据库的综合利用,提高查全率,增加引文分析数据来源的可信度,CASM引入了元搜索引擎的思想。元搜索引擎是指在搜索引擎之后或之上的搜索引擎,是在搜索引擎的基础之上建立起来的可以同时或分时查询多个搜索引擎的网络信息查询系统。元搜索引擎实际上是借助于传统的Internet搜索引擎提供信息查询服务的,它主要由用户接口界面、查询调度机制、搜索引擎代理和结???处理机制四部分组成。参照元搜索引擎原理,CASM设计了3个功能模块,利用各数据库已具备的检索系统进行检索,再将各数据库返回的检索结果进行处理,作为自己的结果返回给用户。根据用户的需要,CASM还可提供一定程度的检索结果分析。模型设计的目标是通过较小的资源消耗,帮助用户获得较高的查询质量。另外,设计时考虑到在使用过程中可能会不断有新的数据库加入,因此CASM还具有良好的可扩展性。      三、检索结果分析与应用研究      将检索结果的分析模块交给用户,也是ISI公司的新创意。虽然目前ISI公司的用户分析模块还只能提供一些简单的功能,但人们逐渐会发现,对信息检索结果的分析利用才是信息检索的真正魅力所在。检索结果分析与应用是检索结果用户分析子模块的主要功能。      1.耦合与同被引关系分析   CASM提供文献、著者、期刊三种耦合与同被引关系分析。文献耦合与同被引揭示了文献之间的结构关系,通过文献耦合与同被引关系分析,为文献检索提供了另一种有效的途径,有助于提高查全率。著者耦合与同被引分析使得无外部联系的著者客观地被关联,通过著者耦合与同被引关系分析,可以揭示相关学科的核心著者群,进行科研人员评价等。期刊耦合与同被引把众多无外部联系的各种科技期刊有机地联系起来,揭示期刊之间的相互依赖和交叉等关系。利用期刊同被引关系可以判断某些期刊的专业限制,帮助确定学科的核心期刊,指导图书馆等机构有针对性地对期刊进行收藏。同时,对科研工作者选择合适的期刊发表自己的研究成果也具有一定的指导作用,有助于加快科研成果的交流。无论是文献、著者还是期刊的耦合与同被引最终都是以文献耦合与同被引为基础的,所以本文只详细讨论文献耦合与同被引关系的挖掘与应用。CASM对由于同一篇文献多次引用某些参考文献而产生的多次耦合与同被引关系,只作一次计算。   (1)耦合关系挖掘。“耦合”(coupling)揭示了不同主体与同一对象之间的关系,两篇文献同时引用了一篇或多篇文献,我们说这两篇文献具有耦合关系,具有耦合关系的文献之间通常具有某种联系。分析文献耦合关系,对研究文献的引用结构和规律、主题相似性及学科结构等问题具有很大的帮助。本文提出的分析模块,可进行直接耦合分析与间接耦合分析。检索时提供文献、著者、期刊三个入口。现以文献入口为例,根据引文网络确定两篇文献的耦合关系的步骤如下(根据具体检索要求事先选取要进行耦合关系强度查询的两篇文献):(设置计数器T=2)   step1:接收客户端查询请求,检查是否为结束检索命令,是则退出检索;否则要

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档