第5章 信息检索与查询(试验).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章 信息检索与利用 1搜索引擎的基本原理 2专利搜索的方法 3学术论文的搜索方法 5.1搜索引擎的基本原理 1.1 搜索引擎概述 “搜索引擎”实际上是一个计算机应用软件系统,或者说是一个网络应用软件系统。从网络用户的角度看,它根据用户提交的类自然语言查询词或者短语,返回一系列很可能与该查询相关的网页信息,供用户进一步判断和选取 5.1搜索引擎的基本原理 1.2 网页搜集 定期搜集,每次搜集替换上一次的内容,我们称之为“批量搜集”。由于每次都是重新来一次,对于大规模搜索引擎来说,每次搜集的时间通常会花几周。而由于这样做开销较大,通常两次搜集的间隔时间也不会很短(例如Google在一段时间曾是每隔28天来一次)。这样做的好处是系统实现比较简单,主要缺点是“时新性”(freshness)不高,还有重复搜集所带来的额外带宽的消耗。 增量搜集,开始时搜集一批,往后只是(1)搜集新出现的网页,(2)搜集那些在上次搜集后有过改变的网页,(3)发现自从上次搜集后已经不再存在了的网页,并从库中删除。由于除新闻网站外,许多网页的内容变化并不是很经常的,这样做每次搜集的网页量不会很大,于是可以经常启动搜集过程(例如每天)。 5.2专利搜索的方法 专利搜索的方法 5.3学术论文的搜索方法 1.中国期刊网 CNKI(China National Knowledge Infrastructure),中国国家知识基础实施工程)是以各学科基础和前沿知识以及专家知识与经验为基本内容,该库是目前世界上最大的连续动态更新的中国期刊 全文数据库 , 收录国内 8200 多种重要期刊,以学术、技术、政策指导、高等科普及教育类为主,同时收录部分基础教育、大众科普、大众文化和文艺作品类刊物,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域 ,全文文献总量 2200 多万篇。目前,CNKI已经建成并通过网络提供发布的有《中国期刊全文数据库》(CFD)、《全国优秀博硕士学位论文全文数据库》(CDMD)、《中国重要会议论文全文数据库》(CPCD)和《中国重要报纸全文数据库》(CCND)等数据库和具有个性化知识服务功能的大型专业知识仓库“中国医院知识仓库”、“中国企业知识仓库”、“中国基础教育知识库”、“中国中小学数字图书馆”、“中国城市规划知识仓库”和“中国专利数据库”等,以及120多个具有学科、专业特色的专题数据库。 5.3学术论文的搜索方法 2.万方数据资源系统? 万方数据资源系统是由万方数据股份有限公司建立的国内大规模的综合信息数据库系统,目前拥有近l20个数据库,信息资源丰富,涉及期刊报纸、学位论文、会议论久、法律法规、成果专利、标准、企业、产品等各种文献。万方数据资源系统利用先进的信息检索技术将各种类型数据库进行重构、整合与关联,为数千家海内外高等院校、科研院所、政府与企业以及公共图书馆用户提供信息服务。 5.3学术论文的搜索方法 3.中文科技期刊数据库? 《中文科技期刊数据库》数据库创建于1989 年,是目前国内最为专业的中文期刊数据库之一,经过13 年的推广使用和完善,逐渐成为国内有效信息量最大的综合性科技文献数据库。它的应用为广大读者提供了内容全面的文献资源,专业化的数据加工,极大地提高了文献资料特别是科技文献资料的检索与利用率,方便了读者,节省了时间,满足了使用者的多种需求。《中文科技期刊数据库》对原始资料进行了真正意义上的二次加工,而不是简单的数字化。采用人工标引和分类,提取主题词,对题录文摘数据进行检查修改,确保了原始文本数据的质量。公司定期进行刊期统计并作增补,数据完整率达到99 %以上。每篇文献按照《中国图书馆分类法》进行分类,科学的分类使得数据库可以胜任综合学科文献服务。编制了同义词库、同名作者库并定期修订,有助于提高文献检全率。期刊全文采用扫描方式加工,保持了全文原貌。全文数据为图像文件,采用专有压缩技术,避免了图像文件容量大、不能编辑的缺点。 5.3学术论文的搜索方法 4.综合性检索系统Ei、SA、SCI、CSA、ASTP (1).美国《工程索引》(Ei)?  美国工程索引(The Engineering Index)创刊于1884 年,由世界上最大的工程信息提供者之一——美国工程信息公司编辑出版,所报道的文献学科覆盖面很广,涉及工程技术领域的各个方面,经过100 多年的发展,工程索引已经成为全球工程技术领域最著名的检索系统,同时它也是世界引文分析和文献评价的四大检索工具之一。 Ei 每月出版1期,文摘1. 3 万至1. 4万条;每期附有主题索引与作者索引,每年还另外出版年卷本和年度索引,年度索引还增加了作者单位索引。

文档评论(0)

书是爱的奉献 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档