网络信息资源组织研究进展_计算机网络论文.docVIP

网络信息资源组织研究进展_计算机网络论文.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络信息资源组织研究进展_计算机网络论文 网络信息资源组织研究进展_计算机网络论文 【内容提要】主要从用于组织网络信息资源的搜索引擎、虚拟图书馆、文献分类法、主题法、窗口方式等方面全面总结与回顾20世纪90年代以来网络信息资源组织的理论与实践。 【摘要题】信息资源建设 【关键词】网络信息资源组织/网络信息资源整序/研究进展    笔者通过普查大量国内外期刊论文及有关出版物、分析相关网站,进而总结与回顾20世纪90年代以来网络信息资源组织的理论与实践,以期有助于优化其网络信息资源组织与揭示方法,促进该领域研究的蓬勃开展。本文着重总结网络信息资源组织的研究进展,有关其揭示方法将在另文总结。       1 用于组织网络信息的搜索引擎方式     (1)关于搜索引擎组织方式。   对于搜索引擎而言,网络信息组织采用主题树和数据库两种方式,也有称使用语词组织知识和使用分类法组织知识。所谓主题树组织方式,就是将信息资源按照某种事先确定的概念体系,分门别类地逐层加以组织,用户通过浏览的方式层层遍历,直到找到所需的信息线索,再通过信息线索联接到相应的网络信息资源。现有的提供目录分类式(或称主题指南、列表浏览)查询功能的搜索引擎就采用这种方法组织信息。而数据库组织方式,就是将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其组配查询,就可找到所需要的信息线索(即相关站点链接),并通过信息线索直接连接到相应的网络信息资源。     (2)关于搜索引擎的比较研究。   ①搜索引擎的性能比较研究。早期研究大量集中在概要性介绍方面。殷雪松、徐斌分别介绍了12个大陆地区的中文搜索引擎网易、天网、华好网景、搜狐、四通方利、常青藤、北极星、悠游、搜索客、司南、我是野虎、若比邻等,港台地区茉莉之窗、哇塞、蕃薯藤等和5个国外的中文搜索引擎Yahoo雅虎中文、AltaVista(中文版)、Globepage(中文版)、华页指南、中文查寻。   王忠、周士波分别介绍了独立搜索引擎Altavista、Hotbot、Infoseek、Excite、Webcrawler、元搜索引擎Cyber411、Dogpile、Highway61、InferenceFind、Mamma、Profusion、Savvysearch、All4one和网络英文搜索引擎Webcompass、Copernic98,并对6种主要搜索引擎的基本查寻、高级查寻、限定查寻、结果排序、结果输出等检索性能进行比较分析。   随着研究的不断深入,研究重点转入到了搜索引擎性能的比较上。孙丽等选取了北极星、常青藤、搜狐、中经网信息导航、网现引擎5个中文搜索引擎,从数据库类型、规模、库更新频率、抓取方式、日抓取页面数、抓取深度、<Meta>tag、显示方式、信息排序依据、信息描述质量、界面友好程度、用户欢迎程度等分析它们的优劣。徐建华等从数据库规模、信息采集方式、标引内容、检索功能、结果显示格式、结果排序规则、数据库更新频率等7个方面对Altavista、Excite、Go、Hotbot、Lycos、Yahoo这6个搜索引擎逐一进行分析。   张燕,惠佳颖就10个检索提问,从检索功能(布尔检索、邻近检索、截词检索等)、查准率、用户负担、输出方式对搜索引擎Google和AskJeeves进行详细比较,测试结果显示Google在查准率以及输出方式上明显优于AskJeeves,在检索功能及用户负担上两者各有特色。   ②关于搜索引擎的质量评价指标。搜索引擎评价指标多种多样。1973年Lancaster和Fayen提出了6条关于信息检索系统效果评价指标:即覆盖范围、查全率、查准率、响应时间、用户负担及检索结果输出格式。这一评价指标影响甚广,许多学者在其基础上进行细化与扩充,提出搜索引擎质量评价标准。   储荷婷提出5条标准:A.索引构成(取决于标引数量、标引范围、索引词抽取法和索引更新频率);B.检索功能;C.检索效果(由查全率、查准率和检索时间衡量);D.检索结果显示(显示内容、显示数量以及是否按相关性排序);E.用户所需努力(从用户界面和帮助介绍材料)。   孙丽等提出的评价体系:A.数据库指标(数据库大小、类型、更新频率和信息抓取方式等);B.检索结果输出格式;C.检索性能完善程度(类目检索、关键词检索、短语检索、截词检索、布尔检索、概念检索、自然语言检索、指定字段检索、包含或排除检索等);D.响应时间;E.查全率;F.查准率;G.用户负担。   曾民族提出评价指标:A.数据库规模和内容(覆盖范围、索引组成、更新周期);B.索引方法(自动索引、人工索引、用户登录);C.检索功能(布尔查找、复杂布尔操作、相邻或相邻查询、截词查找、字段查找、概念检索、词语加权、词语限定、中断退出、上下文关键词等);D.检

您可能关注的文档

文档评论(0)

wyj199218 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档