搜索引擎定量评价模型研究.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
搜索引擎定量评价模型研究.pdf

第20 卷第4 期 大 学 数 学 . 20, №. 4 V o l 2004 年8 月 COLL E GE M A TH EM A T IC S A u g. 2004 搜索引擎定量评价模型研究 刘正春,  蒋福坤 (嘉兴学院 信息工程学院, 浙江 嘉兴 3 1400 1)   [摘 要] 搜索引擎性能的评价一般采用定性或定量的方法, 在确定搜索引擎评价指标体系的基础上, 本 文利用模糊多属性决策研究了搜索引擎定量评价问题, 为定量评价搜索引擎提供了一种途径. [ 关键词] 搜索引擎; 评价指标体系; 模糊多属性决策 [ 中图分类号] T P 393  [ 文献标识码] C  [ 文章编号](2004) 0400 1405 1 引  言 因特网的迅猛发展, 网上信息以爆炸性的速度不断丰富和扩展, 为使因特网用户能在浩潮无边的信 息海洋中迅速、准确地获取所需要的信息, 人们开发出了搜索引擎. 搜索引擎实际上是一个网站, 这些网 ( ) 站通过网络搜索软件 也称网络搜索机器人 或网站登录等方式, 将因特网上大量网站的页面收集到本 地, 经过加工处理后放入索引库, 从而能够对用户提出的各种查询作出响应, 提供用户所需的信息. 目前 网上搜索引擎已多达数千种, 有资料表明, 在中国网民中, 搜索是排在电子邮件之后的第二大互联网 应用. 搜索引擎的使用性能如何是用户关心的问题. 面对如此众多的搜索引擎, 合理地评价一个搜索引擎 的性能, 对用户的有效地选择, 对搜索引擎的改进和发展都将有很大帮助. 搜索引擎性能的评价一般采 用定性或定量的方法, 但随着基于网络信息资源的网络信息计量学的发展, 定量评价方法将 占主导地 位. 由于搜索引擎是一个提供网上信息“检索”服务的网站, 它有别于传统的信息检索工具, 一方面搜索 引擎的技术必须不断更新以适合因特网的发展, 这就使得 目前搜索引擎的评价指标繁多且变化较快; 另 一方面在搜索引擎评价指标中有许多指标具有不确定性, 它们的数量很难精确给出, 而这种不确定性又 往往为模糊性. 所以在搜索引擎定量评价方面适合利用模糊数学进行处理, 这种评价的结果将更合理. 本文首先确定合适的评价指标体系, 然后采用模糊多性属决策方法对搜索引擎的综合评价问题进行研 究, 为定量的评价搜索引擎提供了一种途径. 2 搜索引擎评价指标体系 根据 目前搜索引擎性能的各种评价指标, 考虑模糊数学处理上的方便及搜索引擎的发展给出如下 评价指标体系: 1 ) 索引库性能指标C 1: 主要是指索引标引数量、标引的文件种类、标引深度和更新频率等方面内 容. 这些内容反映了是搜索引擎性能的优劣. 该指标为定性指标. 2) 检索功能指标C 2 : 该指标包括基本检索和高级检索二方面内容. 基本检索是指布尔检索截词检 ( ) ( ) 索 前截词、中截词、后截词 、邻近词检索、字段检索、区分大小写 英语 等功能, 高级检索为加权检索、 模糊检索、概念检索、自然语言检索、相关信息反馈检索、目录式浏览检索等功能, 该指标以定性形式  [ 收稿 日期] 第4 期          刘正春, 等: 搜索引擎定量评价模型研究 15 给出. 3) 查全率 : 传统意义上的查全率是指检索输出相关文献的数量和文献空间中所有相关文献数量 C 3 之比. 在 In ter 网上信息瞬息万变, 今天存在的信息, 明天可能就消失了, 同时又将出现更多的新信息.

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档