一种评价搜索引擎信息覆盖率的模型及其验证-北京大学网络所.PDF

一种评价搜索引擎信息覆盖率的模型及其验证-北京大学网络所.PDF

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种评价搜索引擎信息覆盖率的模型及其验证-北京大学网络所

第# 期 电 子 学 报 \?K 4! =? # 年 月 74 # 6X26 CX2-[=1X6 31=1X6 6J, 74 一种评价搜索引擎信息覆盖率的模型及其验证 孟 涛,闫宏飞,李晓明 (北京大学计算机科学技术系,北京 !#$!) 摘 要: 搜索引擎的网页搜集子系统通常以%%% 的网页构成的有向图结构为依据,循着网页间的链接进行搜 集从而扩大信息覆盖面 本文针对这种信息覆盖能力,建立量化模型从多个角度考察搜集系统对 信息资源的覆 %%% 盖程度 文章首先分析了网页搜集不完全性的若干因素,在指出信息覆盖率的研究意义后提出了三类重要的信息覆盖 率概念,然后围绕其中的数量和质量覆盖率展开研究工作 在建立“采样 权值计算 验证”的覆盖率评测模型之后, ’ ’ 以北大“燕穹”网页信息博物馆为考察对象并获得其网页数据,用不同的方式对中国%() 进行采样;然后分别采用 *+,(-+./ 和0123 两种网页权值算法算出其中的重要网页作为样本,从量和质的角度考察“燕穹”系统的信息覆盖率, 得到合理的数量和质量覆盖率值,从而验证了“燕穹”系统信息覆盖率结论的合理性和该信息覆盖率评测模型的可靠 性 关键词: 搜索引擎;信息覆盖率;采样;权值计算;验证;数量覆盖率;质量覆盖率 中图分类号: 文献标识码: 文章编号: ( ) 2*454 6 4$787!!7 74 #8!!9#8: ! #$%’%()* +*,- * ./*01%()* 2*$-0%3- */ 4-%056 #3)-7 , , ;= 2+? @6= 0?.,8A(B C1 DB+?8EB., ( , , , ) !#$%’( )* +)’#,% -./(. 0 1.2()3)45 67/(4 8(/9%:/5 ;/ /(4 !#$! +2/($ !87(0%5( : 3(+FGH (.,B.(I JIJ+KKL ,(M N() O+,(I )L JIB., KB./I )(MN((. MH(E %BMH +KF(+PL E+IIBQ( +.P (Q(F B.GF(+IB., ?A N() , O+,(I MH(L G+. ?.KL GF+NK +.P B.P(R + O?FMB?. ?A MH( NH?K( N() O+,(I 6 E?P(K M? (Q+KJ+M( MH(BF B.A?FE+MB?. G?Q(F+,( O(FG(.M+,(I BI OF(I(.M(P %( +.+KLS( E+B. A+GM?FI NHL GF+NK(FI G+.’ , M G?Q(F +KK N() B.A?FE+MB?. +.P OJM JO MHF(( /B.

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档