- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第26卷 增 刊 计 算 机 工 程 2000年 10月
Vol.26SupplementaryIssue ComputerEngineering October2000
2000年CERNET第七届学术会议论文集
·救字化图书馆和信息检索技术 ·文章编号:1000-3428(2000)A刊--0742-05 文公标识码:^
搜索引擎性能的优化设计
区伟麟,蓝守斌,张 凌
(华南理工大学信息网络工程研究中心,广州510641)
摘 要:本文对木楠搜索引攀的性能进行了分析。并根据原系统的特点,引入了并行分类检索和数据粗存机制两个性能
优化方案,提高了系统的性能,加快丁响应时间。
关,润:并行植索:数据怪存,扭存!换策路:LFU算法
中”类号C:P39
PerformanceOptimizationofSearchEngene
OnWei1in,DougShaubin,ZhangLing
(NetworkCenterofSouthChinaUniversityofTechnology,Guangshoa510641)
[Abstract]Thispaperanalyeztheperformanceofthekapoksearchengineandintroducetwoperformanceoptiankution
methods,parallelclassifiactoinsaerchingandacchemechanism,toshortentheresponsetimeofsearchen咖二
[Keywords]Parallelsearching;Cachemechanism;Cachereplacementpolicy;LFUarithmetic
1引言
搜索引攀要讲究时效性,必须保证对用户的每一查询有一定的响应速度,但响应速度往往受到库
存A大小的制约。据统计,到1997年底,全球共有320,000,000个可索引的Web页面,而到了1999
年2月,可索引Web页面的数皿增长超过一倍,达到了g00,000,000个之多,并且还在以每月2016
的速度增长。如何在如此庞大的数据量中保持一定的时效性,如何加快搜索引攀的响应速度,成了一
个必要的课题.
本文分析了木棉搜索引攀的性能,井提出了两种改善优化方案一一 并行式分类检索和数据级存
机制。
2信息检索系统概述
一般而言,信息检索系统是由用户查询界面,代理服务器,检索服务器,索引库组16131,其中:
·代理服务器实现了接收查询请求;存送请求到检索服务器,接收检索服务器的返回结果(文件
作老简介:区伟一 主研信息系统和网络工程技术
定稿日期:2000-08-01
-742-
号,文件权重),跟据文件号到本地硬盘上对应文件找出R[9,文件摘要,更新时间等信息,返
回结果给用户;
·检索服务器实现了分析用户的查询表达式(语意分析,中文切词。中英文对照等),进行检索运
算.实现相关排序,结果返回。
通过对木棉检索系统工作流程的全面分析,发现原检索系统存在响应速度慢等特点。因此我们提
出了并行分类检索和数据缓存机制两个性能优化方案。
3并行分类检索
3.1概述
随著网上可索引网页的不断增多、膨胀,单进程、单检索代理的在大数据a索引库中查询的方式
便显得低效和难于管理。为了扩大查询范围,现在互联网上已逐渐出现了所谓联合检索引攀pieta
SearchEngine),它可以把用户的查询,同时地、并行地发向不同的搜索引攀,并把它们的结果综
合汇总输出给用户。受到它的启发,并结合木棉搜索引攀本身的具体情况,我们提出了荃于不同分类
的并行式检索模型。
3.2系统框圈
如图1所示,系统由用户接口、分类检索代理、汇总输出组成,它们各自的功能如下。
} A9览器 }
圈1井行分类位索系统圈
(1)用户接口:用户接口是浏览器
您可能关注的文档
最近下载
- NBT 11223-2023_硅基薄膜异质结光伏组件技术要求.pdf VIP
- 公司运营管理体系建设方案.ppt VIP
- NBT11222-2023光伏组串I-V检测及诊断技术规范.docx VIP
- 中职英语(Book2 苏教版)教案:Unit7 Nice Weather,Nice Mood.doc VIP
- NB-T11221-2023光伏电站频率监测与控制装置技术规范.pdf VIP
- 2023光储系统直流电弧检测及关断评价技术规范.docx VIP
- NBT 11201-2023_彩色镀膜光伏组件技术要求.pdf VIP
- 光伏组件红外热成像(TIS)检测技术规范.doc VIP
- NB_T 11080-2023 光伏组件电致发光(EL)检测技术规范.pdf VIP
- 《2016中文核心期刊一览表》.doc VIP
文档评论(0)