- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浙江大学博士学位论文
浙江大学博士学位论文
Abstract
要恻恻mw 捕||川川GU忧阳川qu 9州川mqJW川川川Rdw川川的
要
恻恻mw 捕
||
川川GU
忧
阳川qu 9
州川mqJW
川川川Rdw
川川的o
m
恻删VE
requests become more and more cle皿币le requirements for personal search and recency- sensitive search gradually heightened. As a result efficient information retrieval based on vertical search engines has become the issues of the sear咄 engine domain. By using fo-
cused crawling,in阳lligent scheduling and highdimensional indexing techniques,as well
ωbased on domain knowledge and personality,vertical search engines provides up to date, more personality aware and more professional search results.
However,the m碍。,r problems exist in most vertical search engines areωfollows:
(1) the p部sive crawling mode for crawler system results in a long delay between user query and result retrieval. (2) 由e scheduler of crawler system schedules web page crawling
driftless,which makes a very low utilization for crawling resources. (3) 仙。 performance
of indexing system is not settle for online upda忧民 and the mergíng results for certain unstruc阳red text objects are terrible. 币lis paper conducts fully study of these problems 制 well as the related key technologies.
The major contributions of the paper are presented in the following:
Firstly,it proposes a semantic based query triggered crawling (QTC) technique ω settle the problem of long delay between user query and result retrieval caused by passive crawlers. Based on domain knowledge,QTC translates user queηto request parame也rsof po阳ltial target results on domain web sites,and implements an active crawling technique fωus时 on current user queries to solve the problem. Extensive experiments and beta test
in reaI commercial applications show 伽at QTC bridges the delay gap between user query and result retrieval ,and brings 10-secondlevel freshness in vertical search results.
Secondly,it proposes an object-Ievel changeaware resource scheduling technique to
settle the problem of low utilization of crawling resources caused by cr
您可能关注的文档
- 绵羊体细胞核移植体系的建立与优化-生物学专业毕业论文.docx
- 旅游微博,旅游者决策行为与旅游企业互动关系研究——以深圳华侨城集团景区为例-管理学旅游管理专业毕业论文.docx
- 面向汽车零部件制造企业的车间质量稳定性控制系统研究-机械制造及其自动化专业毕业论文.docx
- 罗宾·威廉姆斯表演艺术分析-戏剧与影视学专业毕业论文.docx
- 脉红螺人工苗种繁育与微卫星标记筛选-水产养殖专业毕业论文.docx
- 螺杆膨胀发电机组电液调节系统仿真研究-动力工程专业毕业论文.docx
- 棉花GhMYB5基因的克隆及其启动子功能分析-生态学专业毕业论文.docx
- 美式家居空间软装设计研究-设计艺术学专业毕业论文.docx
- 空间大型轻柔系统结构稳定性分析-机械制造及其自动化专业毕业论文.docx
- 绿原酸缓解大鼠肠道线粒体氧化损伤-营养与食品卫生学专业毕业论文.docx
- 17-刘胡兰 课件 2025-2026学年语文二年级上册统编版.pptx
- Unit 5 Clothes Revision 课件 2025-2026学年新交际英语(2024)二年级上册.pptx
- 10.2 捍卫国家利益-课件 2025-2026学年统编版道德与法治八年级上册.pptx
- 21 称赞 课件-2025-2026学年语文二年级上册统编版.pptx
- 语文园地 八 课件 2025-2026学年六年级语文上册统编版.pptx
- 语文园地七 课件 2025-2026学年六年级语文上册统编版.pptx
- 6.2 分数的简单计算 课件-2025-2026学年三年级上册数学人教版.pptx
- 1.3 测量:长度与时间 课件-2025-2026学年物理沪科版八年级全一册.pptx
- 2.7 总结我们的认识 课件 2025-2026学年科学五年级上册教科版.pptx
- 8.1 长颈鹿与小鸟 课件 2025-2026学年二年级上册数学北师大版.pptx
最近下载
- (编号TCAIM 014-2024)-《帕金森病中西医结合诊疗指南》.pdf VIP
- 硝基漆安全技术说明书.pdf VIP
- 第三单元工具与技术单元复习试题科学六年级上册教科版2017.doc VIP
- DB23_T 3919-2024 大跨钢结构技术标准.pdf VIP
- 起重机械吊索具检查与报废标准40.pdf VIP
- 2025年食品法规与标准模拟卷(附答案).docx VIP
- R-Biopharm拜发分析系统检测试剂盒R7021说明书.pdf
- 06 《诫子书》理解性默写-学年七年级语文上册知识梳理与能力训练.docx VIP
- TCAQ10201-2024质量管理小组活动准则_可搜索.pdf VIP
- 2025年商品和服务税收分类编码操作手册1.08.7.pdf VIP
原创力文档


文档评论(0)