- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本科生毕业论文-searchengineandwebmininggroup-北京大学
本科生毕业论文
题目:(中文) PARADISE前端平台测试与优化 (英文) Evaluation and Optimization for the Front Service of PARADISE
姓 名: 树柏涵
学 号:
院 系: 信息科学技术学院
专 业: 计算机科学与技术
指导教师: 闫宏飞
二〇〇九年五月二十一日
摘要
PARADISE是一种智能中文搜索引擎平台,分成前段和后台两部分。前端和后台在运行时进行交互,完成整个平台功能。本文从PARADISE前端的功能需求出发,详细介绍前端的各个功能模块的设计和实现方式,并且说明了PARADISE前端测试和优化方法。PARADISE前端承担了提取搜索引擎摘要的功能,但目前对于搜索引擎摘要的选取原则、算法规则却没有明确的框架或算法。因此本文对搜索引擎摘要的意义、标准、分类等进行详细的讨论,并以形成用户查询为中心的动态摘要为出发点,给出算法实现的形式化原则,并具体实现了一种动态摘要算法。与百度搜索引擎的动态摘要相比较,实验显示一致性上比百度高6%。此处的一致性是指,摘要和用户查询相关性与原文档和用户查询相关性之间的关系,二者越接近一致性越高。该算法已经应用到北京大学校内搜索引擎上。
关键词:查询,关键词,摘要,查询日志,点击日志
Abstract
PARADISE is a Platform for Applying Researching And Developing intelligent Search Engine, composed of two components — front service and backstage supporter. And interaction of the two sections achieves the entire function of PARADISE. This paper introduces n detail about the implemention of all the front service’s function and illustrate the method for the evaluation and optimization of the PARADISE front service. PARADISE front service needs to get search engine snippet for each search results. However, selection principles or algorithm rules of search engine snippets are not clearly stipulated. This paper is aiming at providing a formal principle of algorithm implementation grounded on a query biased dynamic snippet. Dynamic snippet algorithm is achieved under this framework. Compared with Baidu, experiments show that the coherence of our algorithm is 6% higher than that of Baidu. The coherence denotes the relationship between user need and snippet, and user need and documents. Additionally, our algorithm has been applied to the PKU’s campus search.
Keywords: query,key word,snippet,query log,clickthrough
目录
第一章 引言 1
第二章 PARADISE前端设计与实现 3
2.1 PARADISE前端功能需求与功能实现 3
2.2 PARADISE前端功能模块划分,及其关系和工作流程 7
2.2.1 PARADISE前端功能模块 7
2.2.2 PARADISE前端功能模块工作流程 10
2.3 PARADISE前端性能优化 11
2.3.1 PARA
您可能关注的文档
- 全球大健康产业发展---高效、信息、前端理实国际咨询《大健康产业未来.pdf
- 全新規劃、全台首開!站在技術的前端,目前最熱門課程,您不容錯過.pdf
- 前端接触势垒高度对非晶硅和微晶硅异质结太阳电池的影响!-物理学报.pdf
- 3g4g多模蜂窝手机前端设计所面临的挑战-smartermicro.pdf
- 低功耗、3电极心电图(ecg)模拟前端-analogdevices.pdf
- 低能耗汽车的前端模块设计designoffrontendmoduleforcarswith.pdf
- 17pa-210230型前端放大器(配套amptek公司产x射线探头使用.pdf
- 通信soc中模拟前端性能的快速评估方法-synopsys.pdf
- 在samv7e7s7mcu中使用模拟前端说明特性-atmel.pdf
- 1.冷纹原因熔汤前端的温度太低,相迭时有痕迹.改善方法1.检查壁厚.pdf
最近下载
- 【高分刷题题库】价格鉴证师《价格鉴证案例分析》历年真题详解历年真题2019年价格鉴证师《价格鉴证案例分析》真题及详解案例分析题.pdf VIP
- 天一大联考河南省2025—2026学年(上)高三阶段性检测物理含答案.doc VIP
- 《淘宝金融合作方案》课件.ppt VIP
- 天一大联考河南省2025—2026学年(上)高三阶段性检测英语含答案.doc VIP
- 天一大联考河南省2025—2026学年(上)高三阶段性检测数学含答案.doc VIP
- 天一大联考河南省2025—2026学年(上)高三阶段性检测生物含答案.doc VIP
- 小班数学活动串木珠.pptx VIP
- 天一大联考河南省2025-2026学年(上)高二年级秋季检测生物+答案.pdf VIP
- PLC应用技术 第3版 项目五 自动送料装车控制.ppt VIP
- DBJ50_T-037-2017 烧结页岩多孔砖和空心砖砌体结构技术标准.docx VIP
原创力文档


文档评论(0)