- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本科生毕业论文题目:(中文)一种搜索引擎的查询意图发现的新方法 (英文)A New Method of Detecting Query Intent for Search Engines姓 名: 徐谷子 学 号: 系: 信息科学技术学院 专 业: 计算机科学与技术 指导教师: 彭波 二〇一一年五月三十一日摘要搜索引擎每天收到数量巨大的查询请求,这些查询背后的用户意图可能是不同的。搜索引擎可以根据不同的查询意图,提供不同的服务功能(如对研究型的查询意图提供一个记事本功能,对导航型查询展开网站的重要内容),或对同样的服务进行不同的实现(如采用不同的排序函数)。用户的查询意图,最主要的可以分成信息类和导航类。对用户查询意图的分类,现有的大多数方法都基于查询串文本本身的特征和查询的用户点击数据特征。这两种方法存在如下的困难:对于查询串的文本特征,查询比较短,特征比较稀疏,要进行比较准确地理解会比较困难;对于用户点击特征,由于用户提交查询的长尾性分布,大多数查询的提交次数都是较少的,对于这些查询,要判别它们的意图是比较困难的。为了克服长尾查询上查询意图判断的不可靠问题,本文提出利用查询结果的相关性分数的分布作为特征来判断查询的意图。这种方法会依赖查询结果的特征,比查询串本身的特征更加丰富;同时不依赖于用户的点击数据,因此可以克服长尾查询上的困难。结果表明,使用结果分数分布,可以提高意图判别的准确程度。另外,不同的用户在提交同一个查询的时候,他们的意图有可能是彼此不同的。我们可以通过一个用户的查询提交和点击历史,来推断用户的查询意图。但是,仅仅利用一个用户的查询和点击历史,其数据会比较稀疏。因此,我们使用不同用户的查询和点击历史,来判断行为模式相近的其他用户的查询意图。关键词:查询意图,用户点击,查询分类,个性化Abstract Search engines receive large amounts of queries every day, but the user intent behind them might be different. According to different query types, search engines can offer various services such as offering a notebook function for research-based queries or listing important content for navigational queries. Search engines can also bring about different results on the ground of same task, for example it can adopt different sort functions. The query intent of users can be mainly divided to two kinds: informational and navigational.Current methods of classification of query intent most rely on the text of queries and the click information of users. Those two methods have following disadvantages: for the properties of the text of queries, the queries are usually short and lack of properties, so it is hard to understand the intent correctly. For the click through information, most queries have been submitted a few times because of the distribution of queries submitted. Therefore, it is difficult to distinguish their query intent.In order to solve the unreliability of the judgments about the query intent of long tail queries, we propose that using the distribution of correlation scores of result of querie
您可能关注的文档
- (人教版)选修5同步精练系列:有机物分子式与分子结构的确定.doc
- [同步练习]4-1基因控制蛋白质的合成1.doc
- 《蛋白质的结构和功能》学案(苏教终审稿)01.doc
- 《基因突变及其他变异》单元检测题.doc
- 《晶体结构与性质》第2课时复习案.doc
- 《劳动合同法》实施效果的博弈分析.doc
- 《视音频新技术》提高性实验报告2.doc
- 《证券投资分析》CH8金融工程应用分析要点总结.doc
- 《中国组织工程研究》杂志2013总目录.doc
- 【2014复习备考】2014届高考化学《红对勾》系列一轮复习课时作业39晶体结构与性质.doc
- 2012CB966400人多能干细胞向胰腺β细胞和神经细胞定向分化的机制研究.doc
- 2012届高三生物二轮复习专题练习1:细胞的结构.doc
- 2012届高三生物二轮复习专题练习12:遗传的分子学基础.doc
- 2012年高考历史一轮基础练习(必修二)第13课对外开放格局的初步形成.doc
- 2013届高考化学一轮必备测试:第三章第二节铝及其化合物(人教版).doc
- 4、听取和审议常委会的工作报告,对常委会及其成员的工作进行.doc
- 2014高考物理一轮复习基础知识题组11牛顿运动定律和动力学问题分析.doc
- 9061+投资分析.doc
- 132008年济南民航国内旅客市场特征研究报告1015.doc
- dhjqypu西方_经济学:完全竞争和完全垄断条件下厂商均衡的比较[1].doc
最近下载
- SolidWorks入门教程很全面课件.ppt VIP
- [生理学]消化与吸收精选.ppt VIP
- 专题21.2 二次函数的图象【八大题型】(举一反三)(沪科版)(原卷版).docx VIP
- 第一章物质及其变化第一节物质的分类及转化(25张PPT)必修第一册.pptx VIP
- 某省2025年全省广播电视技术大赛(调幅专业) 试题 .pdf VIP
- 公路桥梁工程高处作业安全培训.pptx VIP
- PKPM软件说明书_筒仓结构设计软件SILO.pdf VIP
- Q OKTW 023-2016_汽车起重机 企业标准.pdf VIP
- 五年级数学(小数四则混合运算)计算题及答案汇编.docx VIP
- 【知识专讲精研】高中日语基础写作:-私の部屋课件.pptx VIP
文档评论(0)