- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要
随着移动互联网的快速发展,越来越多的人使用互联网获取信息,互联网的
信息也随着使用人数的增多而快速增长,同时信息增长的速度也更加快。从海量
的信息里面,获取用户所需的信息成为信息检索领域的热点,并且由于手机应用
的丰富,很多用户直接APP 中获取所需的信息而不是通过网络浏览器。APP 上
的内容也无法被搜索引擎爬取,对大部分 APP 而言,站内搜索的查询方式是基
于关键字来匹配结果,这种方式往往会查出大量结果,很难令用户满意,个性化
查询技术是优化查询的一种方法。目前的个性化查询有了一定发展,本文在分析
了之前的检索算法的不足的基础上,提出了基于用户行为的个性化查询算法和个
性化的伪反馈相关查询扩展方法,并以外卖搜索为例进行了相关实验。实验结果
表明,本文提出的两种算法对查询结果有明显的改善。论文的主要工作如下:
首先,本文通过网络爬虫爬取了美团外卖在南昌市的外卖店铺信息和商品信
息,以店铺为单位构建店铺之间的相似度特征矩阵,利用k-means 算法对店铺进
行聚类,并验证基于店铺相似度与基于TF-IDF 特征聚类效果的好坏,实验结果
表明基于店铺间相似度的特诊矩阵聚类效果比较好。在此基础上本文利用用户的
使用记录来构建用户的偏好模型,这一步是个性化查询的关键一步。
其次,本在在用户偏好模型基础上,构建个性化的查询算法,通过计算用户
偏好相关系,以及查询词与店铺相关性,将二者结合对查询结果重排序,将排序
后的前N 家店铺返回给用户。并构建外卖下单虚拟平台,在此平台上进行了相关
实验。并与基础查询方法和基于TF-IDF 的查询方法进行对比,实验表明,本论
文提出的个性化查询算法效果优于其他两种方法。
最后,本文在个性化查询方法的基础上,提出了个性化的伪相关反馈插叙扩
展方法。该方法将个性化的初检结果作为扩展词的来源,与原始查询词结合进行
二次查询,并将二次查询的结果作为最终的查询结果返回给用户。并在虚拟外卖
平台上进行相关实验。实验表明个性化的伪相关反馈查询效果要优于非个性化的
伪相关反馈查询。
关键词:个性化查询 k-means 伪相关反馈 文本聚类 美食查询
II
Abstract
With the rapid development of the mobile Internet, more and more people use the
Internet to obtain information. The information on the Internet also increases rapidly
with the increase in the number of users, and the speed of information growth is also
accelerated. From the massive amount of information, obtaining the information
required by users has become a hotspot in the field of information retrieval, and due to
the richness of mobile phone applications, many users obtain the required information
directly in the APP instead of through a web browser. The content on the APP cannot
be crawled by search engines. For most APPs, the search method of the site search is
based on keywords to match the results. This method often finds a large number of
results, which is difficult to satisfy users and be personalized. Query technology is a
way to optimi
您可能关注的文档
- 3,3'-二磺酸基-4,4'-二羧基二苯砜构筑的稀土和过渡金属配合物的合成、结构和质子传导性能.pdf
- GTIM模型架构下的泛在网络旅游数据动态整合方法.pdf
- β-葡萄糖苷酶最适温度、活性和产物耐受性的共定向进化.pdf
- 初中生的绿色消费意识及其培育路径研究.pdf
- 道德提升感对初中生品德发展的影响及干预研究.pdf
- 东乡野生稻根际促生菌的筛选、鉴定及其对水稻生长及耐旱的影响.pdf
- 都江堰地区森林鼠类的种子贮藏和盗食行为研究.pdf
- 抖音短视频的持续使用意愿研究——以南昌市五所高校在校大学生为例.pdf
- 抖音短视频中智能广告精准投放策略.pdf
- 福建省古田水库水体溶解性甲烷时空分异特征及其影响因素研究.pdf
最近下载
- 四川盆地课件.ppt VIP
- 初中信息技术教材解读 九年级下第二章 物联网.pptx VIP
- 【人教新版】七上第三章 第二节 《世界的地形》教学课件.pptx VIP
- 第7课 三国两晋南北朝时期的科技与文化(课件)-【中职专用】《中国历史》(高教版2023基础模块).pptx VIP
- DB50∕T 1786-2025 门诊安宁疗护服务规范.pdf
- 《蒙牛企业介绍》课件.ppt VIP
- 学生的学习风格.ppt VIP
- 9706.1有源医疗器械检测用-GB_T 42062-2022风险管理报告.docx VIP
- 苯甲苯冷凝器工艺设计(课程设计).doc VIP
- 8、第八单元习作:我的心儿怦怦跳(教学课件)四年级语文上册单元作文(统编版).pptx VIP
原创力文档


文档评论(0)