- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用户兴趣模型在垂直搜索引擎检索模块中应用
用户兴趣模型在垂直搜索引擎检索模块中应用
摘 要: 在Lucene的基础上设计了垂直搜索引擎模型的检索模块,以提高检索的质量,改变文档的排名,改善用户体验。该模型在检索模块中综合了四个方面来计算文档得分,即主题相关度得分、网页重要性得分、用户兴趣计算得分、关键词位置权值得分。为了让检索结果更能体现用户的实际需要,特别加重了用户兴趣部分的权重分值,并通过实验证明了改进的检索模块比传统的检索更有实际效果,增强了垂直搜索的个性化。
关键词: 用户兴趣; Lucene; 检索; 个性化
中图分类号:TP393 文献标志码:A 文章编号:1006-8228(2012)12-34-02
Application of user interest model in retrieval module of vertical search engine
Li Xiaohong, Li Maolin
(Center of Computer; Shaoyang Medical College, Shaoyang, Hunan 422200, China)
Abstract: In this paper, retrieval module of vertical search engine model based on Lucene is designed, in order to improve the retrieval quality, change the document rank and improve the user’s experience. Four aspects are combined in this module to calculate the document score, that is, subject correlation score, webpage importance score, user interest score, key words position weight score. In order to make the retrieval results better reflect the actual needs of users, user interest part is especially aggravated. The results prove that the improved retrieval module has more practical effect than the traditional retrieval, and it enhances the vertical search personalization.
Key words: user interest; Lucene; retrieval; individualization
0 引言
搜索引擎作为网络信息查询的主要工具已经在人类生活中占据了主导地位,搜索引擎的搜索质量直接影响到用户体验。垂直搜索在专业性上略胜与传统的搜索引擎。本文主要改进垂直搜索引擎的检索模块,在传统的Lucene检索模块中加入Pagerank得分,关键词得分,并特别加入了用户兴趣得分,建立了一个个性化的垂直搜索检索模块模型,从而使垂直搜索在个性化上更贴近用户的使用习惯和兴趣。
1 用户兴趣模型的建立
用户兴趣作为垂直搜索引擎当中的一项个性化服务,直接影响到了用户使用该垂直搜索的体验[1]。用户兴趣模型的建立应从???个方面分析:一是用户兴趣模型能否反映用户的真实兴趣爱好;二是针对用户查询兴趣的多变性,该模型是否能满足变化的用户兴趣。
1.1 常用的用户建模技术
现今的用户建模技术分为三类:用户手工定制建模、示例用户建模和自动用户建模。
⑴ 用户手工定制建模
用户自己动手在网页上选择或者手动输入自己的兴趣爱好。该方法实现简单,得到的用户兴趣结果可靠。但是存在不足:①影响用户体验,一般用户对频繁的输入和选择缺乏兴趣;②更新用户模型困难,一旦用户的兴趣发生转移,而又让用户重新提交网页文档会给用户造成负担;③反映用户兴趣不全面,提供给用户的选择项本身就带有主观性,另外用户选择时也存在不能准确表达的情况,这些将直接导致收集的用户兴趣不够准确[2]。
⑵ 示例用户建模
示例用户模型的建模是用户自己提供相关的兴趣爱好示例及其类别属性。用户在浏览网页时标注对页面的感兴趣程度即可得到用户建模的示例。
⑶ 自动用户建模
通过留意用户浏览网页的内容和浏览网页时的行为自动为用户构建一个用户模型[5],这种建模无需用户主动参与,通过用户上网时的行为采用数据挖掘技术自动获取用户
文档评论(0)