- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
搜索引擎的群体个性化研究.pdf
中国科技论文在线
搜索引擎的群体个性化研究
文义
武汉理工大学计算机科学与技术学院,武汉 (430070)
E-mail :wenykgy@
摘 要:如何从海量的互联网资料中找到自己需要的信息,成为了阻碍互联网发展的一大难
题。传统搜索引擎的出现提高了网络信息的检索速度,但还是无法满足人们对信息服务日益
增长的个性化需求。同时,在这个讲究个性和以人为本的时代,个性化和人性化的搜索引擎
也成为了时代的需要。本文利用个性化信息采集系统收集和提取用户的个性化信息,通过进
一步扩展用户需求和优化搜索过程和结果,为用户提供群体个性化的信息搜索服务。
关键词:个性化信息采集;个性化查询;搜索引擎;群体个性化
1.引言
近年来,随着网络的流行和互联网信息的爆炸性增长,整个网络正在堆积成一个前所未
有的超级大型数据库。传统的搜索引擎由于其通用性,越来越不能满足不同背景、不同目的
和不同时期用户的个性化需求。传统搜索引擎,只要使用相同的关键词检索,返回的结果必
然是相同的,它并不考虑不同用户的特殊需要和信息偏好,所有用户都面对着同样的信息空
间。而且在传统的搜索引擎中,随便的关键字搜索都会有成千上万条的返回信息,其中不乏
大量的过期和损坏的信息和链接,用户要从这些信息中找到需要和有用的信息,又是一个巨
大的工程。
用户急需一个可以理解用户的个性化需求,并根据用户个性化需求快速准确的提供用户
真正感兴趣的信息的个性化搜索引擎。如今,搜索技术遭遇的最大挑战,是如何根据每个用
户的细微差别,为他们提供最妥帖的搜索内容,而这项新技术,将为搜索引擎使用方式注入
全新的内涵[1] 。本文在个性化研究的基础上,通过进一步扩展用户需求和优化搜索过程,提
出了一种更为详细客观的群体个性化的信息搜索服务。
2 .个性化搜索引擎
个性化搜索引擎是指按照特定用户的个性化需求,为其提供人性化的互联网搜索服务。
具体来说,首先应该获取用户的个性化信息,通过对个性化信息的组织和分析得到用户的个
性化模式,然后将用户的个性化模式附加到用户的搜索过程中,侧重获取符合用户个性化需
求的网络信息,最后对搜索到的信息进行组织排列,为每个用户提供符合其个性化要求的搜
索结果。
2.1 个性化搜索引擎的体系架构
个性化搜索引擎针对传统搜索引擎在用户个性化方面的不足,通过加入个性化模块,获
取用户的个性化信息,为用户提供符合其兴趣习惯的搜索结果[2] 。其体系架构如图1 所示,
主要由通用搜索引擎、查询接口、个性化客户端三部分组成。
-1-
中国科技论文在线
图1 个性化搜索引擎的体系架构
通用搜索引擎部分与传统搜索引擎的功能与结构一样,主要由网络爬虫、索引器、索引
数据库、检索器等模块组成,负责网络信息资源的搜索、连接、传输和分析,并根据其中的
超链接继续处理其它资源,将分析结果存入索引库,供检索使用。查询接口是用户能看到的
部分,通过它为用户提供友好的搜索引擎输入、输出界面。个性化客户端是个性化搜索引擎
最为关键的部分,也是区别于传统搜索引擎的主要特征。一般包括个性化信息库模块、查询
优化器、中英文词典以及机器的智能学习模块等,其中还包括个性化信息库的更新与维护模
块。在用户的使用过程中,机器可以通过用户的浏览行为自主学习,动态更新用户的个性化
信息库,并在用户搜索过程中,通过查询优化器连接个性化信息库和中英文词典自动对用户
的搜索进行优化,从而达到提高查询质量的目的。
2.2 个性化信息采集系统
个性化搜索引擎与传统搜索引擎的主要区别就在于,个性化搜索引擎可以通过用户的个
性化信息,为不同的用户提供符合其兴趣和习惯的人性化搜索结果。每个用户都有他的个性,
只有充分理解用户的个性化需求,才能为用户提供更好、让用户更满意的个性化的服务。所
以如何收集用户的个性化信息,建立一个健全的、动态的用户个性化信息库,是实现个性化
搜索引擎的关键。如图2 所示的个性化信息采集模型,根据这个模型我们可以建立一个个性
您可能关注的文档
- 我国公路货运现代化与装备发展方向_条件_对策.pdf
- 我国农业科技推广的制约因素分析.pdf
- 我国农村居民主要粮食消费特征研究.pdf
- 我国农村污水处理模式与技术研究.pdf
- 我国农民消费行为的影响因素.pdf
- 我国决策咨询研究述评.pdf
- 我国区域经济发展差距分析.pdf
- 我国商业银行并购效率的研究方法述评.pdf
- 我国地下水除铁除锰技术研究进展.pdf
- 我国废钢的利用现状与分析.pdf
- 2025年低空经济政策深度分析与区域协同发展报告.docx
- 2025年全球婴幼儿护理行业技术创新与发展报告.docx
- 毕业设计(论文)-汽车车门支撑板成形修边冲孔模具设计.doc
- 音乐教师中华优秀传统文化传承的现状与瓶颈.docx
- 2025年广东省清远市辅警协警笔试笔试预测试题(含答案).docx
- 低空旅游产业投资风险预警与防范策略白皮书.docx
- 2025年美容O2O平台用户行为分析与运营策略研究报告.docx
- 2025年新环境保护法知识竞赛试题及参考答案.docx
- 2025年 江苏扬州工业职业技术学院专职辅导员招聘考试笔试试卷[附答案].docx
- 2025年 江铜建设招聘考试笔试试卷[附答案].docx
最近下载
- 用人单位劳动合同模板.doc VIP
- 华熙生物-投资价值分析报告:全球最大透明质酸生产商的产业链延伸.pdf VIP
- 20200522-中信证券-华熙生物-688363-投资价值分析报告:研发驱动,服务美好生活.pdf VIP
- 医药生物行业:华熙生物,全球透明质酸领军企业.docx VIP
- 2025年校园监控系统方案(四篇).pdf VIP
- 2025广西公需科目考试答案(3套涵盖95-试题)一区两地一园一通道建设人工智能时代的机遇与挑战.docx VIP
- 华熙生物-投资价值分析报告-透明质酸,供需双振_20200413.pdf VIP
- 2025年校企合作实训项目设计与实施案例报告.docx
- 华熙生物-投资价值分析报告-全球透明质酸龙头,积极延伸医疗美妆终端.pdf VIP
- 重庆市巴蜀初一入学分班语文试卷版.doc VIP
文档评论(0)