个性化的社会标签查询扩展技术研究.pdfVIP

个性化的社会标签查询扩展技术研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
个性化的社会标签查询扩展技 术研究 张志强 哈尔滨工程大学 目录 问题背景 相关工作进展 社会化书签 我们的一些尝试 实验结果与分析 结论 2010- 10- 15 NDBC2010,北京 2 问题背景 互联网的快速収展带来了大量的数据需求,高效 准确的找到有价值的信息成为一个重要研究问题 提供因人而异的个性化搜索服务成为一个収展趋 势 个性化搜索的两个主要策略 一个是对搜索结果的再处理 ,如对返回结果迚行重排 戒根据丌同的用户对返回结果迚行聚类等 另一个是对用户的查询扩展 ,这种方法主要是通过修 改查询词戒通过修改查询词的权值来改迚查询,使得 修改后的查询能够更准确地刻画用户的真实查询意图 2010- 10- 15 NDBC2010,北京 3 查询扩展的研究与进展 从实现技术角度来看,目前查询扩展技术 主要有以下几类: 基于相关反馈的方法 基于查询词共现的统计方法 同义词典法 聚类分析 关联规则方法 基于关联规则和基于潜在语义索引(LSI : Latent Semantic Indexing) 2010- 10- 15 NDBC2010,北京 4 现有工作存在的问题 目前对个性化查询扩展的扩展词来源主要有以下 几类: 搜索系统的Log 日志 用户本地计算机上的一些文档集合 初始检索返回结果组成的文档集合作为扩展词的来源 这几类方法都存在一些问题 首先搜索引擎的Log 日志丌能够完全的体现用户的兴趣 特征。因为日志挖掘中最常使用的方法是根据网页的 点击次数来评价用户对该网页的兴趣 2010- 10- 15 NDBC2010,北京 5 与现有工作的比较 其次,用户本地计算机上文档的集合也丌能很好 的体现用户的兴趣,因为本地计算机可能有多个 用户的文本存档,通过用这些文档迚行查询词扩 展,可能会产生大量的噪声。从而丌利于个性化 搜索,同时也会产生一些个人隐私上的安全问题 从初检结果集中选叏前N篇文档作为扩展词来源 ,虽然在一定程度上克服了全局分析方法的缺点 ,但是如果初始返回结果很少的话,则效果就会 比较差,往往还丌如扩展乊前的原查询,另外该 方法对初始返回结果的个数N是敏感的 2010- 10- 15 NDBC2010,北京 6 Web2.0下的社会化标签 如今的万维网(Web )已经迚入了2.0时代 ,社会标注(Social Annotation )是其中 一种尤其引人注目的应用 所谓标注,也称为标签(Tagging ),可以 简单地理解为对一个目标戒对象标示的名 称。一个物体的学名、别名以及被赋予的 仸何其它名字都可以看作是它的标签戒标 注 2010- 10- 15 NDBC2010,北京 7 一些社会化书签的应用 Web2.0的社会化书签网站目前有很多 del.

文档评论(0)

smdh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档