个性化用户兴趣模型的研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
个性化用户兴趣模型的研究.doc

个性化用户兴趣模型的研宄 随着人们对信息获取手段和效率提出越 来越高的要求,传统互联网的服务模式正在逐渐向主 动式、个性化、高效率的转变。个性化服务技术的出 现在一定程度上解决了 Internet中信息海量增长与用 户获取信息手段相对简单之间的矛盾。用户兴趣建模 技术作为个性化服务的核心问题,主要研究如何有效 地进行用户兴趣的表示、更新、存储以及计算。 关键词:个性化;用户模型;数据挖掘 TP301 A : 1672?7800 (2011) 012?0029?03 张艳(1983-),女,江苏邳州人,硕 士,南京陆军指挥学院助教,研究方向为数据挖掘。1 用户兴趣模型研宄现状 1.1用户兴趣模型的研究内容 目前的检索系统多从检索模型和信息加工过程来 提高检索的准确性,并没有给予用户更多的关注,特 别是以网络搜索引擎为例,不同背景的用户使用相同 的提问来查询,得到的结果没有区别,相同的用户在 不同的时间做的相同的查询,得到的结果没有区别, 使得用户不容易发现自己的最新兴趣,这主要的原因 是,在这些服务系统中,没有考虑到用户信息的存在, 也就是用户过去的行为和用户的历史数据。为了解决 这个问题,有必要引入用户兴趣模型。 用户模型的应用领域是广泛的,在信息检索过程 中引入用户模型,有利于实现自适应检索,既提供一 种个性化智能化的信息检索服务。通过对用户检索行 为历史中的记录和学习,可对用户检索提问分析得更 为准确,这实质上就是提高检索结果与用户需求之间 的相关性,通过提高用户相关度来提高用户的满意度。 同时,用户模型有助于预期定位用户的需求,进行主 动服务。 用户兴趣模型的定义为:用户兴趣模型是用来捕 获用户需求及其兴趣点,并记录、管理用户兴趣,描 述用户潜在的兴趣及需求的模型。 1.2研宄现状 早期用户模型主要是用在自适应人机界面 (Adaptive human?Computer interface),同时也是信息 过滤(I nformation Fj Ite ri ng)机制研兜的一个核心问题。 用户界面是直接与用户交互的接口,通过与用户的交 互,接收用户的行为,积累用户处理事务的经验,以 应对用户出现的新的动作。用户模型是用于存储和管 理用户行为历史,存储学习用户行为的知识和进行相 关推导的知识功能的集合。信息过滤是研究的是面向 个体进行信息过滤筛选,它关注用户的长线需求(在一 段时间内为固定不变的需求),提供与其相关的信息。 用户描述文件还没有一个统一的标准,如 W3C( .省略)有两个涉及用户描述文件的标准: PICSjplatform for internet content selection)和 APPEL1.0(a P3Ppreference exchange language 1.0),PICS 是父母和老师用来控制孩子的浏览能力的,提供了过 滤规则定义语言PICSRules.APPELl.O可定义用户感兴 趣的站点和过滤规则,这些规则大部分是在PICSRules 的基础上发展起来的。此外,Netscape,Firefly和 VeriSign 曾向 W3C 的 P3P(platform for privacy preferences)工作组提交了一个 OPS(open profiling standard)草案,由于目前P3P版本不打算考虑如何进 行数据传输,因此该草案被搁置一边,OPS描述了如 何表示一个用户描述文件以及用户与Web站点交互 的问题。文件可以用文件来组织,也可以用关系数据 库或其它数据库来组织。目前有一些系统采用基于 XML 的 RDFjresource definition framework)来表达用 户描述文件,并利用支持XML的数据库系统来存储 用户描述文件。这样,不仅利用了 XML的优点,也 保持了系统的性能。表1从用户描述文件创建的数据 源和表达方式比较了几个典型的个性化服务系统。 1.3存在的问题 通过大量的调研学习发现:首先,目前大多数个 性化系统的用户兴趣模型都是基于内容进行用户兴趣 挖掘的,偏重于用户浏览内容的学习和研宄,而对用 户行为的分析研宄尚不充分,未能有效地利用用户行 为来发现用户兴趣及过滤噪音。由此所构建的用户兴 趣模型的客观性和准确性都受到了限制。其次,用户 及文档特征的表示方法单一,通常将文档或用户当作 一个“整体”进行描述,这样的特征表示方法缺乏层 次性,表示粒度有限,难以真正体现“个性化”的初 衷。再次,用户兴趣模型学习过程中所用的训练文档 都被假设为用户“兴趣文档”,没有对其中的“非兴趣 文档”加以区分,因此引入了许多个性化系统自身系 统框架及算法难以过滤掉的噪音。 表1典型的个性化服务系统的用户描述文件对比 个性化服务系统数据源用户描述文件的表示方式

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档