基于层次向量空间模型的用户兴趣建模研究.pdfVIP

基于层次向量空间模型的用户兴趣建模研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于层次向量空间模型的用户兴趣建模研究.pdf

@ 研究与开发 基于层次向最空间模型的用户兴趣建模研究* 邱晓俊 , 刘发升 (江西理工大学信息t程学院,赣州 341似)()) 摘 要:个性化信息检索中,设计用户兴趣模型是…个关键问题。通过分析 Web 环珑下用户的特点 和浏览行为,提出一种基于层次向量空间模型的用户兴趣建模和更新方法,以满足用户个 性化的服务常求。根据用户对资饰的浏览速度来计算用户的兴趣度,使模型饺子实现,ll史 新及时、简单。 关键诩:个性化;用户兴趣模缎;层次向l交问模型自 。引l 窗 近年来,出现了许多满足用户个性化信息需求的 技术,而在个性化推荐系统中,…个关键问题就是如何 建立用户的兴趣模型。用户兴趣建模是个性化服务技 术的关键,决定了个性化服务系统的性能优劣。只有当 用户的兴趣、偏好和访问模式等可以被系统很好地理 解时,才可能实现理想的个性化服务。用户兴趣建棋 是指根据用户提供的信息(例如用户浏览内容、浏览行 为、摹本倚息、撞式反愤和订单信息等)归纳出用户兴 趣模型i110 用户模型常被理解为对用户在某个时间段内 相对稳定的信息需求的描述。用户的只趣是多方面的, 单是对用户兴趣的准确描述不能称为用户模型。以计 算机平台为依托的个性化服务系统,可计算性是它对 用户模型的基本要求。也就是说,用户模型不是对用户 ,个体的…般性描述,而是一种面向算法的,具有特定数 据结构的形式化的用户描述。因为在个性化服务系统 中的重要地位,如何构建、更新和进一步优化用户兴趣 模型巳经成为近年来的研究熏点,也是个性化应用系 统亟待解决的热点问题阴。 1 用户模型的亵示 (1)主题表示法 3:题者示法是指以用户感兴趣的信息:t恩来表示 用户的兴趣特征。例如用户对新闻和体育提信息感兴 趣,则用户描述文件表求为{新闻,体育},这种表示方法 往往与具体的应用领城相结合。 (2)收藏央表示法 收藏夹表示法是指以用户保存的重要抽点或页甜 的收藏央为依据来建立用户兴趣模型。用户在浏览 Web 的过程中,会将感兴趣戒很有价值的]富丽或间站 保存在收藏夹中以方便以后浏览,因此用户的收藏央 民I用来反映用户感兴趣的主题。采用收藏夹表示法的 个性化系统例如 Siteseer l31 、 Open Bookm础[31和网上 Bookmark网服务系统。 (3)关键词列表法 关键词列表怯是指以用户感兴趣信息的关键词来 描述用户的兴趣特征。例如用户对篮球赛感兴趣,则用 户描述文件可以表示为(NBA ,火箭,湖人,科比)等。关 键词可以由用户指定,也可以通过学习算法得到。通过 学习算法得到的关键词在本质上与文本分3是中的特征 选择问题相似,都是通过训练样本得到一个较小的特 征集合。来用关键词列表法的个性化服务系统有 WebWatche o (4)向盘空间模珊 向盘空间模型表示法是指用向盘空间中的向盘炭 示关键词来描述用户的兴趣特征。向盘空间模型是因 *基金项目:江西省科技斤工业攻关项阁(精财教[ 2005 ]1 32 -f)、江西省教育厅科技计划项目(No.G}J08283) 收稿日期 :2010叶4一02 修稿日期 :2010…05甲02 作者简介:邱晓俊(1985叩),寡,硕士研究生,研究方向为数据挖掘与数据库 现代 2010.06 前为止最流行的用户模型表示方浩。 向露间模型 (Vector Space Model ,简称 VSM)是 表示文梢的常用方法,其基本思想是以向盘来表示::t 梢,向量的锋一维由一个关键调及咒极重组成。每个文 梢 w 可表示为 ((tt.WI) , (t2W2) ,…, (tW..)) , ti 为第 i 个 单字,既为单字 ti 在文梢 w 中的权壤。极重口I取布尔债 和实数值,分别表示了用户是否对某个概念感兴跑以 及感兴趣的棋度 tl.t2 , … , tm ,可以使用户感兴蠕文梢中出 现的余部单字,也可以便选择出来表示用户兴趣的关 键词。 单字 t, 在文梢 w 中的权重 W, 有多种计算方法,最 常用的有布尔词顿和 TF-IDF。布尔值是以单字 t, 在文 梢 w 中的出现或是不出现作为其棋道 Wi. 即: rO,单字在文档 w 中未出现 W;ll ,单字在文梢 w 中出现 词颇就是以单字在文梢 w 中出现的次数作为诙单 字的权童,即: w,=TF(tiW )log(nlDF(t;)) (1) 其中 , TF(tiW)为单字 t, 在文精 w 中出现的次数 ,n 为文档总数 ,DT(ti)为包含单字 t, 的文梢数。 典型的基于 VSM 表示用户兴趣模型的个性化服 务系统有 :URA 、Syskil1Webert!明、PWW何等。 (5 )暮于神经问绵的表示 慕于神经网络的表示是用网络稳定后网络连接权 重所特征化的网络状态来表示用户模型。神经网络是

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档