- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于层次向量空间模型的用户兴趣建模研究.pdf
@
研究与开发
基于层次向最空间模型的用户兴趣建模研究*
邱晓俊 , 刘发升
(江西理工大学信息t程学院,赣州 341似)())
摘 要:个性化信息检索中,设计用户兴趣模型是…个关键问题。通过分析 Web 环珑下用户的特点
和浏览行为,提出一种基于层次向量空间模型的用户兴趣建模和更新方法,以满足用户个
性化的服务常求。根据用户对资饰的浏览速度来计算用户的兴趣度,使模型饺子实现,ll史
新及时、简单。
关键诩:个性化;用户兴趣模缎;层次向l交问模型自
。引l 窗
近年来,出现了许多满足用户个性化信息需求的
技术,而在个性化推荐系统中,…个关键问题就是如何
建立用户的兴趣模型。用户兴趣建模是个性化服务技
术的关键,决定了个性化服务系统的性能优劣。只有当
用户的兴趣、偏好和访问模式等可以被系统很好地理
解时,才可能实现理想的个性化服务。用户兴趣建棋
是指根据用户提供的信息(例如用户浏览内容、浏览行
为、摹本倚息、撞式反愤和订单信息等)归纳出用户兴
趣模型i110 用户模型常被理解为对用户在某个时间段内
相对稳定的信息需求的描述。用户的只趣是多方面的,
单是对用户兴趣的准确描述不能称为用户模型。以计
算机平台为依托的个性化服务系统,可计算性是它对
用户模型的基本要求。也就是说,用户模型不是对用户
,个体的…般性描述,而是一种面向算法的,具有特定数
据结构的形式化的用户描述。因为在个性化服务系统
中的重要地位,如何构建、更新和进一步优化用户兴趣
模型巳经成为近年来的研究熏点,也是个性化应用系
统亟待解决的热点问题阴。
1 用户模型的亵示
(1)主题表示法
3:题者示法是指以用户感兴趣的信息:t恩来表示
用户的兴趣特征。例如用户对新闻和体育提信息感兴
趣,则用户描述文件表求为{新闻,体育},这种表示方法
往往与具体的应用领城相结合。
(2)收藏央表示法
收藏夹表示法是指以用户保存的重要抽点或页甜
的收藏央为依据来建立用户兴趣模型。用户在浏览
Web 的过程中,会将感兴趣戒很有价值的]富丽或间站
保存在收藏夹中以方便以后浏览,因此用户的收藏央
民I用来反映用户感兴趣的主题。采用收藏夹表示法的
个性化系统例如 Siteseer l31 、 Open Bookm础[31和网上
Bookmark网服务系统。
(3)关键词列表法
关键词列表怯是指以用户感兴趣信息的关键词来
描述用户的兴趣特征。例如用户对篮球赛感兴趣,则用
户描述文件可以表示为(NBA ,火箭,湖人,科比)等。关
键词可以由用户指定,也可以通过学习算法得到。通过
学习算法得到的关键词在本质上与文本分3是中的特征
选择问题相似,都是通过训练样本得到一个较小的特
征集合。来用关键词列表法的个性化服务系统有
WebWatche o
(4)向盘空间模珊
向盘空间模型表示法是指用向盘空间中的向盘炭
示关键词来描述用户的兴趣特征。向盘空间模型是因
*基金项目:江西省科技斤工业攻关项阁(精财教[ 2005 ]1 32 -f)、江西省教育厅科技计划项目(No.G}J08283)
收稿日期 :2010叶4一02 修稿日期 :2010…05甲02
作者简介:邱晓俊(1985叩),寡,硕士研究生,研究方向为数据挖掘与数据库
现代 2010.06
前为止最流行的用户模型表示方浩。
向露间模型 (Vector Space Model ,简称 VSM)是
表示文梢的常用方法,其基本思想是以向盘来表示::t
梢,向量的锋一维由一个关键调及咒极重组成。每个文
梢 w 可表示为 ((tt.WI) , (t2W2) ,…, (tW..)) , ti 为第 i 个
单字,既为单字 ti 在文梢 w 中的权壤。极重口I取布尔债
和实数值,分别表示了用户是否对某个概念感兴跑以
及感兴趣的棋度 tl.t2 , … , tm ,可以使用户感兴蠕文梢中出
现的余部单字,也可以便选择出来表示用户兴趣的关
键词。
单字 t, 在文梢 w 中的权重 W, 有多种计算方法,最
常用的有布尔词顿和 TF-IDF。布尔值是以单字 t, 在文
梢 w 中的出现或是不出现作为其棋道 Wi. 即:
rO,单字在文档 w 中未出现
W;ll ,单字在文梢 w 中出现
词颇就是以单字在文梢 w 中出现的次数作为诙单
字的权童,即:
w,=TF(tiW )log(nlDF(t;)) (1)
其中 , TF(tiW)为单字 t, 在文精 w 中出现的次数 ,n
为文档总数 ,DT(ti)为包含单字 t, 的文梢数。
典型的基于 VSM 表示用户兴趣模型的个性化服
务系统有 :URA 、Syskil1Webert!明、PWW何等。
(5 )暮于神经问绵的表示
慕于神经网络的表示是用网络稳定后网络连接权
重所特征化的网络状态来表示用户模型。神经网络是
您可能关注的文档
最近下载
- 第四章战国、秦、汉、三国时期的建筑详解.ppt VIP
- T_HAEPCI 55—2023(有色冶炼场地土壤-地下水重金属污染协同修复与管控技术指南).pdf VIP
- 青春筑梦婴幼儿托育服务与管理专业启航未来职业生涯.pptx VIP
- 【新教材】2025-2026学年统编版(2024)三年级道德与法治上册第1课《学习伴我成长》课件.pptx
- T ACEF 111—2023 焦化污染土壤多环芳烃生物修复智能监测预警技术指南.pdf VIP
- MTT 114-2005 煤矿用多级离心泵.pdf VIP
- TACEF 112-2023 焦化污染土壤多环芳烃生物修复智能监测设备配置技术指南.pdf VIP
- GBT18479-2001 地面用光伏(PV)发电系统 概述和导则.pdf
- 低血容量性休克的护理.pptx VIP
- 2《住宅项目规范》宣贯培训-第3章.pdf
文档评论(0)