- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PKUSpace中基于概念相似度的个性化推荐服务的设计与实现
* * * PKUSpace中基于概念相似度的个性化推荐服务的设计与实现 王位春 指导教师:张铭 北京大学网络与信息系统实验室 2008年1月16日 大纲 论文背景 相关研究工作 研究内容 预期成果 工作计划与时间安排 PKUSpace简介 国家自然科学基金支持的“网络计算资源服务中间件” 教育部博士点基金支持的“协作式科技论文网络共享平台” 与惠普中国实验室的合作项目 新的PKUSpace: 科研交流平台 + Web2.0 数字资源管理系统DSpace 数字资源的持久存储,分发,检索 PKUSpace:科研服务平台 学术论文的组织、存储、检索 元搜索 分类导航 以用户为中心,引导用户贡献内容 资源收藏 用户论文空间 资源评注 协调推荐 标签组织和论文浏览 PKUSpace架构 收藏论文 做标签 评论…… 定期email推荐 与 在线文献推荐 检索、 主题展示 数据读取 接口 论文推荐 引擎 标签挖掘 子系统 DSpace 界面 逻辑层 存储层 论文资源的 组织与流览 相关标签组织 子系统 大纲 论文背景 相关研究工作 研究内容 预期成果 工作计划与时间安排 个性化推荐技术 技术 数据 关键技术 缺点 例子 基于规则的技术 用户行为的历史数据(用户评级) 如何发现规则,规则更新 规则增加时系统的效率问题 SurfLen(网页),在很多电子商务网站中成功应用 [Mobasher, B. et al. CACM2000] 协同过滤 评级矩阵 相邻用户的计算 稀疏性问题,可扩展性问题 MovieLens(电影) CDNOW(音乐) A(Item-based) [Deshpande, M. et al. CIKM2003] 基于内容的过滤 用户对项的喜好或评级,项的特征 相似度计算 领域限制,不能发现新的感兴趣的资源,新用户问题 ifWeb(网页) CiteSeer(网页) [Abbattista, F. et al. AI*AI2002] 基于内容与协同过滤方法的结合 两种过滤技术的结合方法 Fab(网页) GroupLens(新闻) [Wei, Y. Z. et al. AAMAS2003] 科技文献推荐相关研究 系统/研究 推荐算法 利用信息 类推荐功能 CiteSeer [Bollacker, K.D. et al. IEEE00] 基于内容推荐 用户定制兴趣关键字,文献全文 某文献相似相关论文 acm/cs.bib 无 某文献相似论文(文本搜索) CiteULike 无 相同标签的其他论文 [McNee, S. M. et al. CSCW06] [Torres, R. et al. JCDL04] 基于内容推荐,协作推荐,二者结合等多种算法 文献内容,文献引用关系 基于文本的研究比基于评分矩阵的研究少很多 没有结合语义的成熟研究 对Web2.0的特性运用不够 大纲 论文背景 相关研究工作 研究内容 基于概念相似度的个性化推荐服务的设计 子系统的实现与评测 预期成果 工作计划与时间安排 个性化推荐服务的设计 Ontology的构建 研究使用系统数据构建语义概念 研究建立语义概念间的关系 用户个性化信息及文献特征的描述 研究使用哪些信息来表示用户个性及文献特征 研究如何使用语义概念来描述用户及文献的profile 研究profile的相似度计算方法 个性化推荐技术 针对科技文献的特点研究新的个性化推荐技术 Ontology的定义 使用tag构建语义概念 从单个tag出发构建语义概念 [Li, R. et al. WWW07] Mis u1 … ui … uj … d1 … ds … dt … dn 使用tag构建语义概念(续) 加入基于wordnet本体的相似度计算 用户兴趣与文献特征的表示 用户和文献profile统一表示为语义概念的集合 用户profile从用户标记的所有tag出发构建 文献profile从文献被标记的所有tag出发构建 主要用于协同过滤的方法 文献特征向量 使用文献标题及摘要构建TFIDF向量 用于基于内容的过滤方法 语义概念相似度与profile相似度 语义概念相似度 两个语义概念中tag的匹配 匹配tag的相似度的加权平均 如果两个语义概念的相似度大于一个很大的阈值,将两个语义概念合并成一个概念 profile的相似度 profile中语义概念的匹配 匹配语义概念的相似度的加权平均 协同过滤 用户相似度 Uc表示用户u1和u2标记过的文献的交集 Us表示用户u1和u2标记过的文献的并集 Ns=|Us|,Nc=|Uc| Simprofile(i, j)表示两个profile的相似度
您可能关注的文档
最近下载
- 2020年上海社会科学院科研岗位招聘试题及答案.doc
- 05G511:梯形钢屋架 国标图集.pdf VIP
- 党员“一带一”活动J计划、实施方案及协议书4.doc VIP
- 东北电力大学2022-2023学年《数据结构》期末考试试卷(A卷)附参考答案.docx
- 2022年广州工商学院退役军人综合考察真题.pdf
- 05-G511 梯形钢屋架 标准图集.pdf VIP
- 成人住院患者静脉血栓栓塞症的预防护理-中华护理学会团体标准2023.pptx
- 线下沙龙策划方案.docx VIP
- 2023年浙江中医药大学数据科学与大数据技术专业《数据库原理》科目期末试卷A(有答案).docx VIP
- 设计说明书(履带式行走底盘).pdf
文档评论(0)