基于图像语义的用户兴趣建模-武汉大学信息检索与知识挖掘研究所.pdfVIP

基于图像语义的用户兴趣建模-武汉大学信息检索与知识挖掘研究所.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于图像语义的用户兴趣建模-武汉大学信息检索与知识挖掘研究所

研究论文 基于图像语义的用户兴趣建模* 曾 金 1, 3 陆 伟 1, 2 丁 恒 1 陈海华 1 1(武汉大学信息管理学院 武汉 430072) 2(武汉大学信息检索与知识挖掘研究所 武汉 430072) 3(武汉传媒学院文化管理学院 武汉 430205) 摘要: 【目的 】社交网络环境下的用户兴趣建模是好友推荐、精准营销的关键, 利用微博用户分享的图像, 提出 一种基于图像语义的用户兴趣建模方法, 旨在更加准确地预测用户的真实兴趣。【方法 】在获取新浪微博用户图 像数据的基础上, 使用图像的高层语义表达用户兴趣特征, 基于这些特征使用SVM 训练得到图像语义分类器进 行预测。【结果 】实验结果表明, 本文建立的模型能够较为准确地预测用户真实兴趣, 169 位用户分类的准确率达 到97.38%, 召回率为98.92%, F 值为98.14%。【局限 】由于实验图像数据集有限, 未能完整地覆盖用户所有的兴 趣类别。【结论 】该模型能够基于用户分享的图像较为准确地预测用户兴趣, 表明了图像高层语义的有效性, 同 时为图像高层语义应用研究提供了一定的理论和技术基础。 关键词: 图像语义 用户兴趣建模 社交网络 支持向量机 分类号: G353 像数据也能够直接地、真实地反映用户个人的兴趣行为 1 引 言 和兴趣取向, 尤其是社交网络中用户分享的各类图像信 随着网络带宽和多媒体技术的迅猛发展, 用户获 息, 是用户兴趣内容的直接记录和表现方式, 并且用户 取信息资源的方式日益多元化, 不同的用户由于知识 图像分享不受语言障碍限制, 不同的国家及文化背景的 背景、兴趣爱好等方面的差异, 需要的信息资源往往 用户, 可以很方便地通过分享图像表达自己的兴趣和爱 是不同的。在这种网络环境下, 为了更好地解决个性 好。所以, 在社交网络环境下如何从大量的图像数据中 化用户兴趣需求, 建立更为准确的用户兴趣模型, 各 识别用户兴趣, 是一个非常有挑战性的问题。 种用户兴趣数据采集方法应运而生。 建立用户兴趣模型, 必须获取大量真实的用户兴 目前, 用户兴趣数据主要有两种: 用户行为数据[1] 趣信息。获取用户兴趣信息的过程离不开用户的参与 [2] 和用户文本数据 。用户行为数据, 一般通过设计相应 以及他们的信息反馈。根据用户兴趣信息的获取方法, 的系统或系统插件来收集信息, 但是系统或系统插件 可以分为两类: 显式反馈和隐式反馈[3] 。显式反馈是指 设计时间周期性长, 收集数据过程较为漫长, 需要消 用户通过社交网络或检索系统直接表达自己的兴趣爱 耗一定的人工成本和时间成本。用户文本数据获取较 好, 获取显式反馈信息有两种方法: 一种是用户对自 为困难, 鉴于数据隐私保护等原因, 一般不公开或对 己感兴趣的信息进行打分、评价、回复等, 从而获取 研究者开放, 如: 检索日志难以获得。当然建模方法在 用户的兴趣反馈; 另一种是用户通过网络注册或填写 用户兴趣研究方面非常成熟, 也在社交网络下解决了 表单的形式获取用户的兴趣反馈。这两种方法的好处 用户获取兴趣问题。 在于简单, 能直接获得用户的兴趣; 不足之处在于需 相比较于用户行为数据和用户文本数据, 用户图 要用户花费时间和精力参与, 不太友好的用户可能会 通讯作者: 陆伟, ORCID: 0000-0002-0929-7416, E-mail: weilu@ 。 *本文系国家自然科学基金面上项目“面向词汇功能的学术文本语义识别与知识图谱构建”(项目编号:的研究成果之一。 76 数据分析与知识发现 总第4 期 2017 年 第4 期 直接忽视或拒绝做出评价反馈。另外显式反馈

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档