- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于图像语义的用户兴趣建模-武汉大学信息检索与知识挖掘研究所
研究论文
基于图像语义的用户兴趣建模*
曾 金 1, 3 陆 伟 1, 2 丁 恒 1 陈海华 1
1(武汉大学信息管理学院 武汉 430072)
2(武汉大学信息检索与知识挖掘研究所 武汉 430072)
3(武汉传媒学院文化管理学院 武汉 430205)
摘要: 【目的 】社交网络环境下的用户兴趣建模是好友推荐、精准营销的关键, 利用微博用户分享的图像, 提出
一种基于图像语义的用户兴趣建模方法, 旨在更加准确地预测用户的真实兴趣。【方法 】在获取新浪微博用户图
像数据的基础上, 使用图像的高层语义表达用户兴趣特征, 基于这些特征使用SVM 训练得到图像语义分类器进
行预测。【结果 】实验结果表明, 本文建立的模型能够较为准确地预测用户真实兴趣, 169 位用户分类的准确率达
到97.38%, 召回率为98.92%, F 值为98.14%。【局限 】由于实验图像数据集有限, 未能完整地覆盖用户所有的兴
趣类别。【结论 】该模型能够基于用户分享的图像较为准确地预测用户兴趣, 表明了图像高层语义的有效性, 同
时为图像高层语义应用研究提供了一定的理论和技术基础。
关键词: 图像语义 用户兴趣建模 社交网络 支持向量机
分类号: G353
像数据也能够直接地、真实地反映用户个人的兴趣行为
1 引 言
和兴趣取向, 尤其是社交网络中用户分享的各类图像信
随着网络带宽和多媒体技术的迅猛发展, 用户获 息, 是用户兴趣内容的直接记录和表现方式, 并且用户
取信息资源的方式日益多元化, 不同的用户由于知识 图像分享不受语言障碍限制, 不同的国家及文化背景的
背景、兴趣爱好等方面的差异, 需要的信息资源往往 用户, 可以很方便地通过分享图像表达自己的兴趣和爱
是不同的。在这种网络环境下, 为了更好地解决个性 好。所以, 在社交网络环境下如何从大量的图像数据中
化用户兴趣需求, 建立更为准确的用户兴趣模型, 各 识别用户兴趣, 是一个非常有挑战性的问题。
种用户兴趣数据采集方法应运而生。 建立用户兴趣模型, 必须获取大量真实的用户兴
目前, 用户兴趣数据主要有两种: 用户行为数据[1] 趣信息。获取用户兴趣信息的过程离不开用户的参与
[2]
和用户文本数据 。用户行为数据, 一般通过设计相应 以及他们的信息反馈。根据用户兴趣信息的获取方法,
的系统或系统插件来收集信息, 但是系统或系统插件 可以分为两类: 显式反馈和隐式反馈[3] 。显式反馈是指
设计时间周期性长, 收集数据过程较为漫长, 需要消 用户通过社交网络或检索系统直接表达自己的兴趣爱
耗一定的人工成本和时间成本。用户文本数据获取较 好, 获取显式反馈信息有两种方法: 一种是用户对自
为困难, 鉴于数据隐私保护等原因, 一般不公开或对 己感兴趣的信息进行打分、评价、回复等, 从而获取
研究者开放, 如: 检索日志难以获得。当然建模方法在 用户的兴趣反馈; 另一种是用户通过网络注册或填写
用户兴趣研究方面非常成熟, 也在社交网络下解决了 表单的形式获取用户的兴趣反馈。这两种方法的好处
用户获取兴趣问题。 在于简单, 能直接获得用户的兴趣; 不足之处在于需
相比较于用户行为数据和用户文本数据, 用户图 要用户花费时间和精力参与, 不太友好的用户可能会
通讯作者: 陆伟, ORCID: 0000-0002-0929-7416, E-mail: weilu@ 。
*本文系国家自然科学基金面上项目“面向词汇功能的学术文本语义识别与知识图谱构建”(项目编号:的研究成果之一。
76 数据分析与知识发现
总第4 期 2017 年 第4 期
直接忽视或拒绝做出评价反馈。另外显式反馈
您可能关注的文档
最近下载
- 中国文化概论课件-中国文化的现代化.ppt VIP
- 酒店基本情况调查表.docx VIP
- 《GNSS定位测量技术》 课件 子项目1、2 GNSS定位技术的发展;坐标系统与时间系统.ppt
- 人教人音版七年级音乐上册《红旗颂》课件下载.ppt VIP
- 2024年新人教版一年级上册数学全册教案(新版教材).docx
- 消防检测课件.pptx VIP
- 生物制药实验室管理软件:LabVantage二次开发_(5).LabVantage用户界面定制.docx VIP
- 中国文化概论课件-中国文化的发展历程.ppt VIP
- GB51016-2014 非煤露天矿边坡工程技术规范.pdf VIP
- 一种抗单粒子烧毁的高电子迁移率晶体管及其制备方法.pdf VIP
文档评论(0)