- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多模态融合的家庭音乐相册自动生成
多模态融合的家庭音乐相册自动生成
刘君芳 邵曦
南京邮电大学通信与信息工程学院
X
关注成功!
加关注后您将方便地在 我的关注中得到本文献的被引频次变化的通知!
新浪微博
腾讯微博
人人网
开心网
豆瓣网
网易微博
摘????要:
随着大数据以及社交网络的发展, 电子相册与在线服务成为如今人们使用计算机与互联网的基础应用.尤其是近年社交网络的流行, 电子相册的数量得到了爆炸增长, 而如何增强相册的用户体验变得尤为重要.具有某种主题的相册一般都带有一定的情感信息, 因此, 本文研究了基于多模态融合的家庭音乐相册自动生成问题, 旨在使用户能够在享受音乐的同时配以与音乐情感相同的相册图片.针对音乐与图片中所蕴含的情感, 本文在音乐和图像中分别选取能够表达其情感的句子级别的音频特征和图像特征, 然后在图像与音乐之间异构和跨模态的特征融合问题上, 采用局部保持投影 (LPP) 方法, 将图像特征与音乐特征映射到更具情感分类能力的隐式特征空间中, 实现了音乐相册的自动生成.在实验中, 客观评测结果表明, 采用LPP方法在查准率方面高于纯CCA方法;在主观评测中LPP获得72.06%的满意度, 与人工推荐的评价结果 (78.09%) 比较接近, 明显高于随机推荐和CCA方法的满意度.
关键词:
音乐相册; 情感模型; 句子级别; 多模态融合; 隐式空间;
作者简介:刘君芳, 女, 硕士生, 研究方向为多媒体信息系统与多媒体通信.ljf846344673@163.com
作者简介:邵曦 (通信作者) , 男, 博士, 副教授, 主要研究方向为多媒体信息系统与多媒体通信.shaoxi@
收稿日期:2017-08-28
基金:国家自然科学基金
Automatic generation of family music album based on multi-modal fusion
LIU Junfang SHAO Xi
College of Telecommunications and Information Engineering, Nanjing University of Posts and Telecommunications;
Abstract:
With the development of the big data and social network, electronic albums and online services have become basic uses of computers and the Internet.Especially in recent years, the number of electronic albums has exploded with the popularity of social network.So how to improve the user experience of music album becomes particularly important.A photo album with certain topic usually has some emotion information.This paper studies the problem of automatic generation of family music album based on multi-modal fusion, so that users can enjoy music when browsing album photos with matched emotion. According to the emotions in music and images, the representative sentence-level features both for music and images are selected, and the LPP ( Locality Preserving Projection) is employed to study the relevance between the music and the images in the same emotion.The image feature and the music feature are mapped into the latent space with more emotional classification ability to realize the automatic generation of music album.In the
您可能关注的文档
- pbl教学法在计算机网络课程教学中的探索和实践.doc
- pdca闭环型企业财务内控体系的构建.doc
- petct检查中18f-fdg所致患者和放射工作人员辐射剂量估算.doc
- proteus仿真软件在计算机组成原理实验教学中的应用.doc
- sdn环境下的动态随机网络病毒传播模型及特性研究.doc
- spect设备固有均匀性性能测试结果分析.doc
- spark-graphx框架下的大规模加权图最短路径查询.doc
- tof+ccd传感器组合标定及用于eeg电极空间定位方法.doc
- α-硫辛酸、甲钴胺联合治疗糖尿病周围神经病变的临床疗效评价.doc
- tochain一种高性能虚拟网络安全服务功能链.doc
最近下载
- 特种设备作业人员监督管理办法课件.pptx VIP
- “十五五”研究系列:“十五五”前瞻初探.docx VIP
- 时间线时间轴流程图大事记商务版PPT模板合集.pptx VIP
- 2024年儿科急救知识竞赛试题库及答案(精华版).pptx VIP
- 银河证券“十五五”规划展望系列:“十五五”时期投资机遇前瞻【25年9月】.pdf VIP
- 2025年政府采购基础知识练习试题含答案.docx VIP
- 2025年儿科急救知识竞赛试题库及答案(一).docx VIP
- 2024年广发银行(郑州分行)校园招聘模拟试题及答案解析.docx VIP
- 9.14小数乘法计算应用题.doc VIP
- 2022年儿科急救知识竞赛试题库及答案(超强) .pdf VIP
文档评论(0)