网络海量可媒体智能处理的理论与方法.docVIP

下载本文档

17
0
约2.74万字
约 33页
2016-12-13 发布于贵州
举报
版权申诉

网络海量可媒体智能处理的理论与方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

项目名称：网络海量可视媒体智能处理的理论与方法首席科学家：胡事民清华大学起止年限： 2011.1至2015.8 依托部门：教育部二、预期目标 3.1总体目标本项目总体目标是开展网络环境下海量可视媒体智能处理的理论与方法研究，在网络海量内容的视觉感知高效计算与分析学习、符合人类感知的可视媒体交互、融合与呈现、异构多源可视媒体的关联挖掘等重要方面上取得突破性进展，建立可视媒体的认知与学习、分析与挖掘、交互与合成、搜索与服务等一整套网络海量可视媒体智能处理理论与方法，支持网络可视媒体高效利用与智能服务、数字内容生成与服务产业等国家重大需求；同时，培养一批优秀的青年科技人员，形成一支具国际水平的研究队伍，为国家在相关领域的持续发展提供重要的技术支撑。 3.2五年目标五年内，在可视媒体智能处理的基础理论，关键技术和系统应用平台方面，取得有国际影响的研究成果，争取在以下六个方面取得进展和突破： 1）在人类视觉感知和认知计算模型研究上取得进展，提出符合认知行为的认知计算模型和面向可视媒体大规模计算的神经计算方法。 2）提出融合结构语义的可视媒体分析学习的新方法，在可视媒体信息的本征表达、高维数据空间到低维流形空间的映射模型等方面，提出一系列理论和方法，解决海量、复杂可视媒体的分析学习问题。 3）基于人类视觉认知先验，构建新的可视媒体视觉信息表达机制，提出融合运动特征和视觉显著特征的运动目标时空关联分析方法和基于上下文信息的跨视域可视媒体语义分析与信息整合机制，解决大范围场景可视媒体智能感知问题。 4）提出网络环境下的可视媒体安全新方法，包括可视媒体的质量评价、内容合成检测、源辨识方法等。 5）提出基于互联网数据集的可视媒体内容生成与呈现方法，包括面向内容生成的海量可视媒体分类与组织方法，提出非精确标注与交互的分析与匹配方法，以及基于语义的可视媒体一致性编辑与融合算法等。 6）提出复杂网络环境下海量可视媒体信息的有效搜索和个性化推荐服务机制，包括基于统计流形学习的概念建模与检索，结合网络环境下的多模态信息和用户群体智能的可视媒体多模态关联挖掘方法。以上成果，预期发表百篇以上有重要影响的国际学术期刊和会议论文；其中，在ACM SIGGRAPH，IEEE International Conference on Computer Vision等最高水平的国际会议和ACM Transactions on Graphics，International Journal of Computer Vision，IEEE Transactions on Pattern Analysis and Machine Intelligence等顶尖国际刊物上发表重要论文30篇以上，授权发明专利30项，在国际上产生较大的影响。在优秀人才培养等方面，争取培养一批优秀的博士生，获得全国百篇优秀博士论文、中国计算机学会优秀博士论文奖和国际学术会议优秀论文奖3名以上。参加项目的青年学术骨干中，培养一批优秀的学术带头人，其中教育部长江学者特聘教授、国家杰出青年科学基金获得者或中科院“百人计划”获得者等3人以上。三、研究方案本项目研究符合网络海量可视媒体智能处理的理论与方法，按照从重大需求归纳科学问题和关键技术问题，从知识创新（理论研究）到技术创新（技术突破）的思路，分解六个课题，通过严格的组织管理、课题间密切的交流协作、以及高水平的国际合作，争取获得有重要影响的成果。 4.1 学术思路本项目研究思路是针对互联网信息高效利用与智能服务、面向三网融合的数字内容产业和泛在网络视觉智能感知等国家重大需求，归纳为可视媒体认知的可计算性、可视媒体高效表达的结构分析与学习机理、多源异构网络可视媒体的归一化表示的三个关键科学问题。总体学术思路为： ① 按照认知机理、认知计算模型、神经网络计算三个层次，借鉴人类视觉认知机理，面向海量可视媒体信息，探索高层视觉特性与底层可视媒体刻画特征的关联关系，构建基于认知行为的计算模型和基于生物感知与人类认知的神经计算模型，以高效信息处理和减小认知负荷为目标，提供认知计算模型和模拟生物视觉感知信息处理的神经计算工具。 ② 以结构分析为主线，以几何与函数分析方法作为数学工具，从数学理论基础、分析学习方法、交互合成关键技术三个层面开展研究。探索流形结构与学习算法本质的数学描述，提出融合高层结构语义分析的可视媒体机器学习理论与分析方法，研究可视媒体认知原型的可视交互、语义匹配与一致性合成，解决可视媒体符合视觉感知的高效构建问题。 ③ 以语义分析为主线，研究可视媒体信息的视觉结构语义分析与动态时空关联分析，实现可视媒体信息的纵向语义分析与挖掘，探索基于多模态信息融合的视觉关联与语义关联之间的转化机制和知识