- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
MMS播放器:一个用于手语角色参数化数据驱动动画的开源
软件
FabrizioNunnari,ShaileshMishra,PatrickGebhard
fabrizio.nunnari@dfki.de,mshailesh2018@,patrick.gebhard@dfki.de
GermanResearchCenterforArtificialIntelligence(DFKI)
本
译摘要器翻译挑战赛的结果[1,2])。
中在本文/演示中,我们专注于SL合成(文本到动
本文描述了MMS-Player,这是一款开源软件,画)使用过程动画化身(3D虚拟角色)。
1
v能够从一种名为MMS(多模态手语流)的新手语表特别是,我们提出了两个主要贡献。首先(第
3示格式中合成手语动画。MMS通过添加关于手势3节),我们描述了MMS(多模态手势流)的当前
6
4并行执行、定时和曲折的信息来增强基于词汇的手版本:一种SL机器可读表示形式,它在手语序列概
6势表示。该实现由用于流行的Blender3D创作工具念的基础上增加了关于手势并行化、时间以及动作
1
7.的Python脚本组成,可以通过命令行或HTTPAPI抑扬顿挫的额外信息。其次(第4节),我们展示了
0调用。动画可以渲染为视频,也可以导出到其他流“MMS实现者”的完整工作软件架构,即一个能够以
5行三维动画交换格式中。该软件在https://github.MMS实例作为输入,并基于3D虚拟角色生成SL动
2
:com/DFKI-SignLanguage/MMS-Player下以GPL-3.0画的软件。该系统还已由一组本土聋哑人和翻译人员
v
i许可证免费提供。进行了初步评估(第5节)。
x
r
a
关键词MMS的定义源于表达机器可读格式的手语的需
求,这种格式可以作为文本到MMS(反之亦然)自
手语,合成,角色动画,屈折变化,MMS,多模
动翻译系统的对象。大多数现有的工作依赖于“词汇
态手语流。
序列”,即一系列意义与所观察到对应手语相近的词。
然而,仅靠词汇是不够的。SLs表现出复杂的现象,
1介绍如多个手势的同时执行、执行速度的调节、停顿以及
“屈折变化”,即根据表达信息的上下文对手势执行进
手语(SL)是全球约7000万人的母语沟通语言,行调整。例如,一个手势可以扩展或收缩来表示形容
分布在全球超过300种不同的手语[18]中。尽管在该词大的和小;手势必须在手语空间中重新定位;躯干
领域进行了20多年的研究,口语/书面语与手语之间需要旋转并倾斜以实现角色扮演。
的自动翻译仍处于初级阶段(例如,请参阅最近的机为了满足“参数化”手势的需求,一些系统依赖
1
图1:由于其曲折能力,MMS-Player可以从现有的标志中实现新的情境化标志。左侧:索引标志的引用形
式;独立旋转躯干、手臂和手以指示左边的东西;并将躯干朝左但指向右边。右侧:Nicht
您可能关注的文档
- 术前规划中的语义分割在经导管主动脉瓣置换中的应用-计算机科学-机器学习-语义分割-手术规划.pdf
- 替代损失函数在 Transformer 模型评估中的应用-计算机科学-深度学习-神经网络-算法投资策略.pdf
- 具有知识图谱的代理 RAG 用于现实世界应用中的复杂多跳推理-计算机科学-人工智能-检索增强生成-推理.pdf
- ACT:通过合成数据生成及自适应训练弥合代码翻译差距-计算机科学-软件开发-代码翻译-自动训练框架.pdf
- 自适应贝叶斯单次量子传感-计算机科学-机器学习-量子传感-量子信道.pdf
- 通过补丁级图聚类和混合密度专家从整张幻灯片图像进行生存建模-计算机科学-深度学习-注意力机制-组织病理学.pdf
- 一种在大型语言模型(LLM)驱动的应用程序环境中衡量自动语音识别(ASR)模型性能的方法-计算机科学-机器学习-自动语音识别-人机交互.pdf
- 探索大型语言模型在分析和改进科学代码中的方法名称方面的应用-计算机科学- AI自动化-程序理解-大语言模型.pdf
- 具有噪声伪标签学习的鲁棒半监督医学图像分割使用扩散模型-计算机科学-半监督学习-扩散模型-医学图像分割.pdf
- 改进高度不平衡数据上的预测 使用开源合成数据过采样附和-计算机科学-预测建模-人工智能-合成数据.pdf
- 2025至2030中国婴儿拉式蚊帐行业发展现状及发展趋势与投资风险报告.docx
- 2025至2030中国半导体陶瓷靶行业项目调研及市场前景预测评估报告.docx
- 2025至2030中国果汁行业供需趋势及投资风险报告.docx
- 2025至2030中国双节距滚子链行业项目调研及市场前景预测评估报告.docx
- 2025至2030全球及中国电子电气中的cPDM行业项目调研及市场前景预测评估报告.docx
- 2025至2030工业风幕行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至20305G技术行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030钛合金行业产业运行态势及投资规划深度研究报告.docx
- 2025至2030中国冶金工程施工总承包行业运营态势与投资前景调查研究报告.docx
- 2025至2030铁路IT支出行业产业运行态势及投资规划深度研究报告.docx
最近下载
- 2024年中国零售商调查报告—全球化视角之海外门店拓展.pdf VIP
- 八大特殊作业(八大危险作业)安全管理知识与规范培训(PPT132页).pptx VIP
- 银行会计岗位招聘笔试题(某大型集团公司)试题集解析.docx VIP
- 磅房计量考试试题及答案.doc VIP
- 绿化养护标准及收费办法.docx VIP
- 儿童闭塞性细支气管炎的诊断和治疗(2023版)专家共识解读课件.pptx VIP
- CTX-M耐药基因流行病学调查及耐药机制研究.pdf
- 中国共产党纪律处分条例测试题附答案+考试注意事项.doc VIP
- 财务会计与税务会计差异及协调探讨.doc VIP
- (高清版)DG∕TJ 08-2410-2022 文物和优秀历史建筑消防技术标准.docx VIP
文档评论(0)