- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN111401081B(45)授权公告日2025.07.01
(21)申请号201811534845.3
(22)申请日2018.12.14
(65)同一申请的已公布的文献号申请公布号CN111401081A
(43)申请公布日2020.07.10
(73)专利权人波音公司
地址美国伊利诺斯州
专利权人中国科学院自动化研究所
(72)发明人张家俊周龙周玉宗成庆杨里
(74)专利代理机构北京康信知识产权代理有限
责任公司11240专利代理师梁丽超王红艳
(51)Int.CI.
GO6F40/58(2020.01)
GO6N3/02(2006.01)
(56)对比文件
CN107729329A,2018.02.23
CN108664632A,2018.10.16
审查员曹俊杰
权利要求书3页说明书18页附图8页
(54)发明名称
神经网络机器翻译方法、模型及模型形成方法
(57)摘要
CN111401081B本发明涉及神经网络机器翻译方法、模型及模型形成方法。形成神经网络机器翻译模型的方法包括:形成编码器,其包括第一多头注意力模型;形成解码器,其包括第二多头注意力模型和未来信息模型,未来信息模型表示当前预测单词和已经生成单词的第一注意力隐层表示和当前预测单词和未来可能的单词的第二注意力隐层表示的融合;通过编码器和解码器形成第一机器翻译模型;以及对第一机器翻译模型进行对源语言序列从左至右和从右至左的解码训练,以形成神经网络机器翻译模型,其中,第一多头注意力模型和未来信息模型为第二多头注意力模型提
CN111401081B
题。
H;
H;
融合Hhiscory
Matmul
Softmax
Mask
Scale
Matmul
V
Softmax
Mask
Scale
Matmul
Hfuiure
Matmul
CN111401081B权利要求书1/3页
2
1.一种形成神经网络机器翻译模型的方法,其特征在于,包括:
形成编码器,所述编码器包括第一多头注意力模型;
形成解码器,所述解码器包括第二多头注意力模型和未来信息模型,所述未来信息模型表示当前预测单词和已经生成单词的第一注意力隐层表示和当前预测单词和未来可能的单词的第二注意力隐层表示的融合;
通过所述编码器和所述解码器形成第一机器翻译模型;以及
对所述第一机器翻译模型进行对源语言序列从左至右和从右至左的解码训练,以形成所述神经网络机器翻译模型,
其中,所述第一多头注意力模型和所述未来信息模型为所述第二多头注意力模型提供输入,
其中,形成所述解码器包括形成所述未来信息模型,形成所述未来信息模型包括:
利用点积注意力机制计算当前预测单词和已经生成单词的第一注意力隐层表示:r=Attention◎,K,,其中,m?0表示第一注意力隐层表示,豆表示当前时刻的
隐层状态查询值,K表示历史的隐层状态键值,V表示历史的隐层状态实值,Attention()为点积注意力机制的数学函数表示;
利用点积注意力机制计算所述当前预测单词和未来可能的单词的第二注意力隐层表示:=Attention◎,K,V,其中,表示第二注意力隐层表示,K表示未来的隐
层状态键值,V表示未来的隐层状态实值;
将所述第一注意力隐层表示和所述第二注意力隐层表示融合以形成融合注意力隐层表示;
利用所述融合注意力隐层表示形成点积注意力模型;
对所述点积注意力模型设置线性变换模型,以通过线性变换将所述点积注意力模型的输入映射为多组预定维度的向量;
对所述点积注意力模型设置连接模型,以将所述向量经由所述点积注意力模型处理后所得的向量进行连接;以及
通过所述点积注意力模型、所述线性变换模型和所述连接模型形成所述未来信息模型。
2.根据权利要求1所述的方法,其特征在于,形成所述编码器包括形成所述第一多头注意力模型,其中,形成所述第一多头注意力模型包括:
利用点积注意力机制形成点积注意力模型;
对所述点积注意力模型设置线性变换模型,以通过线性变换将所述点积注意力模型的输入映射为多组预定维度的向量;
对所述点积注意力模型设置连接模型,以将所述向量经由所述点积注意力模型处理后所得的向量进行连接;以及
通过所述点积注
您可能关注的文档
- CN108697557B 吸收性物品及其制造方法 (大王制纸株式会社).docx
- CN109065553B 金属氧化物膜及金属氧化物膜的形成方法 (株式会社半导体能源研究所).docx
- CN109529811B 氧化铝载体、含氧化铝载体催化剂制备方法及催化剂应用 (湖南中伟新铂材料科技有限公司).docx
- CN110229367B 一种各向异性绝缘导热性片材及其制备方法 (深圳市鸿富诚新材料股份有限公司).docx
- CN110401782B 电话预约拨打方法及装置 (北京百度网讯科技有限公司).docx
- CN110625833B 一种用于晶硅的上下料单元及上下料方法 (青岛高测科技股份有限公司).docx
- CN110702764B 一种生物传感器的复合过滤膜及其制备方法 (上海硕创生物医药科技有限公司).docx
- CN110707850B 转子铁磁冲片、转子组件及其制造方法以及液冷泵 (合肥新沪新能源有限公司).docx
- CN110727563B 预设客户的云服务报警方法及装置 (北京百度网讯科技有限公司).docx
- CN110779616B 一种飞行试验声爆信号测量方法 (中国航空工业集团公司沈阳空气动力研究所).docx
- 2025年湖北省十堰中小学教师招聘考试真题及答案.docx
- 2025年湖北省国家公务员考录《行测》真题及参考答案[1].docx
- 2025年湖北省基层法律服务工作者资格历年真题及答案.docx
- 2025年湖北省公务员考试行测资料分析冲刺模拟试卷(含答案).docx
- 2025年湖北省公务员录用考试面试真题试卷(结构化小组).docx
- 2025年湖北省国家公务员考录《行测》真题及参考答案.docx
- 2025年湖北省公务员考试《行测》真题及答案.docx
- 2025年湖北省公开遴选公务员笔试题及答案解析(B类).docx
- 2025年安徽卫生健康职业学院单招职业适应性考试模拟测试卷最新.docx
- 2025年湖北省人力资源管理师岗位能力评估试卷.docx
最近下载
- 2021石油化工电气工程施工及验收规范.docx
- 化工热力学(通用型)(第二版)习题答案.pdf
- 2026年时事政治测试题库含答案(模拟题).docx VIP
- 标准图集-甘12S8-湿陷性黄土地室外给排水管道工程构筑物.pdf VIP
- 甘12S8 ---湿陷性黄土地室外给排水管道工程构筑物.docx VIP
- 基于abaqus的某地下综合管廊主体结构 受力性能和抗震性能分析-建筑与土木工程专业论文.docx VIP
- 《建筑工程冬期施工规程》JGJ@T104-2011.docx VIP
- 2023年景德镇学院公共课《马克思主义基本原理概论》期末试卷B(有答案).docx VIP
- 豌豆磨粉机械的设计与计算书.doc
- 2023年景德镇学院公共课《马克思主义基本原理概论》期末试卷A(有答案).docx VIP
原创力文档


文档评论(0)