基于Bert的语言模型的训练方法及装置[发明专利].pdf

下载文档

0
0
约2.15万字
约 17页
2023-05-15 发布于广西
举报
版权申诉
保障服务

基于Bert的语言模型的训练方法及装置[发明专利].pdf

1、本文档共17页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111291166 A (43)申请公布日 2020.06.16 (21)申请号 202010384255.8 G06K 9/62(2006.01) G06N 3/04(2006.01) (22)申请日 2020.05.09 G06N 3/08(2006.01) (71)申请人支付宝（杭州）信息技术有限公司地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-11 (72)发明人刘佳　 (74)专利代理机构北京亿腾知识产权代理事务所(普通合伙) 11309 代理人陈婧玥　周良玉 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) 权利要求书3页说明书10页附图3页 (54)发明名称基于Bert的语言模型的训练方法及装置 (57)摘要本说明书实施例提供一种基于Bert的语言模型的训练方法，该方法中包括：首先，获取历史会话样本，其中包括某次业务会话产生的多条对话语句和对应的类别标签，该类别标签指示通过该某次业务会话是否达到业务目的；接着，基于上述多条对话语句，确定语义符号序列，并将该语义符号序列输入所述语言模型中，得到整体语义向量；然后，将该整体语义向量输入业务会话分类模型中，得到预测分类结果；最后，基于该预测分类结果和上述类别标签，调整上述业务会话分类模型和语言模型的模型参数。如此，通过将判断多轮对话的目的是否达成为训练任务，可以 A 提高训练出的语言模型对多轮对话的语义理解 6 深度和广度。 6 1 1 9 2 1 1 1 N C CN 111291166 A 权　利　要　求　书 1/3页 1.一种基于Bert的语言模型的训练方法，包括：获取历史会话样本，其中包括某次业务会话产生的多条对话语句和对应的类别标签，该类别标签指示通过该某次业务会话是否达到业务目的；基于所述多条对话语句，确定语义符号序列；将所述语义符号序列输入所述语言模型中，得到整体语义向量；将所述整体语义向量输入业务会话分类模型中，得到预测分类结果；基于所述预测分类结果和所述类别标签，调整业务会话分类模型和所述语言模型的模型参数。 2.根据权利要求1所述的方法，其中，所述某次业务会话的会话角色包括业务方和用户，所述获取历史会话样本，包括：获取所述多条对话语句，以及获取所述用户在所述某次业务会话之后的业务行为数据；基于预设规则，根据所述业务行为数据确定所述类别标签；基于所述多条对话语句和类别标签，构建所述历史会话样本。 3.根据权利要求1所述的方法，其中，基于所述多条对话语句，确定语义符号序列，包括：通过在首条对话语句之前添加预定起始符号，以及确定每条对话语句对应的若干语义单元符号，得到所述语义符号序列；其中语义单元符号为对话语句中的字或词。 4.根据权利要求3所述的方法，其中，得到所述语义符号序列，还