- 1
- 0
- 约2.57万字
- 约 24页
- 2023-06-03 发布于四川
- 举报
本发明涉及人工智能技术领域,提供一种语言模型训练、视频字幕校验方法、装置、设备及介质。该语言模型训练方法通过将文字样本集中仅包含中文字符的样本句子输入含有初始参数的初始拆字预训练模型中,对样本句子依次进行分词处理、部首拆分、粒度拆分以及解码识别,得到样本解码句子;根据样本解码句子与仅包含中文字符的样本句子,确定文本损失值;在文本损失值未达到预设的收敛条件时,更新迭代初始参数,直至文本损失值达到预设的收敛条件时,将收敛之后的初始拆字预训练模型记录为基于拆字的中文预训练语言模型。本发明还涉及区块链技
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112652295 A
(43)申请公布日 2021.04.13
(21)申请号 202011529805.7
(22)申请日 2020.12.22
(71)申请人 平安
原创力文档

文档评论(0)