- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本申请涉及文本数据增强技术领域,提供一种中文错别字纠正数据增强方法、装置、设备及介质,方法包括:获取待处理句子;为句子的每一个汉字赋予一个ID,得到ID列表;对待处理句子进行命名实体识别,将识别到的实体对应的ID加入到实体列表;将ID列表中的ID打乱;从重新排序后的ID列表中选择第一个ID作为待比对ID;判断待比对ID是否在实体列表中;若在,不对待比对ID对应的汉字进行处理;若不在,利用汉字混淆集和语言模型对待比对ID对应的汉字进行替换处理;将下一个ID作为待比对ID,返回判断待比对ID是否在实
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN117313710A
(43)申请公布日2023.12.29
(21)申请号202210709018.3G06F40/216(2020.01)
您可能关注的文档
最近下载
- 2022-2023学年二年级语文上册期末乐考 非纸笔测试题(四) 部编版(含答案).docx VIP
- 2025年秋期人教版六年级上册数学全册核心素养教案(教学反思有内容+二次备课版).pdf
- 23DX001建筑电气工程设计常用图形和文字符号- 2.1.5 下.pdf VIP
- 2022-2023学年二年级语文上册期末乐考 非纸笔测试题(一) 部编版.docx VIP
- 七年级上册地理知识点.doc VIP
- 22K505医院洁净用房通风空调设计与安装.docx VIP
- 嵌入式软件工程师招聘条件.pdf VIP
- 高级英语(第四版)1_教学课件Lesson 11 Speech on Hitler’s Invasion of the U.S.S.R..ppt VIP
- 《大学生就业指导》PPT课件ppt.pptx VIP
- 2022-2023学年二年级语文上册期末乐考+非纸笔测试题(二)+部编版.docx VIP
原创力文档


文档评论(0)