一种文本识别脱敏方法及其系统.pdfVIP

  • 3
  • 0
  • 约1.05万字
  • 约 9页
  • 2023-05-05 发布于四川
  • 举报
本发明公开了一种文本识别脱敏方法及其系统,该方法包括:获取待识别文本,将待识别文本拆分为多个句子,再将句子分词为多个字词;将待识别文本的每个字词转换为对应的向量;将向量输入至Bert模型,Bert模型将向量转换为词表示向量,并对词表示向量进行分类标注;将标注后的词表示向量输入条件随机场,条件随机场基于标注之间的关联依赖关系进行计算,得到全局最优标注序列;对标注为敏感实体的字词进行脱敏操作。本发明能够做到并发执行,同时提取字词在句子中的关系特征,进而更全面反映句子语义,又能根据句子上下文获取词义,

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114298035 A (43)申请公布日 2022.04.08 (21)申请号 202111640408.1 G06F 21/62 (2013.01)

文档评论(0)

1亿VIP精品文档

相关文档