一种基于对话关系的训练数据处理方法、装置及可读介质.pdfVIP

  • 2
  • 0
  • 约1.95万字
  • 约 17页
  • 2023-06-17 发布于四川
  • 举报

一种基于对话关系的训练数据处理方法、装置及可读介质.pdf

本发明公开了一种基于对话关系的训练数据处理方法、装置及可读介质,通过词典将第一数据集中的每段对话中的每一个语句进行过滤,并标记出不包含词典中任一词的待识别语句;将每段对话中待识别语句进行实体识别,将实体类别与定义的实体类别进行比对,根据对比结果对第一数据集中的每段对话中的待识别语句进行过滤得到第二数据集;统计第二数据集中的每段对话中的三元组数据的两个实体所在的语句在对话中的相对位置距离,结合临界距离对第二数据集中的三元组数据进行过滤,得到三元组数据集合;基于三元组数据集合对第二数据集中的对话进行

(19)国家知识产权局 (12)发明专利 (10)授权公告号 CN 113268577 B (45)授权公告日 2022.08.23 (21)申请号 202110624573.1 G06F 16/335 (2019.01)

文档评论(0)

1亿VIP精品文档

相关文档