文本类数据大规模分类标注方法、系统、装置及存储介质.pdfVIP

  • 12
  • 0
  • 约1.3万字
  • 约 14页
  • 2023-05-30 发布于四川
  • 举报

文本类数据大规模分类标注方法、系统、装置及存储介质.pdf

本发明公开了一种文本类数据大规模分类标注方法、系统、装置及存储介质,该方法包括从待标注语料中筛选具有代表性的语料作为典型语料;对典型语料进行分析,提取关键特征;根据关键特征,提取分类对应的匹配规则和特征词,对匹配规则和特征词进行验证;将验证通过的匹配规则保存至规则库,将验证通过的特征词保存至特征词库;根据规则库和特征词库,对文本类数据进行大规模机器分类标注;对大规模机器分类标注的标注效果进行核验;输出核验合格的标注数据。本发明能够提取得到准确率较高的规则和特征词;能够提升大规模机器分类标注的质量

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112445897 A (43)申请公布日 2021.03.05 (21)申请号 202110120553.0 (22)申请日 2021.01.28 (71)申请人 京华信息科技股份有限公司

文档评论(0)

1亿VIP精品文档

相关文档