一种面向中文反讽文本的夸张表征词提取方法.pdfVIP

  • 2
  • 0
  • 约1.17万字
  • 约 12页
  • 2023-11-15 发布于四川
  • 举报

一种面向中文反讽文本的夸张表征词提取方法.pdf

本发明公开了一种面向中文反讽文本的夸张表征词提取方法,属于自然语言处理技术,包括以下步骤:步骤1:对反讽数据集进行预处理后,采用双向最大匹配法分词;步骤2:利用TF‑IDF对分词后的文本计算词频构建候选词集;步骤3:采用卡方统计衡量反讽文本与夸张表征之间的关联程度,并通过卡方检验方法设置最佳阈值来选取强关联夸张表征词,以此构建夸张表征种子词集;步骤4:基于WoBERT语义相似度计算框架,计算反讽文本与种子词集的动态词向量语义相似度,并设置阈值来选取相似度高的夸张表征词,以此构建夸张表征词集。本发

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117056463 A (43)申请公布日 2023.11.14 (21)申请号 202311024896.2 (22)申请日 2023.08.12 (71)申请人 安徽理工大学 地址 232000

文档评论(0)

1亿VIP精品文档

相关文档