一种面向中文反讽文本的夸张表征词提取方法.pdfVIP

下载本文档

2
0
约1.17万字
约 12页
2023-11-15 发布于四川
举报

一种面向中文反讽文本的夸张表征词提取方法.pdf

本发明公开了一种面向中文反讽文本的夸张表征词提取方法，属于自然语言处理技术，包括以下步骤：步骤1：对反讽数据集进行预处理后，采用双向最大匹配法分词；步骤2：利用TF‑IDF对分词后的文本计算词频构建候选词集；步骤3：采用卡方统计衡量反讽文本与夸张表征之间的关联程度，并通过卡方检验方法设置最佳阈值来选取强关联夸张表征词，以此构建夸张表征种子词集；步骤4：基于WoBERT语义相似度计算框架，计算反讽文本与种子词集的动态词向量语义相似度，并设置阈值来选取相似度高的夸张表征词，以此构建夸张表征词集。本发

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 117056463 A (43)申请公布日 2023.11.14 (21)申请号 202311024896.2 (22)申请日 2023.08.12 (71)申请人安徽理工大学地址 232000

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

一种面向中文反讽文本的夸张表征词提取方法.pdfVIP

一种面向中文反讽文本的夸张表征词提取方法.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档