- 2
- 0
- 约1.17万字
- 约 12页
- 2023-11-15 发布于四川
- 举报
本发明公开了一种面向中文反讽文本的夸张表征词提取方法,属于自然语言处理技术,包括以下步骤:步骤1:对反讽数据集进行预处理后,采用双向最大匹配法分词;步骤2:利用TF‑IDF对分词后的文本计算词频构建候选词集;步骤3:采用卡方统计衡量反讽文本与夸张表征之间的关联程度,并通过卡方检验方法设置最佳阈值来选取强关联夸张表征词,以此构建夸张表征种子词集;步骤4:基于WoBERT语义相似度计算框架,计算反讽文本与种子词集的动态词向量语义相似度,并设置阈值来选取相似度高的夸张表征词,以此构建夸张表征词集。本发
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 117056463 A
(43)申请公布日 2023.11.14
(21)申请号 202311024896.2
(22)申请日 2023.08.12
(71)申请人 安徽理工大学
地址 232000
原创力文档

文档评论(0)