- 38
- 0
- 约2.18万字
- 约 5页
- 2017-09-02 发布于天津
- 举报
基于语义角色标注的新闻领域复述句识别方法 - 模式识别国家重点实验室
基于语义角色标注的新闻领域复述句识别方法
吴晓锋,宗成庆
(中国科学院自动化研究所 模式识别国家重点实验室,北京 100190)
摘 要:复述(Paraphrase)句的识别可看作文本蕴含(Text Entailment)识别的一个子问题,传统的解决方法是通过词频或句法上的相似度来判
断。可是哪怕用相同的文字书写的句子其含义也可能差别很大,而相同句法结构也不能保证意义一致。本文根据新闻语料的特点,提出了一种通过
引入深层的语义角色标注来帮助识别新闻领域复述句的方法。该方法通过在语义角色这种结构化的含义表达形式中提取的特征来弥补传统方法的不
足:先识别待判断的两个句子中所有谓词的语义角色,然后计算两个句子间对应语义角色的相似度,最后结合传统的句子相似度计算方法来进行相
似性计算。实验证明,本文提出的方法能有效地提高复述语句的识别效果。
关键词:复述识别;语义角色标注;自然语言处理
中图分类号:TP391 文献标识码: A
An Approach to News Paraphrase Recognition Based on SRL
Xiaofeng Wu, Chengqing Zong
(National Lab of Pattern Recognition, Institute of Automation, CAS, Beijing 100190, China)
Abstract: Paraphrase Recognition can be regarded as a sub-problem of Text Entailment Recognition. This problem is hard in that simply using term fre-
quency or syntax information is prone to error judgment. For even the same pack of words can cook up sentences with totally different meanings, while simi-
lar parsing trees can either have different meanings. In this paper we present a new approach based on Semantic Role Labeling (SRL) to identify paraphrase.
In our approach, we first label sentences with semantic role, then we get features that can partly represent the meaning of the sentence. By doing so, we also
take the specialty of News sentences under consideration. Our experiment proved the effectiveness of our approach.
Key words: natural language processing, semantic role labeling, paraphrase recognition
1 引言 了如下方法:采用经过语义角色标注后的信息为特征,然后通过机器
学习算法来识别复述句。虽然文献[9]也曾通过语义角色标注来识别复
从某种意义上讲,复述(Paraphrase )可以看作文本蕴含(Text
述句,但本文将从一个新的角度来获取特征,并考虑了新闻语句本身的
Entailment )的一个子问题。对于两个语言片段(短语、句子或篇章)
您可能关注的文档
最近下载
- 2023年江苏省常州市中考语文试卷附参考答案.pdf VIP
- 四川专升本数学2025年真题 及答案 .pdf VIP
- 2026年寒假特色作业模板【可编辑 可打印】.pptx
- 任务一短期投资的核算.ppt VIP
- 生物必修二全套课件.ppt VIP
- 2023年江苏省常州市中考语文试卷.docx VIP
- 2025年江苏高考地理真题(解析版).docx
- 2026年教案课件-中华民族共同体概论-第1-9讲-混一南北与中华民族大统合-教案合集-新版.pdf VIP
- 新解读《GB_T 39329-2020增材制造 测试方法 标准测试件精度检验》.docx VIP
- 医疗器械部门职责与岗位划分指南.docx VIP
原创力文档

文档评论(0)