自然语言文本中不确定性信息的自动识别① - 计算机系统应用.pdf

自然语言文本中不确定性信息的自动识别① - 计算机系统应用.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
自然语言文本中不确定性信息的自动识别① - 计算机系统应用

2015 年 第 24 卷 第 2 期 计 算 机 系 统 应 用 ① 自然语言文本中不确定性信息的自动识别 杨文敏, 李保利 (河南工业大学 信息科学与工程学院, 郑州 450001) 摘 要: 自然语言中存在大量不确定的表述, 针对此类信息的检测任务是信息抽取领域的研究热点之一, 然而, 面向中文的不确定信息检测研究仍然比较匮乏, 利用支持向量机(Support Vector Machine, SVM)能够很好的解决 非线性、高维数、局部小样本等实际问题的优势, 将中文不确定性信息识别问题转化为分类问题, 通过在复旦大 学发布的中文不确定性检测数据集语料上的实验, 验证了本文提出的基于 SVM 的中文不确性信息检测方法的有 效性, 相比于句子评分模型, 我们的系统取得了更好的召回率. 关键词: 不确定性信息检测; 支持向量机; 语料; 分类 Automatic Identification of Uncertainty Information in Natural Language YANG Wen-Min, LI Bao-Li (Henan University of Technology, College of Information Science and Engineering, Zhengzhou 450001, China) Abstract: There are a lot of uncertainty information in natural Language. It is becoming a focus of researches in NLP recently. However, the research on Chinese is still scarce. In this paper, we use SVM, which is a good solution to the high dimension, nonlinear and local small sample, to identify Chinese uncertainty information recognition as a question of classification. We carry experiment on Chinese uncertainty corpus published by Fudan University, which confirms the availability exposed by our paper based on SVM. Compared to the sentence scoring model, our system has better recall rate. Key words: uncertainty information detection; SVM; corpus; classification 1 引言 信息指事物类属边界或性质状态不明确, 是对事物性 信息抽取是直接从自然语言文本中抽取事实信息, [1] 质状态模糊认识的反映 . 然而在自然语言中常常混杂有猜测性的、不确定性的 例句 1: 明天可能会下雨. 信息. 如果不加甄别或者不能准确识别一个自然语言 例句2: 如果发现问题比较严重和复杂, 时间会相 句子表达的是不确定性的信息还是确定无疑的事实, 应延长. 那么由于抽取出的信息的不确定性而导致的误报率的 例句 3: 珠穆朗玛峰是世界最高峰. 上升, 必然会使信息抽取系统的准确率大大降低. 然

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档