- 31
- 0
- 约10.3万字
- 约 63页
- 2020-09-09 发布于江苏
- 举报
重庆大学硕士学位论文 中文摘要
摘 要
在拥有浩如烟海般信息的时代,如何从大量碎片化的文本数据中获取人们需
要的有价值的信息成为一个巨大的挑战。事件抽取技术能够有效地挖掘与提炼文
本信息,以便让用户快速准确地得到所需,因此逐渐成为自然语言处理领域的研
究热点。然而,文本数据存在维度高、歧义多的特点,传统的方法将事件抽取划
分为触发词识别与事件元素分类两个任务,在这个过程中需要人工分析并选择大
量的特征,过于依赖自然语言处理工具导致模型无法大规模应用,存在错误级联
传播、特征工程繁杂的问题。因此,本文针对错误级联传播与繁杂的人工特征工
程问题,以模式识别、深度学习为研究基础,从迁移学习的角度出发,结合当前
事件抽取的研究趋势,分别对嵌入特征的高效表示、多个嵌入特征的有效联合两
个方面进行研究,通过表示和集成词嵌入、触发词嵌入、距离嵌入等低维稠密的
向量特征,深度挖掘文本内隐藏的高层次信息,最终提升事件抽取模型的性能。
为此,本文研究工作及创新点主要包含以下内容。
针对繁杂的特征工程问题,分析事件抽取任务分阶段完成的原因,论文提出
了一种基于多神经网络融合的触发词识别模型。为获取触发词的嵌入特征表示,
论文将触发词识别建模为序列标注问题,基于双向长短时记忆网络和前向神经网
络的融合模型完成任务,其中引入了词嵌入表示、实体类型嵌入、依存关系嵌入
以及词性嵌入四类局部特征,并结合全局上下文的语义信息。实验表明,本文提
出的方法结合局部与全局信息,可以有效提升事件触发词的识别效果。
针对误差级联传播问题,研究了嵌入特征的正则化迁移方法,论文提出了一
种基于联合嵌入特征的事件抽取模型。通过迁移触发词嵌入表示并联合位置特征
与词嵌入,借助联合嵌入特征的丰富信息,深度挖掘潜藏在事件元素与事件触发
词之间的内部联系。同时为了能够达到多事件抽取的效果,将触发词与事件描述
一一对应,通过将事件元素语义角色分类任务建模为(触发词,事件元素)的关
系分类问题,能够有效改善该问题。实验证明,本文提出的模型能够有效地迁移
已有的触发词信息并提升事件抽取的效果。
最后,论文在ACE 、CEC 数据集两个典型的事件抽取数据集上,对本文所提
出的方法进行评测,并与同类的流行方法进行对比分析证明了本文提出方法的有
效性。更深入地,本文对比模型中各类嵌入特征的特性及收益,表明了联合嵌入
特征方法的优越性。
关键词:事件抽取,自然语言处理,错误级联,特征工程,嵌入表示
I
重庆大学硕士学位论文 英文摘要
Abstract
In the era of Internet with vast information, how to obtain valuable information
that people need from a large amount of fragmented text data has become a huge
challenge. Event extraction technology can effectively mine and refine text information
so that users can get what they need quickly and accurately, then it has gradually
become a research hotspot in the field of natural language processing. However, text
data has high dimensionality and high ambiguity. Traditional methods based on feature
e
您可能关注的文档
最近下载
- 2024-2030年阿尔茨海默病(AD)诊断和治疗市场调研及前景预测报告.docx VIP
- 中国医疗器械行业蓝皮书2025版.docx VIP
- 宏观经济学教案(高鸿业).doc VIP
- 销售公司廉洁培训课件.ppt
- 建筑工程技术创新方案(3篇).docx
- CATIAV5对象模型解析:VB二次开发教程.pdf VIP
- 天津市南开区2025-2026学年八年级上学期期末数学试卷(含答案).pdf VIP
- 华东师大版八年级下第8课历史转折与改革开放的起步课件(共31张PPT).ppt VIP
- 护理查房1例心肌梗死合并心力衰竭护理查房.pptx VIP
- 2025年人教版八年级历史 下册 第三单元 第9课 对外开放 课件(共49张PPT).pptx VIP
原创力文档

文档评论(0)