- 249
- 0
- 约6.52千字
- 约 6页
- 2017-06-07 发布于安徽
- 举报
基于深度学习的关系抽取
作者:林衍凯、刘知远(清华大学)
【引言】
信息抽取旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息。
关系抽取是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之
间的语义关系。例如,句子“Bill Gates is the founder of Microsoft Inc. ”中包含一
个实体对(Bill Gates, Microsoft Inc.) ,这两个实体对之间的关系为Founder 。
现有主流的关系抽取技术分为有监督的学习方法、半监督的学习方法和无监
督的学习方法三种:
1、有监督的学习方法将关系抽取任务当做分类问题,根据训练数据设计有
效的特征,从而学习各种分类模型,然后使用训练好的分类器预测关系。该方法
的问题在于需要大量的人工标注训练语料,而语料标注工作通常非常耗时耗力。
2 、半监督的学习方法主要采用Bootstrapping 进行关系抽取。对于要抽取的
关系,该方法首先手工设定若干种子实例,然后迭代地从数据从抽取关系对应的
关系模板和更多的实例。
3、无监督的学习方法假设拥有相同语义关系的实体对拥有相似的上下文信
息。因此可以利用每个实体对对应上下文信息来代表该实体对的语义关系,并对
所有实体对的
原创力文档

文档评论(0)