基于数据驱动的多实例学习弱监督关系抽取.pdfVIP

  • 25
  • 0
  • 约 8页
  • 2017-09-04 发布于重庆
  • 举报

基于数据驱动的多实例学习弱监督关系抽取.pdf

基于数据驱动的多实例学习弱监督关系抽取* 刘洋,刘树林,张元哲,刘康,周光有,赵军 中国科学院自动化研究所,模式识别国家重点实验室,北京,100190 E-mail: yang.liu@ 摘 要:弱监督关系抽取由于其通过知识库自动获取大量的训练数据,受到了研究领域的广泛关注。但通 过这种方式产生的训练数据往往包含大量噪声,极大的影响了抽取性能。本文从模型和特征权重计算两个 方面来解决这个问题:首先我们使用两种多实例学习手段对含噪的训练数据建模(基于特征的多实例逻辑 斯特回归和基于实例的多实例逻辑斯特回归);然后我们利用特征在数据中的分布来计算特征权重,通过 这种方式来减少噪声特征的权重。实验证明,多实例学习模型对Top k 的结果有很大提升,利用数据分布 计算特征权重的方式对召回率-准确率(PR )曲线提升效果明显。 关键词:弱监督;关系抽取;多实例学习 Weak Supervision Relation Extraction by a Data-driven Method with Multi- instance Learning Yang Liu, Shulin Liu,

文档评论(0)

1亿VIP精品文档

相关文档