- 25
- 0
- 约 8页
- 2017-09-04 发布于重庆
- 举报
基于数据驱动的多实例学习弱监督关系抽取*
刘洋,刘树林,张元哲,刘康,周光有,赵军
中国科学院自动化研究所,模式识别国家重点实验室,北京,100190
E-mail: yang.liu@
摘 要:弱监督关系抽取由于其通过知识库自动获取大量的训练数据,受到了研究领域的广泛关注。但通
过这种方式产生的训练数据往往包含大量噪声,极大的影响了抽取性能。本文从模型和特征权重计算两个
方面来解决这个问题:首先我们使用两种多实例学习手段对含噪的训练数据建模(基于特征的多实例逻辑
斯特回归和基于实例的多实例逻辑斯特回归);然后我们利用特征在数据中的分布来计算特征权重,通过
这种方式来减少噪声特征的权重。实验证明,多实例学习模型对Top k 的结果有很大提升,利用数据分布
计算特征权重的方式对召回率-准确率(PR )曲线提升效果明显。
关键词:弱监督;关系抽取;多实例学习
Weak Supervision Relation Extraction by a Data-driven
Method with Multi- instance Learning
Yang Liu, Shulin Liu,
您可能关注的文档
- 6kV·A逆变器滞环调制与单极性SPWM倍频调制的比较.doc
- 11晶体的特征.ppt
- 14地球运动的基本形式自转与公转.ppt
- 52两条直线的位置关系(二).doc
- 59系列浪涌保护器应用于超声波流量计的配置方案.pdf
- 890设施规划与物流系统设计.pdf
- 2009年欧洲高血压指南的进展.ppt
- 2011届高考地理一轮复习同步课时训练19:自然地理环境的.doc
- 2011年高中物理一轮精品复习学案:第二章_相互作用(2.3_受力分析、共点力平衡_).doc
- 2012年高考湖南语文卷试题分析.ppt
- 重庆市丰都县2022年人教版小升初考试数学试卷.docx
- 高中生物实验教学中分子生物学技术的创新应用课题报告教学研究课题报告.docx
- 2026年区块链技术安全风险与挑战分析报告.docx
- 2026年娱乐行业定价策略与市场分析.docx
- 广西科技大学《智能电网基础》2023-2024学年第二学期期末试卷.doc
- 2026年智能家居行业生态链构建与市场策略报告.docx
- 基于人工智能的初中物理实验个性化教学方案设计与实践研究教学研究课题报告.docx
- 重庆市丰都县2024年人教版小升初考试数学试卷 一、填空题.docx
- 2026年数字孪生矿山十年展望:安全开采与技术创新报告.docx
- 基于数字孪生的校园AI志愿者服务智能匹配系统系统验证方案设计课题报告教学研究课题报告.docx
原创力文档

文档评论(0)