基于标签传播和主动学习的人物社会关系抽取-计算机工程.PDF

基于标签传播和主动学习的人物社会关系抽取-计算机工程.PDF

基于标签传播和主动学习的人物社会关系抽取-计算机工程

第 卷 第 期 计 算 机 工 程 年 月 人工智能及识别技术 文章编号 文献标志码 中图分类号 基于标签传播和主动学习的人物社会关系抽取 刘锦文许静张利萍芮伟康 中国科学技术大学 计算机科学与技术学院合肥 摘 要 基于标签传播的半监督学习算法能够提升少量标注数据下的关系抽取效果但是随机选择训练样本会使 关系抽取性能降低 为了从海量的网络信息中提取出可靠性较高的人物关系将标签传播算法与主动学习相结合 用于人物关系抽取 在训练数据获取中主动选择不确定性最大的样本进行标注 在人物关系上的实验结果显 示主动学习方法的引入可使平均 值比标签传播算法提升 关键词 人物社会关系 特征提取 标签传播 主动学习 关系抽取 半监督学习 中文引用格式刘锦文许 静张利萍等基于标签传播和主动学习的人物社会关系抽取计算机工程 英文引用格式 友马云 关系抽取方法应该抽取出三元组 王峻 概述 涛朋友马云 表示句子中人物间的关系 这些 互联网上的信息以结构化或半结构化的形式存 关系三元组可以用于构建大规模高质量的知识库 在但是结构化信息的数量较少将非结构化信息转 并可以应用于问答系统方便用户快速找到需要的 化为结构化信息的过程被称为信息提取 人物关系 信息 提取是信息提取的任务之一在各个领域的知识网 目前的研究在信息提取方面取得了重大的成 络中都有人物角色的参与因此人物关系抽取是构 就但是专门针对人物关系抽取的研究还相对较少 建大规模网络知识不可或缺的环节 人物关系抽取 因此本文提出一种基于机器学习的人物关系抽取算 能够将互联网上海量的无结构文本转化为结构化的 法 机器学习的方法 目前广泛用于关系抽取研究 人物关系三元组 例如给出一个句子 王峻涛的朋 中 例如文献 使用基于特征的 和支持 基金项目国家自然科学基金 作者简介刘锦文 女硕士研究生主研方向为文本数据挖掘 自然语言处理许 静博士研究生张利萍芮伟康硕士研 究生 收稿日期 修回日期

文档评论(0)

1亿VIP精品文档

相关文档