- 2
- 0
- 约2.4万字
- 约 6页
- 2018-04-07 发布于北京
- 举报
第11期 电 子 学 报 V01.35No.11
2007年11月 A(m~ELECIRONICASINICA No’r.200r7
基于网络挖掘的实体关系元组自动获取
李维刚,刘 挺,李 生
(哈尔滨工业大学计算机学院信息检索研究室,黑龙江哈尔滨150001)
摘要:二元实体关系元组可以应用到知识库构建,数据挖掘,模式抽取等多个领域.本文利用特定关系的一个
元组和一个关键词作为种子,结合多种自然语言处理底层技术,采取改进的模式获取方法和自举迭代策略,提出了一
种新的从Web上抽取实体关系元组的方法.基准方法的平均准确率达到了78.12%,采用过滤措施后抽取方法的平均
准确率达到了98.42%.实验结果表明,利用网络挖掘方法获取的实体关系元组能够很好满足信息抽取的应用,对抽取
出的元组进一步处理,能够获取更多有价值的信息.
关键词: 自举方法;实体关系;元组;信息抽取;网络挖掘
中图
原创力文档

文档评论(0)