- 1
- 0
- 约2.34万字
- 约 5页
- 2019-02-25 发布于天津
- 举报
优先出版 计 算 机 应 用 研 究 第33 卷
基于信息增益的Web 人物关系抽取*
a a* b b
黄卫春 ,徐 力 ,熊李艳 ,钟茂生
(华东交通大学 a.软件学院;b .信息工程学院,南昌 330013)
摘 要:针对人物关系抽取中的效率与准确性问题进行了研究,提出一种基于信息增益的轻量级 Web 人物社会关系提
取方法。它通过计算初始关系元组的关系描述词的信息增益值进而确定元组上下文位置并据此创建相应的关系抽取模
板,最后利用模板实现了 Web 的人物关系自动提取。针对中文语义上存在相似性的问题,引入了基于《同义词词林》
与基于《知网》的人物关系描述词扩展方法。对于某一句子内包含多个人物实体且存在多种人物关系的情况,提出了一
种基于模板上下文信息增益值模糊匹配的方法来抽取符合特定人物关系的人物实体。实验结果证明:该方法的平均准确
率为89.92%,平均召回率为84.64%。基于信息增益的Web 社交网络人物关系抽取方法能有效地完成实时语料中的关系
抽取任务。
关键词:关系抽取;信息增益;模板匹配;多分类;自然语言处理
中图分类号:TP391
Information gain-based method of people relation extraction on Web
a a* b b
Hung Weichun , Xu Li , Xiong Liyan , Zhong Maosheng
(a. School of Software, b. School of Information Engineering, East China Jiaotong University, Nanchang 330013)
Abstract: For the problem of accuracy and efficiency in the person relationship extraction. this paper presented a lightweight
Web people ’s social relations extraction method which based on the information gain . It calculated the information gain of
relationship description word that in the initial relationship tuple and then locates the tuple context. Moreover. it created a
corresponding template for the Web automatic relationship extraction. In view of the circumstance of the Chinese semantic
similarities. this paper introduced the method that people relationship description words extension that based to the “HowNet”
and “Chinese Thesaurus”. Sometimes one s
您可能关注的文档
最近下载
- xw公司员工薪酬管理存在的问题及对策研究.docx VIP
- 基于 HHGRACE 90nmBCD工艺LDO模块版图设计及验证.docx VIP
- 2025年移动图书馆第三届知识竞答挑战赛题库及答案(第七关).docx VIP
- 茶叶加工行业岗位职责及组织结构.docx VIP
- 糖尿病实验室检查及结果意义分析.ppt VIP
- 卵巢黄体破裂诊治中国专家共识(2024年版).pptx
- 华住酒店IT标准培训课件.pptx
- vivo如何强制恢复出厂设置方法总结.PDF VIP
- 食材检验程序方法.docx VIP
- 泉州信息工程学院《高等数学(3)》2025 - 2026学年第一学期期末试卷(A卷).docx VIP
原创力文档

文档评论(0)