面向非结构化文本的开放式实体属性抽取.pdfVIP

  • 106
  • 0
  • 约1.71万字
  • 约 6页
  • 2017-09-18 发布于浙江
  • 举报

面向非结构化文本的开放式实体属性抽取.pdf

第37卷 第3期 江西师范大学学报 (自然科学版) V0l-37No.3 2013年 5月 JournalofJiangxiNormalUniversity(NaturalScience) Mav2013 文章编号:1000-5862(2013)03-0279-05 面 向非结构化文本的开放式实体属性抽取 曾道建,来斯惟,张元哲,刘 康,赵 军 (中国科学院自动化所模式识别国家重点实验室,北京 100190) 摘要 :从非结构化文本中抽取给定实体的属性及属性值,将属性抽取看作是一个序列标注问题.为避免 人工标注训练语料,充分利用百度百科信息框 (Infobox)已有的结构化内容 ,对非结构化文本 回标 自动产 生训练数据.在得到训练语料后,结合中文特点,选取多维度特征训练序列标注模型,并利用上下文信息 进一步提高系统性能,进而在非结构化文本中抽取出实体的属性及属性值.实验结果表明:该方法在百度 百科多个类别中均有效;同时,该方法可以直接扩展到类似的非结构化文本中抽取属性. 关键词

文档评论(0)

1亿VIP精品文档

相关文档