- 106
- 0
- 约1.71万字
- 约 6页
- 2017-09-18 发布于浙江
- 举报
第37卷 第3期 江西师范大学学报 (自然科学版) V0l-37No.3
2013年 5月 JournalofJiangxiNormalUniversity(NaturalScience) Mav2013
文章编号:1000-5862(2013)03-0279-05
面 向非结构化文本的开放式实体属性抽取
曾道建,来斯惟,张元哲,刘 康,赵 军
(中国科学院自动化所模式识别国家重点实验室,北京 100190)
摘要 :从非结构化文本中抽取给定实体的属性及属性值,将属性抽取看作是一个序列标注问题.为避免
人工标注训练语料,充分利用百度百科信息框 (Infobox)已有的结构化内容 ,对非结构化文本 回标 自动产
生训练数据.在得到训练语料后,结合中文特点,选取多维度特征训练序列标注模型,并利用上下文信息
进一步提高系统性能,进而在非结构化文本中抽取出实体的属性及属性值.实验结果表明:该方法在百度
百科多个类别中均有效;同时,该方法可以直接扩展到类似的非结构化文本中抽取属性.
关键词
您可能关注的文档
最近下载
- 2024年广西科技师范学院教师招聘考试笔试模拟试题及答案解析.docx VIP
- 2022年宁夏中考数学试卷.pdf VIP
- 2025年广西科技师范学院辅导员招聘考试笔试模拟试题及答案解析.docx VIP
- 山西财经大学 统计学 2021-2022-1 期末试题 .pdf VIP
- 国企集团薪酬与绩效管理办法.docx VIP
- 2025广西玉林师范学院公开招聘第二批工作人员49人考试参考试题及答案解析.docx VIP
- 中级宠物营养师必学鲜粮方向工作计划及安排.docx VIP
- 2025广西科技师范学院统一公开招聘工作人员17人考试模拟试题及答案解析.docx VIP
- (完整版)藻类图谱大全.doc VIP
- 2025年广西科技师范学院教师招聘考试笔试模拟试题及答案解析.docx VIP
原创力文档

文档评论(0)