化柏林010-58882556huabolin@istic.ac.cn中国科学技术信息.pptVIP

  • 5
  • 0
  • 约6.71千字
  • 约 49页
  • 2017-02-14 发布于湖北
  • 举报

化柏林010-58882556huabolin@istic.ac.cn中国科学技术信息.ppt

报告提纲 1 2 3 4 抽取方法 化柏林 统计与规则相结合 语料统计与自学习相结合 语法规则与模式规则相结合 多重规则混搭 化柏林 模式规则 句法规则 权词规则 学术定义规则构建流程 学术定义示例 报告提纲 1 2 3 4 实验对象 化柏林 《情报学报》全文抽取 JASIST(2001-2010)的摘要抽取 Journal of Documentation的全文抽取 学术定义抽取结果 规则是根据《情报理论与实践》2009年文章总结出来的。 进行实验的数据文本为《情报学报》2007年和2008两年共253篇文章(缺2008年第五期数据)。 学术定义抽取结果 属性抽取 属性抽取中学术概念和属性的数量关系可能是一对一或者是一对多的; 属性抽取出来的属性在情感色彩上可以有正面、负面和中性的; 规则按照规则和属性的关系又可以分为描述内容前后的规则和描述内容本身的规则两类。 属性抽取 属性抽取 中性 正面 负面 描述内容前后的规则 具有.*(特征|特性|特点) 的 (特点|特征|特性|属性|性质|优缺点) 的 (优势|优点|正面特征|好处) (很好的|能帮助|有利于|可以清晰|更加

文档评论(0)

1亿VIP精品文档

相关文档