多特征下的科研论文段落自动划分与构成要素识别研究.PDFVIP

  • 8
  • 0
  • 约3.93万字
  • 约 12页
  • 2019-01-05 发布于四川
  • 举报

多特征下的科研论文段落自动划分与构成要素识别研究.PDF

情报学报 第卷第期 年月 多特征下的科研论文段落自动划分与构成要素识别研究 刘伙玉 王东波 苏新宁 南京大学信息管理学院南京 南京农业大学信息科学技术学院南京 江苏省数据工程与知识服务重点实验室南京 摘要 本文为科研论文的结构化处理提供了一种有价值的方法本文采用条件随机场模型综合原始语料中 科研论文的局部与整体特征使用复杂特征模板对段落进行自动划分以及对构成要素进行自动识别在开放测试 中值最高分别达 和 同时本文对 和 在段落自动划分与构成要素识别实验中进行了比较分 析认为 在付出更大的时间复杂度的代价下其处理效果明显优于 关键词 条件随机场 段落划分要素识别特征模板 联网文献数据库中获取资源同时众多组织机构 引言 也积极投入巨大资源开发形式多样的文献服务而 提供多样性的文献服务首先涉及到的就是文献资源 随着互联网和数字媒体技术的快速发展数字 的加工 化文献服务领域也迅速兴起人们获取文献资源的 在现阶段国内期刊文献资源大多以扫描后的 途径也从直接购买纸质期刊的方式逐渐改变为从互 电子文档为主若要充分利用此类文献资源就需要

文档评论(0)

1亿VIP精品文档

相关文档