基于网络化数据挖掘策略的中文多文档自动文摘研讨.pdfVIP

  • 1
  • 0
  • 约1.88万字
  • 约 12页
  • 2018-01-07 发布于广东
  • 举报

基于网络化数据挖掘策略的中文多文档自动文摘研讨.pdf

基于网络化数据挖掘策略的中文多文档自动文摘研究 胡珀 何婷婷 张勇 (华中师范大学计算机科学系武汉430079) (phu宜mail.ccnu.edu.cn) 摘要多文档自动文摘是近期自然语言处理领域的一项热点研究课题.文中提出了一种基于网络化 数据挖掘策略的中文多文档自动文摘方法,该方法的特色在于生成的摘要具有全面而简洁的特性,其内容 能同时获得主题覆盖和冗余之间的平衡。考虑到同一主题的文档集合其潜在子主题的分布往往符台段落密 度特性,提出了以段落为中心的研究方法.利用网络模型来表达段落并模拟段落间的语义相关性联系,利 用网络化数据挖掘策略来自适应地划分段落语义网络中的各抱团结构并依此识别文档集合中的各潜在子主 题,通过对子主题中心句子单元的抽取及排列生成最终的摘要.此外,一种基于句子向量相似度的方法被 用来自动评价生成摘要的覆盖度和冗余度,通过与几种典型的多文档摘要方法的实验比较及对自动评价和 人工评价结果的统计相关性分析验证了该方法的可行性和有效性. 关键词多文档自动文摘网络化数据挖掘子主题识别 Multi.document Basedon C

文档评论(0)

1亿VIP精品文档

相关文档