基于网络化数据挖掘策略的中文多文档自动文摘研讨.pdfVIP

下载本文档

1
0
约1.88万字
约 12页
2018-01-07 发布于广东
举报

基于网络化数据挖掘策略的中文多文档自动文摘研讨.pdf

基于网络化数据挖掘策略的中文多文档自动文摘研究胡珀何婷婷张勇 (华中师范大学计算机科学系武汉430079) (phu宜mail．ccnu．edu．cn) 摘要多文档自动文摘是近期自然语言处理领域的一项热点研究课题．文中提出了一种基于网络化数据挖掘策略的中文多文档自动文摘方法，该方法的特色在于生成的摘要具有全面而简洁的特性，其内容能同时获得主题覆盖和冗余之间的平衡。考虑到同一主题的文档集合其潜在子主题的分布往往符台段落密度特性，提出了以段落为中心的研究方法．利用网络模型来表达段落并模拟段落间的语义相关性联系，利用网络化数据挖掘策略来自适应地划分段落语义网络中的各抱团结构并依此识别文档集合中的各潜在子主题，通过对子主题中心句子单元的抽取及排列生成最终的摘要．此外，一种基于句子向量相似度的方法被用来自动评价生成摘要的覆盖度和冗余度，通过与几种典型的多文档摘要方法的实验比较及对自动评价和人工评价结果的统计相关性分析验证了该方法的可行性和有效性．关键词多文档自动文摘网络化数据挖掘子主题识别 Multi．document Basedon C

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于网络化数据挖掘策略的中文多文档自动文摘研讨.pdfVIP

基于网络化数据挖掘策略的中文多文档自动文摘研讨.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档