- 1
- 0
- 约1.88万字
- 约 12页
- 2018-01-07 发布于广东
- 举报
基于网络化数据挖掘策略的中文多文档自动文摘研究
胡珀 何婷婷 张勇
(华中师范大学计算机科学系武汉430079)
(phu宜mail.ccnu.edu.cn)
摘要多文档自动文摘是近期自然语言处理领域的一项热点研究课题.文中提出了一种基于网络化
数据挖掘策略的中文多文档自动文摘方法,该方法的特色在于生成的摘要具有全面而简洁的特性,其内容
能同时获得主题覆盖和冗余之间的平衡。考虑到同一主题的文档集合其潜在子主题的分布往往符台段落密
度特性,提出了以段落为中心的研究方法.利用网络模型来表达段落并模拟段落间的语义相关性联系,利
用网络化数据挖掘策略来自适应地划分段落语义网络中的各抱团结构并依此识别文档集合中的各潜在子主
题,通过对子主题中心句子单元的抽取及排列生成最终的摘要.此外,一种基于句子向量相似度的方法被
用来自动评价生成摘要的覆盖度和冗余度,通过与几种典型的多文档摘要方法的实验比较及对自动评价和
人工评价结果的统计相关性分析验证了该方法的可行性和有效性.
关键词多文档自动文摘网络化数据挖掘子主题识别
Multi.document Basedon
C
您可能关注的文档
- 基于纳米TiO2的化学发光法检测核黄素研究.pdf
- 基于纳米功能粉体的高性能无机有机复合涂层材料的开发研究.pdf
- 基于纳米光催化的旅客机新型座舱空气质量控制系统研究.pdf
- 基于网格计算的分布式并行计算与仿真技术研究.pdf
- 基于网格计算的制造服务体系与应用研讨.pdf
- 基于网格技术的Web信息采集系统研究.pdf
- 基于网格技术的数字海图数据管理与应用研讨.pdf
- 基于网格技术的有限元计算与仿真研究.pdf
- 基于网格技术的知识共享型信息处理系统研究.pdf
- 基于网格技术建设我国大型仪器共享平台研究.pdf
- Q_ZZWBL 002-2020 包装容器 易拉罐.docx
- DB45∕T 2974-2025 原味山茶油生产技术规程.docx
- DB11∕T 3051-2026 养老机构老年人心理评估规范.docx
- DB62_T 3135-2025 建筑与市政工程绿色施工管理标准.docx
- Q_ZBHY-2024 ZSM-5系列分子筛(硅铝分子筛、水合催化剂).docx
- CNAS-EC-048_2015《关于信息技术服务管理体系(ITSMS)认证机构认可转换的说明》.docx
- T_CACM 1374.22-2021 广藿香规范化生产技术规程.docx
- DB13T 2465-2017 高速公路沥青路面养护技术规范.docx
- DB45∕T 2975-2025 油茶和澳洲坚果果壳醋液生产技术规程.docx
- DB46∕T 732-2026 南海海-气二氧化碳通量遥感估算技术规范.docx
最近下载
- 保育员考试题及答案.docx VIP
- GRASP10[1].3.0培训教程(公开).pdf VIP
- 落实过程安全管理,提升屡查屡犯五类问题防控能力-程长进.pdf VIP
- A1驾驶证科目一考试试题及答案.docx
- 2025年路面修复养护工程施工组织设计.docx VIP
- 麻醉技术操作规范(WS_T798-2025修订版,附操作指南)附解读.docx VIP
- 23CX202 建筑空间及机电设备群智能系统工程参考图集.pdf VIP
- 1.国家电力投资集团有限公司光伏项目工程建设管理标准化工作手册.docx VIP
- AQ 3053-2015 立式圆筒形钢制焊接储罐安全技术规程(高清版).pdf VIP
- 史上最详细煤化工流程图(超高清).doc VIP
原创力文档

文档评论(0)