中文信息学报详解.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文信息学报详解

中 文 信 息 学 报 第 19卷 第6期 JOURNALOFCHINESEINFORMATIONPROCESSING Vol.19No.6 综〔述] 文章编号:1003一0077(2005)06一0013一08 多文档自动文摘综述 秦 兵,刘 挺,李 生 哈〔尔滨工业大学计算机学院信息检索研究室,黑龙江 哈尔滨 150001) 摘要:多文档文摘是将同一主题下的多个文本描述的主要的信息按压缩比提炼为一个文本的自然语言 处理技术。随着互联网上信息的日益丰富,多文档文摘技术成为新的研究热点。本文介绍了多文档文摘的产 生和应用背景,阐述了多文档文摘和其他 自然语言处理技术的关系,对多文档文摘国内外研究现状进行了分 析,在此基础上汇总提出了多丈档文摘研究的基本路线及关健技术,并总结了多文档文摘的未来及发展趋势。 关键词:人工智能;自然语言处理;多文档文摘;自然语言处理;文本压缩 中图分类号:TP391 文献标识码 :A SurveyofMulti-documentSummarization QINBing,LIUTing,LISheng (InformationRetrievalLaboratory,SchoolofComputerScienceandTechnology, HarbinInstituteofTechnology,Harbin,Heilongjiang150001,China) Abstract:multi-documentsummarizationisatechnologyofnaturallanguagesprocessing,whichextractimportantinforma- tionfrommultipletextsaboutsametopicaccordingtoratioofcompression.Multi-documentsummarizationbecomesnewre- searchspotwithincreasingofinformationininternet.Inthispaper,thebackgroundofmulti-documentsummarizationisin- troduced,therelationshipwithothertechnologiesofnaturallanguageprocessingandthestateofartsisanalyzed,thekey technologiesandthemethodsofresearchofmulti-documentsummarization,proposed.Finally,thefeatureofmulti-docu- ment-mmArizationisforeeaatPd. Keywords:artificialintelligence;naturallanguageprocessing;multi-documentsummarization;naturelanguagesprocess- ing;compressoftexts 1 引言 互联网的普及使人们的生活方式发生了巨大的变化,在网络带给人们大量信息的同时,人 们的需求也随着网络信息的急剧增长不断地发生着变化,从而促进了许多新技术诞生和发展。 人们面临的较多的问题是,面对成千上万的同一主题网页,它们多数具有相同的信息,而又包 含着少量不同的信息,迫切需要一个帮助人们快速浏览信息的工具,该工具不仅提供的是直接 的文档,而且是经过加工整理,包含这些文档的重要、全面的信息。这样会大大提高人们获取 信息的效率,同时会使越来越多的人利用互联网来获取信息。单文档文摘技术和信息抽取技 收稿 日期:2004一11一22 定稿 日期:2005-05-08 基金项目 国家自然科学基金重点资助项目 作者简介 秦兵(1968-),女,副教授,主要研究方向为中文信息处理,信息检索,多文档自动文摘 术可以帮助人们快速,高效地获取主要信息。这些技术发展至今,已经具备了一定的理论基 础,并且发展得比较成熟

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档