网站大量收购独家精品文档,联系QQ:2885784924

Research on Chinese Automatic Summarization.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
News Story Segmentation Digital Video Authentication Research on Chinese Automatic Summarization Zhang Jin /jadesor Institute of Computing Technology Outline Introduction Basic Methods Framework of Summarization System Our Work Challenges DUC Recent Future Work Introduction Related technology Brief history Definition Objective Classification NLP Related Technologies A Brief History of Summarization Definition A short passage with the purpose of conveying main idea of the document without any explanations and comment. (GB6447-86) An express of a certain document without any explanations and comment. Its unnecessary to know who writes the summary. (ANSI) A concise and accurate express of the document without any explanation and comment. A summary is independent on the author of the summary. (ISO214-1976(E)) Objective Concise(简洁) Accurate(准确) Explicit(清楚) Summary Classification Classified by users requirement Generic Summarization (GS) vs User-query Summarization (UQS) Classified by text object Single Document Summarization vs Multiple Document Summarization Classified by method Summarization Based on Extraction (SBE) vs Summarization Based on Understanding (SBU) Classified by need corpus Supervised Summarization (SS) vs Unsupervised Summarization (US) Related Work 国外研究现状 国外研究主要是面对英文信息的处理,比较有代表性的系统有: 美国哥伦比亚大学的多文档自动文摘系统Newsblaster。其研究主要针对新闻领域。可以对每天发生的同主题新闻进行摘要。目前该系统达到了每天上万人次的访问记录。 美国密西根大学研究开发的WebInEssence。这是一个个性化的基于Web的多文档自动文摘和内容推荐系统。 美国南加利福尼亚大学的信息科学研究所原型系统 NeATS。也是一个比较有名的多文档自动文摘系统。 进行多文档自动文摘相关研究和开发的公司有: nVivisimo公司 () ninfonetware公司() 这两个公司对搜索引擎返回的结果进行了有效地聚类整理。而文档聚类是多文档自动文摘的一个关键的预处理步骤。 DUC (Document Understanding Conference) Related Work 国内研究现状 国内目前在单文档文摘上的研究相对比较深入,如东北大学、上海交通大学、中科院、哈工大等科研机构进行的研究。 在多文档自动文摘方面,国内复旦大学开发了一个基于统计的文本自动综述系统,该方法利用文档内和文档之间段落的语义相关性,实现多文档的自动综述;哈工大基于语义相似度的最大边缘相关技术展开了研究。 在文档聚类方面,北京大学计算机科学与技术系提出了一种快速的Web文档聚类方法: PCCS部分聚类分类。中科院陈宁等人提出了基于模糊概念图的聚类方法, 中科院计算所吴斌提出了基于群体智能的文档聚类算法。 Basic Methods 在自动摘要的研究开发过程中提出

文档评论(0)

kaku + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8124126005000000

1亿VIP精品文档

相关文档