中文自动文摘系统.pdfVIP

  • 41
  • 0
  • 约7.43千字
  • 约 7页
  • 2017-08-16 发布于安徽
  • 举报
本系统共分四火部分,即:预处理、特征词抽取、文本结构的自动分析与句子加权、 文摘生成。其总体结构如图j所示。 3特征词抽取 在我们的自动文摘系统中,特征词的自动抽取是为重要句子的自动抽取服务的,最 终目的是为了抽取能代表全文主题的句子。特征词抽取的质量直接影响到句子抽取的结 车项目讲到固家自然科学摹盘资助(696730|【) 200 困\ N卜团 十旷 口 团 圈1系统结构国 果,对最终的文摘质量有着举足轻重的影响,冈此,在整个系统中,特征词的抽取是基 础,更是关键。我们从两种不同的思路入手进行了。些探讨,一种是与领域无关的基于 统计的特征词抽取方法,另一种是基于分类的特征词抽取方法。下面分别进行讨论。 3.1基于统计的特征词抽取 由于在表达文章主题时起专要作用的是实词,而且Taketa

文档评论(0)

1亿VIP精品文档

相关文档