- 41
- 0
- 约7.43千字
- 约 7页
- 2017-08-16 发布于安徽
- 举报
本系统共分四火部分,即:预处理、特征词抽取、文本结构的自动分析与句子加权、
文摘生成。其总体结构如图j所示。
3特征词抽取
在我们的自动文摘系统中,特征词的自动抽取是为重要句子的自动抽取服务的,最
终目的是为了抽取能代表全文主题的句子。特征词抽取的质量直接影响到句子抽取的结
车项目讲到固家自然科学摹盘资助(696730|【)
200
困\ N卜团
十旷
口 团
圈1系统结构国
果,对最终的文摘质量有着举足轻重的影响,冈此,在整个系统中,特征词的抽取是基
础,更是关键。我们从两种不同的思路入手进行了。些探讨,一种是与领域无关的基于
统计的特征词抽取方法,另一种是基于分类的特征词抽取方法。下面分别进行讨论。
3.1基于统计的特征词抽取
由于在表达文章主题时起专要作用的是实词,而且Taketa
原创力文档

文档评论(0)