- 2
- 0
- 约2.02万字
- 约 5页
- 2017-07-31 发布于河北
- 举报
基于混合并行遗传聚类的文本特征抽取方法研究
计算机科学2008V01.35№.9
基于混合并行遗传聚类的文本特征抽取方法研究*)
戴文华1 焦翠珍1 何婷婷2
(成宁学院计算机系 成宁437100)1(华中师范大学计算机科学系 武汉430079)2
摘要 同义词和近义词现象以及强关联语义信息加大了文本向量的特征维教,对文本分类的效率和精度都会带来
极大影响。为了有效降低文本向量的特征维数,提出一种基于混合并行遗传聚类的文本特征抽取方法。该方法首先
使用K-means聚类算法进行特征词粗粒度聚类,然后采用混合并行遗传算法对各类特征词进行细粒度聚类,最后对
各聚类中的特征词进行分析并压缩,得到最终能反映文本类别特征和语义信息的文本特征词集合。实验证明,该方法
是一种有效的文本特征抽取方法,能切实提高文本分类的效率和精度。
关键词并行遗传算法,K-means聚类,特征抽取,文本特征词
Oil Extraction ParallelGenetic
ResearchTextFeature
原创力文档

文档评论(0)