结合复杂网络的特征权重改进算法研究-现代图书情报技术.pdf

结合复杂网络的特征权重改进算法研究-现代图书情报技术.pdf

结合复杂网络的特征权重改进算法研究-现代图书情报技术

研究论文 结合复杂网络的特征权重改进算法研究* 杜 坤 刘怀亮 郭路杰 (西安电子科技大学经济与管理学院 西安 710126) 摘要: 【目的 】为了更准确计算特征权重, 以提高文本相似度计算的准确性。【方法 】考虑特征项间的语义关联 构造文本复杂网络并进行特征选择, 定义类别相关系数并结合特征选择结果, 提出一种改进的特征权重计算方 法, 并进行中文文本分类实验。【结果 】对比实验结果表明, 本文提出的特征权重改进算法较之TFIDF 算法能够 取得较好的分类效果。【局限 】特征选择评估函数中的参数需要人工给定。【结论 】相较于传统的TFIDF 算法, 该 算法能够更加准确地计算特征权重。 关键词: 复杂网络 特征权重 文本分类 分类号: TP391 G356 1 引 言 项在文本上下文中的语义作用。还有学者从特征选择 角度修正特征词权重, 如赵小华等[3] 2 将 统计量引入

文档评论(0)

1亿VIP精品文档

相关文档