结合复杂网络的特征权重改进算法研究-现代图书情报技术
研究论文
结合复杂网络的特征权重改进算法研究*
杜 坤 刘怀亮 郭路杰
(西安电子科技大学经济与管理学院 西安 710126)
摘要: 【目的 】为了更准确计算特征权重, 以提高文本相似度计算的准确性。【方法 】考虑特征项间的语义关联
构造文本复杂网络并进行特征选择, 定义类别相关系数并结合特征选择结果, 提出一种改进的特征权重计算方
法, 并进行中文文本分类实验。【结果 】对比实验结果表明, 本文提出的特征权重改进算法较之TFIDF 算法能够
取得较好的分类效果。【局限 】特征选择评估函数中的参数需要人工给定。【结论 】相较于传统的TFIDF 算法, 该
算法能够更加准确地计算特征权重。
关键词: 复杂网络 特征权重 文本分类
分类号: TP391 G356
1 引 言 项在文本上下文中的语义作用。还有学者从特征选择
角度修正特征词权重, 如赵小华等[3] 2
将 统计量引入
原创力文档

文档评论(0)