- 1
- 0
- 约2.95万字
- 约 7页
- 2017-11-11 发布于天津
- 举报
第 22 卷 第 1 期 中文信息学报 Vol . 22 , No . 1
2008 年 1 月 J OU RN AL O F C H IN ESE IN FO RMA T ION PROCESSIN G J an . , 2008
文章编号 : (2008) 0 1003707
基于推拉策略的文本分类增量学习研究
1 ,2 1 1
罗长升 ,段建国 ,郭 莉
( 1. 中国科学院计算技术研究所 智能安全中心 ,北京 100080 ; 2 . 中国科学院研究生院 北京 100039)
摘 要 : 学习算法是否具有增量学习能力是衡量其是否适合于解决现实问题的一个重要方面 。增量学习使学习算
法的时间和空间资源消耗保持在可以管理和控制的水平 , 已被广泛应用于解决大规模数据集问题 。针对文本分类
问题 ,本文提出了增量学习算法的一般性问题 。基于推拉策略的基本思想 ,本文提出了文本分类的增量学习算法
ICCD P ,并使用该算法对提出的一般性问题进行了分析 。实验表明 ,该算法训练速度快 ,分类精度高 ,具有较高的
实用价值 。
关键词 : 计算机应用 ; 中文信息处理 ;增量学习;推拉策略 ;文本分类 ; 中心法
中图分类号 : TP39 1 文献标识码 : A
Research on Incremental Learning of DragPushBased Text Classif ication
L U O Changsheng1 ,2 , DU AN Jianguo 1 , GU O Li 1
( 1. I3 S , In stit ut e of Comp uting Technology , Chinese Academy of Sciences , Beij ing 100080 ;
2 . Graduat e School of Chinese Academy of Sciences , Beij ing 100039)
Abstract : The abilit y to increment ally learn f rom batches of dat a i s an import ant feat ure t hat makes a learning
algorit hm more applicable to realworld p roblem s. Increment al learning may be u sed to keep memory and time
con sump tion of t he learning algorit hm at a manageable level . Increment al learning algorit hms have been widely u sed
for solving lar gescale dat aset p roblem s. For t ext cla ssification p roblem , t he p ap er p resent s t he general i ssues of an
increment al learning algorit hm . Ba sed on DragPu sh st rat egy , t he p ap er int roduces a t ext cla ssification increment al
learning met hod , named ICCD P . Finally , i
原创力文档

文档评论(0)