基于粗糙集的文本分类特征选择算法.pdfVIP

基于粗糙集的文本分类特征选择算法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 4 卷第 5期               智  能  系  统  学  报               Vol. 4 №. 5 2009年 10 月                           O ct. 2009 CAA I Tran saction s on In telligen t System s do i: 10. 3969 / j. issn. 2009. 05. 011 基于粗糙集的文本分类特征选择算法 张志飞1, 2 ,苗夺谦1, 2 ( 1. 同济大学 计算机科学与技术系 ,上海 20 1804; 2. 同济大学 嵌入式系统与服务计算教育部重点实验室 ,上海 201804) 摘  要 :文本分类是根据未知文本的内容将其划分到一个或多个预先定义的类别的过程 ,是许多基于内容的信息管 理任务的重要组成部分. 文本分类问题的难点是特征空间的高维性 ,通常采用特征选择作为降维的重要方法. 将属 性约简和文本分类的特点相结合 ,提出了一种基于粗糙集的特征选择算法即改进的快速约简算法. 实验表明该算法 是有效的 ,不仅可以降低特征空间的维度 ,而且能够维持高精度. 关键词 :文本分类 ;粗糙集 ;特征选择 ;快速约简 中图分类号 : TP39 1 文献标识码 : A  文章编号 :(2009) Fea ture selection for text ca tegor iza tion ba sed on rough set 1, 2 1, 2 ZHAN G Zh ifei , M IAO D uoq ian ( 1. D ep artm ent of Comp uter Science and Technology, Tongj i Un iversity, Shanghai 20 1804 , Ch ina; 2. The Key L aboratory of Em bed ded System and Service Comp uting, M in istry of Education, Shanghai 20 1804 , Ch ina) A b stract: Text categorization a ssign s text docum en ts to one or more p redefined categorie s ba sed on their con ten ts. Th is a ssists con ten tba sed inform ation m anagem en t. A difficu lt p rob lem in th is ta sk is the h igh dim en sionality of the featu re sp ace. To re so lve th is, a featu re selection m ethod wa s emp loyed to reduce the dim en sion s. A new app roach ba sed on rough sets, that we call it the imp roved qu ick reduction ( IQR ) algorithm , wa s p ropo sed. It invo lved both attribu te reduction and text categorization. The exp erim en tal re su lts demon strated the effectivene ss of the p ropo sed algorithm. It reduced the dim en siona

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档