网站大量收购独家精品文档,联系QQ:2885784924

基于粗糙集与统计学习理论的样本分类算法.pdfVIP

基于粗糙集与统计学习理论的样本分类算法.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于粗糙集与统计学习理论的样本分类算法.pdf

第 29卷第 1期 模 糊 系 统 与 数 学 Vo1.29.NO.1 2015年 2月 FuzzySystemsandMathematics Feb.,2015 文章编号 :1001—7402(2015)01—0183—08 基于粗糙集与统计学习理论的样本分类算法 刘文军 ,郑 国义 ,张小琼 (1.湖南大学 数学与计量经济学院,湖南 长沙 410082; 2.长沙理工大学 数学与计算科学学院,湖南 长沙 410076) 摘 要 :结合粗糙集理论 中分类思想与统计学习理论 中回归分析思想,本文给 出了一种样本分类算法 , 该算法首先对决策表进行约简,求 出一个极小约简,并在极 小约简决策表 中,将对象按类属性值进行分 类。然后根据每一类的因素描述 ,给 出一个线性回归方程 。最后将未知样本的数据代入每一个回归方程 , 根据最大隶属度原则 ,确定每个样本 的分类。 关键词 :粗糙集 ;统计 ;分类算法 中图分类号 :0159 文献标识码 :A 引言 分类是一种重要的数据挖掘技术 [1]。分类 的目的是根据数据集的特点构造一个分类函数或分类 模型(也常常称作分类器),该模型能把未知类别的样本映射到给定类别 中的某一个。分类和回归都可以 用于预测。和回归方法不同的是,分类的输出是离散的类别值,而回归的输出是连续或有序值。本文只 讨论分类。 构造模型的过程一般分为训练和测试两个阶段。在构造模型之前 ,要求将数据集随机地分为训练数 据集和测试数据集。在训练阶段 ,使用训练数据集 ,通过分析由属性描述的数据库元组来构造模型,假定 每个元组属于一个预定义的类 ,由一个称作类标号属性 的属性来确定 。训练数据集 中的单个元组也称作 训练样本 ,一个具体样本的形式可表示为:(z,z,…,z,),其中五表示属性值 ,d表示类别。由于提供 了每个训练样本的类标号 ,该阶段也称为有指导的学习,通常 ,模型用分类规则、判定树或数学公式的形 式提供。在测试阶段,使用测试数据集来评估模型的分类准确率 ,如果认为模型的准确率可以接受 ,就可 以用该模型对其它数据元组进行分类 。 分类模型的构造方法有决策树、统计方法 、机器学习方法、神经网络方法等口 ]。按大的方向分类主 要有 :决策树 ,关联规则 ,贝叶斯 ,神经 网络 ,规则学习,忌一临近法 ,遗传算法 ,粗糙集 以及模糊逻辑技 术_8]。本文结合粗糙集理论与统计学习理论 中回归分析思想 ,提 出了一种新 的样本分类问题 的算法 。 该算法首先对决策表进行约简,求出一个极小完全约简决策表 ;其次 ,根据每一类的因素描述 ,给出一个 近似线性回归方程 ;最后根据线性 回归方程确定未知样本 的类属性值 ,这种 回归方法能综合地利用决策 表 中各属性 的属性值 ,也能有效地避免一些孤立点对样本分类的影响。 由于在数据收集阶段很难确切知道哪些属性是相关的,哪些属性是不重要 的,所有的属性都被认 * 收稿 日期 :2013-11-04;修订 日期:2014—01—03 作者简介:刘2~g:(1971一),男 ,湖南邵东人 ,长沙理工大学数学与计算科学学院讲师 ,博士 ,研究方向:模糊数学与粗糙集理论 。 184 模 糊 系 统 与 数 学 为是有用的,并全部存入数据库,大大增加了信息存储量和处理量 。我们在进行分类前 ,首先利用粗 糙集理论对初始数据集进行属性约简,找出原决策表的一个极小完全约简表 ,然后利用极小完全约简 决策表的数据进行分类将有效地减少分类的时间。 2 预备 在粗糙集理论中[10--11],把知识假定为对对象分类的能力,知识是 由人们感兴趣的领域的分类模式 组成 ,它提供关于现实的明显事实 ,同时也具有 由明显 事实推导出模糊事实的推理能力 。设论域u是研 究对象组成的有限集合 , 的子集称为 中的一个概念, 中的任何概念簇称为 的抽象知识 ,简称 知识 。为描述知识的粗糙程度,粗糙集理论引人了近似集的概念。对 中概念 及 己,上的一个等价关 系R,分别称集合RX=U{YIy∈U/R,y x)与RX=U{Yy『∈U/R,YNX

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档