- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华南理工大学学报(自然科学版)
of of
JournalSouthChina V01.36
第36卷第5期 UniversityTechnology No.5
2008年5月 Science
(Natural Edition) May2008
基于粗糙集与支持向量机的分类算法木
邓九英1 杜启亮1 毛宗源1 姚琛2
(1.华南理工大学自动化科学与工程学院,广东广州510640;2.广东教育学院计算机科学系,广东广州510303)
摘要:针对高维大样本环境下支持向量机训练算法面,1名的耗时增大与维数灾问题,将
序列最小优化算法(SMO)与粗糙集(Rs)的数据处理功能相结合,提出一种新的基于粗糙
集与支持向量机的分类算法RS—SMO.该算法依据属性的重要性对数据集作属性约简,用
粗糙边界集法生成类边界集作为SMO的训练子集,使训练集比原始训练集的维数与规模
都有一定程度的减少,可构造出具有较好时空性能的算法.实验结果表明,RS.SMO算法
能实现结构风险最小化,且性能优于SM0算法.
关键词:粗糙集;支持向量机;分解算法;属性约简;边界集;时空性能
中图分类号:TPl8 文献标识码:A
在Vapnik…提出支持向量机(SVM)后,支持向分析出信息间的相互关系,在知识量不受影响的前
量分类机得到快速的发展.学习过程中SVM的训练 提下对属性进行约简,具有处理大容量高维信息的
速度是目前研究的一大重点,至今已有各种SVM训 强大功能,利用RS可以有效降低SVM训练样本的
练算法,其中较突出的训练算法是Platt提出的序列维数¨41.因为决定SVM最优分类面的支持向量主
J. 要分布在边界区域J,用粗糙集可以快速准确地得
最小优化(SMO)算法∽1及其改进算法∞。4
原始SVM算法的运算速度都比较慢,原因在于 出类边界集,以该边界集作为SVM的训练子集,可
其利用了传统的标准二次型优化技术来解决对偶问 以大幅度减少训练样本数.文中结合RS与SVM的
题.因为SVM在训练时需要计算和存储核函数矩 优点,在SMO算法基础上提出了一种新的分类算法
阵,当样本点数目较大时,这将需要占用很大的内
存.同时,SVM在二次型寻优过程中需要进行大量 析,结果表明,减少训练样本的维数与规模能使
的矩阵运算,在多数情况下,训练算法运行时耗时较 RS—SMO算法的时间与空间性能有较大的改进.仿真
大的是寻优算法模块.影响SVM算法计算昔的主要 实验结果表明了RS.SMO算法的可行性与优越性.
因素是训练样本数,尤其是样本中的支持向量数,如
1 支持向量分类机
果要使样本比较均匀地分布在高维空间中,则需提
供大量的训练样本.在大训练样本情况下,SVM算 1.1 SVM的训练算法
法会面临维数灾与时间消耗增大等问题,或者由于 SVM考虑线性可分的二分类问题,按照最大间
内存容量的限制导致无法训练,无法有效地实现支 隔原则求出最优分类超平面旧J.设线性可分样本集
持向量分类机与回归机的功能.
粗糙集(RS)是一种处理不精确、不确定和不完 {一1,1},i=1,2,…,f}.
全信息的新型数学工具,它不需要任何先验知识,可 在分类面两边的样本对应两种不同的类别,其
收稿口期:2007.10—22
+基金项目:国家自然科学基金资助项目
126.tom
万方数据
124 华南理工大学学报(自然科学版) 第36卷
分类面的线性判别函数的一般形式为
您可能关注的文档
- 9章 要素价格与收入分配23548.ppt
- 9章(续)非流动负债.ppt
- 国际消费者权益日18608.doc
- 国家公务员考试复习备考指南:申论热点篇-生态与土壤.doc
- 09中国旅游资源概论第九章.ppt
- 国家竞争优势理论.pptx
- 10-2二端口网络连接.pdf
- 国家旅游资源分类.doc
- 如何提高教学质量.201121211.doc
- 国家文化战略、文化产业与国家形象构建.pdf
- 小学科学:ESP8266智能插座电路原理与动手实践研究教学研究课题报告.docx
- 《金融开放浪潮下我国多层次监管体系构建与创新研究》教学研究课题报告.docx
- 区域教育质量监测中人工智能应用的数据质量分析与优化策略教学研究课题报告.docx
- 《金融科技监管中的数据治理与合规性要求》教学研究课题报告.docx
- 《3D打印技术在航空航天领域中的多材料制造与复合材料应用》教学研究课题报告.docx
- 《绿色金融发展中的政府职能与市场机制研究》教学研究课题报告.docx
- 《植物工厂多层立体栽培光环境调控技术对植物生长发育节律的调控机制探讨》教学研究课题报告.docx
- 销售团队年度业绩总结.docx
- 银行风险管理与金融危机防范.docx
- 银行网络攻击预警与快速响应机制.docx
最近下载
- 最新完整版-途观2012版使用维护说明书.pdf
- 运动生理学 课后答案 (王瑞元 苏全生).pdf VIP
- 2025中国南水北调集团新能源投资有限公司第一批中层及职员岗位社会招聘模拟试卷含答案解析.docx VIP
- 2024年辽宁省高考英语试卷(含答案解析)+听力音频.docx
- 钢轨闪光焊工艺及缺陷 的分析.pdf VIP
- 农行支行信贷营销经验总结.pptx
- 电子制图Portel DXP 2004 项目三.pptx VIP
- 化工导论第三章资料.ppt VIP
- 电子制图Portel DXP 2004 项目二.pptx VIP
- (高清版)B 4053.2-2009 固定式钢梯及平台安全要求 第2部分:钢斜梯.pdf VIP
文档评论(0)