- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2014年第2期文章编号:1009—2552(2014}02—0014—05
2014年第2期
文章编号:1009—2552(2014}02—0014—05 中图分类号:TIB91.41 文献标识码:A
基于中值PCA和加权PCA数据分类的研究
王德芬1,高建强1,李 莉2
(1.河海大学计算机与信息学院,南京210098;2.南京财经大学应用数学学院,南京210023)
摘要:在分析了传统主成分分析(PCA)方法的原理和实现方法上,提出了基于中值的主成 分分析新方法(MPCA)。另外,针对多类高维数据分类问题,较深入地研究了权函数对分类问 题的影响,对传统PCA模型进行加权处理得到加权主成分分析(WPCA)。实验结果表明,MP— CA比传统PCA具有较好的分类效果,不同权函数对数据的分类结果影响较大,且WPCA比传统 PCA在分类效果上有明显的优势。
关键词:PCA;MPCA;加权主成分分析;权函数;错分率
Studies on data classification based on median PCA and weighted PCA
WANG De—fen 1,GAO Jian—qian91,LI Li2
(1.School of Computer and Information,Hohai University,Nanjing 210098,China;
2.Department of Applied Mathematics,Nanjing University of Finance and Economics,Nanjing 210023,China) Abstract:A new median-based principal component analysis method(MPCA)is pmposed under based the traditional principal component analysis(PCA)theory and implementing method introduced in this paper.In addition,the effect of weight function the classification problem is deeply researched for
multi—class high·dimension data classification problem.And,weighted principal component analysis (WPCA)is obtained by applying the weighting method for PCA model.The experiment results show that the MPCA has got better result than the traditional PCA on the classification problem,the influence of different weight functions is great data classification result,and WPCA has obvious more advantages than the traditional PCA classification results.
Key words:PCA;MPCA;weighted principal component analysis;weight function;misclassification
rate
随着科技的发展,高维数据越来越受到人们的 维方法,但是它有一个完全依赖于每一类样本均值 关注。高维数据虽然蕴含丰富的信息,但是也含有 的弱点,在某些特殊情况下(当输人数据中含有噪 较多的冗余,给科研人员带来了分析和处理的困难。 声、强光、离群值等),每一类样本的均值不能准确 主要表现为:(1)数据维数较高,含冗余,计算耗时; 地估计整体样本的实际情况。因此,本文提出了一 (2)在处理某些特定问题时,能利用的有效信息较 种新的模型——基于中值的主成分分析(MPCA), 少,且在高维环境下,很容易被湮灭,因此对如何进 这一模型能够有效地克服这一弱点。科研人员在线 行有效信息的提取变得十分必要。对于以上提到的 性判别分析中已有相关的研究拉。j。文献[5—8] 两点,可以从以下两个方面进行考虑来加以解决:首 主要讨论了权函数对数据分类的影响,但是没有 先对原始高维数据进行适当降维;其次,对降维后的
收稿日期:2013—07一Ol
数据进行不同测度下的加权处理。目前关于数据降 基金项目:
您可能关注的文档
最近下载
- 2024年中国中式养生水行业发展趋势洞察报告.pdf VIP
- 湘科版科学五年级上册全册教学设计教案.pdf
- 大家的日语 1-9课测试试卷1.doc VIP
- 政府采购评审专家考试题库含答案.docx VIP
- JJF 1593-2016 国家检定校准 规范.docx VIP
- Service invoice 服务发票模板.doc VIP
- 浅谈危险化学品企业安全管理当中存在的问题与建议对策.docx VIP
- 甘肃省兰州市第五十八中学教育集团2024-2025学年高三上学期建档考试物理试题(无答案).docx VIP
- 幼儿园小班妈妈在哪儿课件..pptx VIP
- 建筑工程冬季施工防冻保温实施方案.doc VIP
文档评论(0)