- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本 科 毕 业 设 计 论 文
题 目 随机子空间方法在高维数据分析
中的应用与实现
学 院 计算机学院
专 业 教育技术学
学生姓名
导师姓名
摘 要
在过去的几十年内,数据采集能力的提高以及存储容量的增长,导致了科学研究的很多领域中信息量急剧增长,它向人们提供更加丰富、细致的信息的同时也造成了大量的信息冗余。在机器学习和模式识别领域的应用中,高维数据产生的维数灾难问题通常会影响传统算法的性能。分析了传统算法在处理大规模、高维数据时遇到的困难和问题,比较了各种降维方法的优劣,从原理上论证了随机子空间算法处理大规模、高维数据集的优势。
本文调查了随机子空间集成方法去修正与适应基于模式识别和机器学习的高维数据的挑战。随机子空间方法属于子空间取样技术,通过将训练样本集映射到特征空间的子空间中形成新的训练集,而后在每一新的训练集上训练一个分类器。相比一般模式识别问题,对高维数据进行分析时,随机子空间学习不必受限于特征的重复使用。面对大规模的特征向量,需要挑选出数量和容积都满足要求的特征子集,形成特征子集集合训练分类器。本文提出的随机子空间集成方法也可以推广到其它相关方面的应用中去。
关键词:维数灾难 随机子空间方法 特征向量 模式识别
Abstract
The improving abilities of data collection and storage capabilities during the past decades have led to information overload in most scientific domains. Traditional algorithms used in machine learning and pattern recognition applications are often susceptible to the well-known problem of the curse of dimensionality. Because tradition
algorithms encounter many difficulties and challenges when dealing with the high dimensional data, we compare the advantages and shortcomings of different dimensional reduction methods, and then conclude that random subspace ensembles are essential and useful.
In this paper, we investigate the revision and adaptation of serious challenge of high dimensional data to pattern recognition and machine learning using random subspace ensembles. Random subspace methods belong to subspace sampling technology, which make training samples mapped to the subspace of feature space to form new training sets, and then on each new training set training a classifier. Compared to general pattern recognition problems, when high-dimensional data analysis, random subspace learning is not restricted to reusing of feature. Facing the large-scale feature vector, we need to pick feature subset whose quantity and volume meet the requirements to form feature subset
您可能关注的文档
- 毕业论文:《基于PLC的电镀行车控制系统的设计与研究》 (1).doc
- 毕业论文:《基于PLC的电镀行车控制系统的设计与研究》.doc
- 毕业论文:《基于PLC的恒压供水系统》.doc
- 毕业论文:《基于PLC的隧道通风控制系统》.doc
- 毕业论文:《基于PLC的循环硫化床锅炉燃烧控制系统》.doc
- 毕业论文:《基于PLC的循环硫化床锅炉燃烧控制系统的设计》.doc
- 毕业论文:《基于PLC的自动药片装瓶控制设计》.doc
- 毕业论文:《基于PLC控制的花样喷泉设计》.doc
- 毕业论文:《基于PLC控制的泡沫切割机》.doc
- 毕业论文:《基于PLC控制金属塑料自动分拣系统设计》.doc
- 【重庆市S街道家庭医生签约服务现状调研分析报告6000字】.docx
- 八年级生物下册教学课件《选择健康的生活方式》.pptx
- 高中高考思想政治一轮总复习课后习题 选择性必修一 当代国际政治与经济 课时规范练30 和平与发展 (2).doc
- 企业社保费申报流程(核定版).docx
- 高中高考思想政治一轮总复习课后习题 选择性必修一 当代国际政治与经济 课时规范练31 中国的外交 (2).doc
- 高中思想政治选择性必修1当代国际政治与经济课后习题 第1单元 各具特色的国家 第一单元过关检测.doc
- 第6章 生物的进化B卷 能力提升—高一生物学人教版(2019)必修二单元达标测试卷.docx
- 高中思想政治选择性必修1当代国际政治与经济课后习题 第2单元 世界多极化 第4课 和平与发展 第2框 挑战与应对 (2).doc
- 高中思想政治选择性必修1当代国际政治与经济课后习题 第3单元 经济全球化 第6课 走进经济全球化 第2框 日益开放的世界经济.doc
- 【泰安交通建设集团人力资源管理模式研究4900字】.doc
最近下载
- 2024年(高级)政工师理论考试题库及答案(含各题型) .docx
- 心中有“数”,脚下有路-五年级(上)期中考试后家长会 课件.pptx VIP
- 大数据环境下企业会计信息化管理模式研究.docx VIP
- 山东省政府采购专家测评题库200-400题.docx VIP
- 2023-2024学年贵州省贵阳市高二(上)期末数学试卷.docx VIP
- 精品解析:2023-2024学年山东省青岛市城阳区青岛版三年级上册期末考试科学试卷(解析版).docx VIP
- 能源管理工作总结.pptx
- 2024-2025学年初中体育与健康七年级全一册(2024)人教版(2024)教学设计合集.docx
- 诗词格律十讲王力.pdf
- 山东省青岛市2023-2024学年三年级上学期期末科学试题.pdf VIP
文档评论(0)