- 20
- 0
- 约1.82万字
- 约 30页
- 2017-06-15 发布于北京
- 举报
高维数据的低维表示综述
一、研究背景
降维的基本原理是把数据样本从高维输入空通过线性或非线性映射投影到一个低维空间,从而找出隐藏在高维观测数据中有意义的低维结构。(8)
之所以能对高维数据进行降维,是因为数据的原始表示常常包含大量冗余:
· 有些变量的变化比测量引入的噪声还要小,因此可以看作是无关的
· 有些变量和其他的变量有很强的相关性(例如是其他变量的线性组合或是其他函数依赖关系),可以找到一组新的不相关的变量。(3)
从几何的观点来看,降维可以看成是挖掘嵌入在高维数据中的低维线性或非线性流形。这种嵌入保留了原始数据的几何特性,即在高维空间中靠近的点在嵌入空间中也相互靠近。(12)
数据降维是以牺牲一部分信息为代价的,把高维数据通过投影映射到低维空中,势必会造成一些原始信息的损失。所以在对高维数据实施降维的过程中如何在最优的保持原始数据的本质的前提下,实现高维数据的低维表示。(8)
二、降维问题
1.定义
定义1.1降维问题的模型为,其中维数据空间集合(一般为的一个子集),映射
是空间集合(一般是,)的一个子集,我们称是数据集(到)的降维。
若为的线性函数,则称为线性降维;否则,称为非线性降维。
定义1.2 称映射
为嵌入映射。(8)
2.分类
针对降维问题的目的和待处理数据集合表象维数的多少,对其进行初步的、粗略的分类如下:
·硬降维问题:数据维数从几千到几万甚至几十万的变
您可能关注的文档
- 高压电机综合保护培训学习资料[1].doc
- 高国新的性质宇宙学讲义1-105.doc
- 高坝洲电厂防水淹水导处理办法.doc
- 高子阳的童书阅读年级分类.doc
- 高尔夫球场专用电瓶车结构及外观设计.doc
- 高层住宅投标文件编制.doc
- 高层建筑箱形与筏形基础技术规范JGJ6.doc
- 高年级环保教育教材.doc
- 高德车行通云狗使用说明书及客户端使用说明.doc
- 高数引言及第一部分.doc
- 《GB/T 4943.2-2026音视频、信息技术和通信技术设备 第2部分:与GB 4943.1—2022相关的解释信息》.pdf
- GB/T 4943.2-2026音视频、信息技术和通信技术设备 第2部分:与GB 4943.1—2022相关的解释信息.pdf
- GB/T 47126-2026道路车辆 自动驾驶传感器与数据融合单元间数据通信 逻辑接口.pdf
- 《GB/T 47126-2026道路车辆 自动驾驶传感器与数据融合单元间数据通信 逻辑接口》.pdf
- 中国国家标准 GB/T 47126-2026道路车辆 自动驾驶传感器与数据融合单元间数据通信 逻辑接口.pdf
- 2026江苏南通市海安市人力资源和社会保障局下属事业单位选调1人考试参考试题及答案解析.docx
- 2026内蒙古自治区党委军民融合办所属事业单位竞争性比选3人考试备考试题及答案解析.docx
- 2026年徽商银行社会招聘考试参考题库及答案解析.docx
- 2026贵州杉乡建设投资开发(集团)有限公司招聘合同制员工4人考试参考题库及答案解析.docx
- 2026年护士资格模拟冲刺肿瘤科护理含解析.docx
最近下载
- 江苏省扬州市扬州中学2022-2023学年高一下学期3月月考语文 含解析.docx VIP
- GB_T51095-2015:建设工程造价咨询规范.pdf VIP
- T-D-T 1068-2022 国土空间生态保护修复工程实施方案编制规程(正式版).docx VIP
- 小区建筑电气毕业设计(论文).doc VIP
- 集团数字化转型方案.ppt VIP
- 基于大数据的温州公安队伍风险预警管控系统:设计、实践与展望.docx VIP
- 2025年医学课件-慢性阻塞性肺疾病(COPD).pptx VIP
- 慢性阻塞性肺疾病(COPD)ppt课件(图文).pptx VIP
- 梦游天姥领留别.docx
- 颈部淋巴结肿大的鉴别诊断和处理.pptx VIP
原创力文档

文档评论(0)