1.数据变换重点
数据变换 目 录 §1 变量测量尺度的类型 §2 数据的变换处理 §3 样品间亲疏程度的测度 为了将样本进行分类,就需要研究样品之间的关系;而为了将变量进行分类,就需要研究变量之间的关系。但无论是样品之间的关系,还是变量之间的关系,都是用变量来描述的,变量的类型不同,描述方法也就不同。通常,变量按照测量它们的尺度不同,可以分为三类。 (1)间隔尺度。指标度量用数量来表示,其数值由测量或计数、统计得到,如长度、重量、收入、支出等。一般来说,计数得到的数量是离散数量,测量得到的数量是连续数量。在间隔尺度中如果存在绝对零点,又称比例尺度。 研究样品或变量的亲疏程度的数量指标有两种,一种叫相似系数,性质越接近的变量或样品,它们的相似系数越接近于1或一l,而彼此无关的变量或样品它们的相似系数则越接近于0,相似的为一类,不相似的为不同类;另一种叫距离,它是将每一个样品看作p维空间的一个点,并用某种度量测量点与点之间的距离,距离较近的归为一类,距离较远的点应属于不同的类。 1. 常用的距离算法 设 和 是第i和 j 个样品的观测值,则二者之间的距离 为: 明考夫斯基距离主要有以下两个缺点: ①明氏距离的值与各指标的量纲有关,而各指标计量单位的选择有一定的人为性和随意性,各变
您可能关注的文档
- 1.双眼视基础复习高级技师1重点.ppt
- 1.单元活动学用地理统计图课件(鲁教版必修二)重点.ppt
- 1.恒大海南海花岛2#岛首四期基础土方开挖方案重点.doc
- 1.固体材料的结构知识重点.ppt
- 1.数学二年级重点.doc
- 1.时间观测重点.ppt
- CN117945668B 一种抑制薄玻璃碎裂的薄膜及其制备方法 (中建材玻璃新材料研究院集团有限公司).docx
- CN118154061B 物理融合贝叶斯的管道泄漏评价方法、装置、设备及介质 (中国石油大学(北京)).docx
- CN118267992B 一种煤气化渣基富缺陷碳-铁复合材料及其制备方法和应用 (太原理工大学).docx
- CN118193714B 一种基于层级结构和检索增强的动态适应问答系统及方法 (山东浪潮科学研究院有限公司).docx
- CN118228103B 基于网络模式和元路径的双视图范式的异构图神经网络节点分类方法 (华南理工大学).docx
- CN118207835B 一种联合火箭锚与植桩技术的堤防决口快速封堵方法 (大连理工大学).docx
- CN118211675B 基于机器学习消除冗余约束的机组组合加速寻优方法及系统 (中国电力科学研究院有限公司).docx
- CN118297473B 电力系统电压安全评估及优化方法、系统、设备和介质 (国网经济技术研究院有限公司).docx
- CN117997906B 节点计算资源分配方法、网络交换子系统及智能计算平台 (广东琴智科技研究院有限公司).docx
- CN118298536B 一种基于智慧社区监控系统的门禁授权认证方法及系统 (广州市西迈信息科技有限公司).docx
- CN118225438B 大功率霍尔推进器在轨健康状态监测方法 (哈尔滨工业大学).docx
- CN118052938B 一种基于多源数据融合的建筑物多细节层次模型重建方法 (北京市测绘设计研究院).docx
- CN117964706B 一种十五元环缩肽类化合物及其制备方法与应用 (广西中医药大学).docx
- CN118081766B 一种面向协调类任务的双臂机器人主从统一导纳控制方法 (南京航空航天大学).docx
最近下载
- My schoolbag Part A Let's learn 课件(23张PPT)(完整版).pptx VIP
- 《普通生物学》期末易考易错高频考试题库(附答案).pdf VIP
- SHT3225-2024 石油化工安全仪表系统安全完整性等级设计规范(报批稿).pdf VIP
- 新建饮料项目环评(新版环评)环境影响报告表.pdf VIP
- DDZY22-Z单相费控智能电能表格使用说明书.doc VIP
- 将军饮马模型(终稿)-将军饮马最大值模型[参考].pdf VIP
- 乐高wedo课件9.坦克3阶.pptx VIP
- 04D702-1 常用低压配电设备安装--.pdf VIP
- IS620P系列伺服应用手册-CANopen通讯篇.pdf
- 五年级下册英语作文训练-外研版(三起).docx VIP
原创力文档

文档评论(0)