数据预处理摘要.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Relief 对象编号 A B C D E F Class 1 0 0 0 0 0 1 0 2 0 0 0 1 1 1 0 3 0 0 1 0 0 1 0 4 0 0 1 1 0 0 1 5 0 1 0 0 0 1 0 6 0 1 0 1 1 1 0 7 1 0 1 0 0 1 1 8 0 1 1 1 0 0 1 9 1 0 1 1 0 0 1 10 1 1 0 0 0 0 1 7.5.2 特征提取 主成分分析,PCA(principle component analysis)最早由Karl Pearson于1901年提出,后经Harold Hotelling发展,是一种经典的统计方法。 它通过对原有变量(属性、特征)进行线性变换,提取反映事物本质的新的变量,同时去除冗余、降低噪音,达到降维的目的。 PCA: 主成分分析 给定数据集D,包括n个对象的数据,每个对象由m个属性A1、A2、…、Am描述。每个对象可以看作m维空间中的一个点。 sepal_length sepal_width petal_length petal_width type 5.7 2.9 4.2 1.3 Iris-versicolor 6.2 2.9 4.3 1.3 Iris-versicolor Feature extraction-PCA ? PCA 计算协方差矩阵C的特征根和主成分矩阵,保留前q 个最大的特征根及对应的特征向量,其中最大特征根对应的特征向量称为第一主成分,第二大特征根对应的是第二主成分,… 构造主成分矩阵P,其中其列向量pi是第i个主成分 假设降序排列的特征根为 ,第i个主成分的贡献率的计算如下: 计算最终降维后的数据集Y,Y=XP,其中P是主成分矩阵,X是步骤1中得到的矩阵。 PCA sepal_length sepal_width petal_length petal_width 5.7 2.9 4.2 1.3 6.2 2.9 4.3 1.3 5.7 2.8 4.1 1.3 6.3 3.3 6.0 2.5 5.8 2.7 5.1 1.9 7.1 3.0 5.9 2.1 5.1 3.8 1.6 0.2 4.6 3.2 1.4 0.2 5.3 3.7 1.5 0.2 PCA 特征根 贡献率 累积贡献率 4.22484 0.92462 0.92462 0.24224 0.05302 0.97763 0.07852 0.01719 0.99482 0.02368 0.00518 1 新的特征是原有属性的线性组合,设新的特征为y1和y2,则 y1=0.362sepallength-0.082sepalwidth+0.857petallength+0.359petalwidth y2=-0.657sepallength-0.73sepalwidth+0.176petallength+0.075petalwidth * * * * * * Principles and Applications of Business Intelligence Chap 7 : 数据预处理 * Principles and Applications of Business Intelligence Chap 7 : 数据预处理 * Introduction to 商务智能方法与应用 Principles and Applications of Business Intelligence Chap 7 : 数据预处理 * Principles and Applications of Business Intelligence Chap 7 : 数据预处理 * Principles and Applications of Business Intelligence Chap 7 : 数据预处理 * Principles and Applications of Business Intelligence Chap 7 : 数据预处理 * Principles and Applications of Business Intelligence Chap 7 : 数据预处理 * 第7章 数据预处理 Chapter 7: Data Preprocessing 主要内容 7.1 数据预处理的原因和任务 7.2 数据规范化 7.3 数据离散化 7.1 数据预处理的原因和任务 (1)数据离散化(discretization) (2)数据规范化(normalization) (3) 数据清洗(data cleaning) (4)特征提取与特征选择 7.2 数据规范化 数据规范化又称标准化(standardiza

文档评论(0)

boss + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档