数据分析实验报告三.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
课程名称 数据分析方法 课程编号 实验地点 系统建模与仿真实验室 SL110 实验时间 校外指导教师 无 校内指导教师 实验名称 实验 3 距离判别与贝叶斯判别分析 评阅人签字 成绩 实验数据与内容 我国山区某大型化工厂, 在厂区及邻近地区挑选有代表性的 15个大气取样点, 每日 4次同时抽取 大气样品, 测定其中含有的 6种气体的浓度, 前后共 4天, 每个取样点每种气体实测 16次, 计算 每个取样点每种气体的平均浓度, 数据见表 4-8。气体数据对应的污染地区分类见表 4-8中最后一列。 现有两个取自该地区的 4个气体样本,气体指标见表 4-8中后 4行,试解决以下问题: 1. 判别两类总体的协方差矩阵是否相等, 然后用马氏距离差别这 4个未知气体样本的污染类别, 并 计算回代误判率与交叉误判率;若两类总体服从正态分布,第一类与第二类的先验概率分别为 7/15 、 8/15 , 利用贝叶斯判别样本的污染分类。 2.先验概率为多少时,距离判别与贝时斯判别相同调整先验概率对判别结果的影响是什么 3.对第一类与第二类的先验概率分别为 7/15 、 8/15 ,计算误判概率。 一、实验目的 1.熟 掌握 MATLAB 件 行距离判 与 叶斯判 的方法与步 。 2.掌握判 分析的回代 判率与交叉 判率的 程。 3.掌握 叶斯判 的 判率的 算。 二、实验原理 1)在 MATLAB中, 行数据的判 分析命令 classify,其 用格式 : class=classify(sample,training,group ’) ’ type sample 数据的每一行指定到 集 training 的一个 中。 Sample 和 training 必 具有相同的列数。 group 向量包含从 1 到 数的正整数,它指明 集中的每一行属于哪一 。 group 和 training 必 具有相同的行数。 ’type是’可 , ’linear表示’ 体 多元正 体, ’quadratic与 ’mahalanobis。’ 函数返回 class,它是一个与 sample 具 有相同行数的向量。 Class的每一个元素指定 sample 中 元素的分 。通 算 sample training 中每一行的 氏距离, classify 函数决定 sample 中的每一行属于哪一个分 。 2) 叶斯判 方法步 第 1 步, 两个 体服从二元正 分布;第 2 步, 两个 体的 方差矩 相 等;估 两个 体的先 概率 p1、p2;利用 MATLAB 件 算。 3)回代 判率 G1,G2 两个 体, x1,x2?和 y1,y2?是分 来自 G1,G2 的 本, 以全体 本作 m+n 个新 品,逐个代入已建立的判 准 中判 其 属, 个 程称 回判。回判 果中若属于 G1 的 品被 判 属于 G2 的个数 N1 个,属于 G2 的 品被 判 属于 G1 的个数 N2 个, 判估 : P^=( N1+N2)/(m+n) 判率的回代估 易于 算。但是, p^是由建立判 函数的数据反 来用作 估准 的数据而得到的。所以有偏,往往比真 判率小。当 本容量 大 , p^可以 作 真 判率的一种估 。 4)交叉 判率估 是每次剔除一个 品,利用 m+n-1 个 本建立判 准 , 再利用建立的准 除的 本 行判 。 每个 品做如上分析,以其 判的比例作 判率,步 ; 从 体 G1 的 本开始, 剔除其中一个 品, 剩余的 m-1 个 品与 G2 中的全部 品建立判 函数; 用建立的判 函数 剔除的 品 行判 ; 重复以上步骤,直到 G1 中的全部样本依次被删除又进行判别,其误判的样品个数记为 N1* ; G2 的样品重复以上步骤, 直到 G2 中的全部样本依次被删除又进行判别, 其误判的样品个数记为 N2* 。 于是交叉误判率估计为: p^*=(N1*+N2*)/(m+n) 5)贝叶斯判别的有效性可以通过平均误判率来确定。判别准则的误判率在一定程 度上依赖于所考虑的各总体间的差异程度。各总体间差异越大,就越有可能建立有效的 判别准则。如果各总体间差异很小,做判别分析的意义不大。 三、 步 输入数据,判别两类总体的协方差阵是否相等,用马氏距离判断判别污染类别,计算 回代误判率与交叉误判率,贝叶斯判别污染分类。 四、 程原始 (数据、 表、 算等 ) 1、输入矩阵,计算协方差矩阵是否相等 A=[ ?? ] x=[ ] G1=A([1:4 7:8 15],:); G2=A([5:6 9:4 15],:); n1=size(G1,1); n2=size(G2,1); n=n1+n2; k=2

文档评论(0)

152****9446 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档