用身高和体重数据进行性别分类及实验报告.docVIP

用身高和体重数据进行性别分类及实验报告.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
用身高和体重数据进行性别分类及实验报告

用身高和体重数据进行性别分类的实验报告 基本要求 用FAMALE.TXT和MALE.TXT的数据作为训练样本集,建立Bayes分类器,用测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。 具体做法 (1)应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes分类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时可以考察采用不同先验概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1等)进行实验,考察对决策和错误率的影响。 (2)自行给出一个决策表,采用最小风险的Bayes决策重复上面的实验。 原理简述及程序框图 正态分布的监督参数估计 监督参数估计:样品所属的类别及类条件总体概率密度函数的形式为已知,而表征概率密度函数的某些参数是未知的。 本实验符合上述条件且在正态分布假设下估计分布密度参数故使用正态分布的监督参数估计 对于多元正态分别,其最大似然估计的结果为: 最小错误率Bayes分类器 在多元正态模型下的最小错误率角度来分析Bayes分类器 (1) 假设身高与体重不相关 令协方差矩阵次对角元素为零 判别函数可简化为 其中 , 具体算法步骤如下: 第一步将训练样本集数据转为矩阵FA,MA。 第二步分别对FA,MA求取协方差,令协方差矩阵次对角 元素为零,平均值并输入先验概率 第三步将第二步所得数值代入判别函数表达式得。 第四步将待测样本集数据转为矩阵T,将T中数值依次代 ,若,则判断其为第一类,反之,第二类。 (2) 假设身高与体重相关 判别函数可简化为 其中 , 具体算法步骤如下: 第一步将训练样本集数据转为矩阵FA,MA。 第二步分别对FA,MA求取协方差平均值并输入先验概率 第三步将第二步所得数值代入判别函数表达式得。 第四步将待测样本集数据转为矩阵T,将T中数值依次代,若,则判断其为第一类,反之,第二类。 最小风险Bayes分类器 (1)在已知先验概率和类条件概率密度,j=1, …c及给出带识别的x的情况下,根据Bayes公式计算后验概率: (2)利用后验概率及决策表,计算条件风险 (3),就是最小风险Bayes决策。 其中(1)中先验概率根据自行输入,类条件概率密度=,本实验 为二维二类,故d=2,(2)中决策表自行输入。 实验结果及分析总结 (1)用最小错误率Bayes决策 假设身高与体重相关(以训练样本建立判别函数) 性别为女生的先验概率 P(1) 性别为男生的先验概率 P(2) 训练样本判错的个数 N1 训练样本的错误率 η1 测试样本判错的个数 N2 测试样本的错误率 η2 0.1 0.9 24 24% 16 5.33% 0.17(1/6) 0.83(5/6) 19 19% 14 4.67% 0.4 0.6 13 13% 24 8% 0.5 0.5 12 12% 32 10.67% 0.75 0.25 14 14% 60 20.00% 由表可知: 对于训练样本,当女生先验概率为0.5时,判别错误率最小 对于测试样本,当女生先验概率为1/6时,判别错误率最小 故可推测用最小错误率Bayes决策假设身高与体重相关当女 生先验概率等于待测样本中女生样本占待测样本的概率时, 错误率最小,且越远离此概率,错误率越大。 最佳决策 对于训练样本,当女生先验概率为0.5 对于测试样本,当女生先验概率为1/6 假设身高与体重不相关(以训练样本建立判别函数) 性别为女生的先验概率 P(1) 性别为男生的先验概率 P(2) 训练样本判错的个数 N1 训练样本的错误率 η1 测试样本判错的个数 N2 测试样本的错误率 η2 0.1 0.9 19 19% 16 5.33% 0.17 0.83 14 14% 17 5.67% 0.4 0.6 11 11% 26 8.67% 0.5 0.5 12 12% 29 9.67% 0.75 0.

文档评论(0)

ipbohn97 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档