- 17
- 0
- 约1.08万字
- 约 18页
- 2016-11-28 发布于重庆
- 举报
用身高和體重数据进行性别分类的实验报告
用身高和体重数据进行性别分类的实验报告(二)
基本要求
1、试验非参数估计,体会与参数估计在适用情况、估计结果方面的异同。
2、试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分类器进行比较。
3、体会留一法估计错误率的方法和结果。
二、具体做法
1、在第一次实验中,挑选一次用身高作为特征,并且先验概率分别为男生0.5,女生0.5的情况。改用Parzen窗法或者kn近邻法估计概率密度函数,得出贝叶斯分类器,对测试样本进行测试,比较与参数估计基础上得到的分类器和分类性能的差别。
2、同时采用身高和体重数据作为特征,用Fisher线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。将训练样本和求得的决策边界画到图上,同时把以往用Bayes方法求得的分类器也画到图上,比较结果的异同。
3、选择上述或以前实验的任意一种方法,用留一法在训练集上估计错误率,与在测试集上得到的错误率进行比较。
三、原理简述及程序框图
1、挑选身高(身高与体重)为特征,选择先验概率为男生0.5女生0.5的一组用Parzen窗法来求概率密度函数,再用贝叶斯分类器进行分类。
以身高为例
本次实验我们组选用的是正态函数窗,即,窗宽为(h是调节的参量,N是样本个数) ,(d表示维度)。因为区域是一维的,所以体积为。Parzen公式为。
故女生的条件概率密度为
男生的条件概率密度为
根
原创力文档

文档评论(0)