- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模式識别实验报告
院 系: 计算机科学学院
专 业: 智能科学与技术
年 级: 2012 级
课程名称: 模式识别
组 号: 13组
组 员: 徐灿 马卿
指导教师: 孙阳光老师
2014年12月30日
年级 2012级 学号 2012213855 2012213875 专业 智能科学
与技术 姓名 徐灿 马卿 实验时间 2014.10.8 实验地点 9#206 实验
名称 用身高和/或体重数据进行性别分类的实验 实验
类型 设计型 综合型 创新型 √ 实
验
目
的
或
要
求 基本要求:
用PR_Exp1_Data_1.TXT 和PR_Exp1_Data_2.TXT 的数据作为训练样本集,建立Bayes 分类器,用PR_Exp1_Data_3.TXT测试样本数据对该分类器进行测试。调整特征、分类器等方面的一些因素,考察它们对分类器性能的影响,从而加深对所学内容的理解和感性认识。
具体做法:
1. 应用单个特征进行实验:以(a)身高或者(b)体重数据作为特征,在正态
分布假设下利用最大似然法或者贝叶斯估计法估计分布密度参数(只利用训
练数据估计密度),建立最小错误率Bayes 分类器,写出得到的决策规则,将
该分类器应用到测试样本,考察测试错误情况。在分类器设计时可以考察采
用不同先验概率(如0.5 对0.5, 0.75 对0.25, 0.9 对0.1 等)进行实验,考察对
决策规则和错误率的影响。
2. 应用两个特征进行实验:同时采用身高和体重数据作为特征,分别假设二者
相关或不相关,在正态分布假设下估计概率密度,建立最小错误率Bayes 分
类器,写出得到的决策规则,将该分类器应用到训练/测试样本,考察训练/
测试错误情况。比较相关假设和不相关假设下结果的差异。在分类器设计时
可以考察采用不同先验概率(如0.5 vs. 0.5, 0.75 vs. 0.25, 0.9 vs. 0.1 等)进行
实验,考察对决策和错误率的影响。
3. 自行给出一个决策表,采用最小风险的Bayes 决策重复上面的某个或全部实
验。
需要用到的数据文件:
训练和测试样本集:
PR_Exp1_Data_1.txt
124 个同学的身高、体重、性别数据(40 个女生、84 个男生)
PR_Exp1_Data_2.txt
328 个同学的身高、体重、性别数据(78 个女生、250 个男生)
PR_Exp1_Data_3.txt
90 个同学的身高、体重、性别数据(16 个女生、74 个男生)
实
验
代
码
(
身
高
或
者
体
重
)
?clear all;
load datasetf1.txt; %读入样本数据男生
load datasetm1.txt; %读入样本数据女生
%样本的分析
figure;
for i=1:250
if(i79)
plot(datasetf1(i,2),datasetf1(i,1),r+);
end
plot(datasetm1(i,2),datasetm1(i,1),k*);
hold on;
end
title(样本数据);
xlabel(体重(Kg)),ylabel(身高(cm));
legend(男生,女生);
%打开文件(测试文件和训练文件)此处选择文件为第三组测试文件
fid=fopen(dataset3.txt,r);
test1=fscanf(fid,%f %f %s,[3,inf]);%文件读取格式
test=test1;
fclose(fid);
Fmean = mean(datasetf1);
Mmean = mean(datasetm1);
Fvar = std(datasetf1);
Mvar = std(datasetm1);
preF = 0.5; %先验概率的设定和修改
preM = 0.5;
error = 0;
Nerror = 0; %错误个数和错误率的设定
%身高的决策
sprintf(%s,样本数为90时P0.5——0.5:) %测试或者训练样本的个数
figure;
for i = 1:90 %测试或者训练样本的个数
PFheight = normpdf(test(i,1),Fmean(1,1),Fvar(1,1)) ;
文档评论(0)