- 12
- 0
- 约1.89万字
- 约 70页
- 2024-02-27 发布于广东
- 举报
基本概念
类别可分离性判据
特征选择的最优和次优算法
特征提取之PCA算法
特征提取之K-变换
基于PCA变换的iris数据分类
基本概念
【问题的提出】
特征
每一个特征对应特征空间的一个维度
特征越多,特征空间的维度越高
特征空间
问题1:如果用颜色、尺寸与重量组成的特征空间来区分苹果与
梨,这两类水果在特征空间中会如何分布?
问题2:如果用这个特征空间来区分红苹果与樱桃,这两类水
果在特征空间中又会如何分布?
原则:在保证分类效果的前提下用尽量少的特征来完成分类
【基本概念】
【特征选择】
一是对特征的评价,也就是怎样衡量一组特征对分类的有效性
二是寻优的算法,就是怎样更快地找到性能最优或比较优的特征组合。
定义与错误率有一定关系但又便于计算的类别可分性准则J,
ij
用来衡量在一组特征下第i类和第j类之间的可分程度。
对判据的要求:
1)判据应该与错误率有单调关系,这样才能较好的反映
分类目标。
2)当特征独立时,判据对特征应该具有可加性。
3)判据应该具有以下度量特性:
,当i≠j时
,当i=j时
4)理想的判据应该对特征具有单调性,加入新的特征不
会使判据减小
类别可分离性判据
计算各类特征向量之间的平均距离,考虑最简单的两
类情况,可以用两类中任意两两样本间的平均来代表两个
类之间的距离。
基本思想
判据的表达式
类间的平均距离为JD:
1cc1ninj
(i)(j)
JPPx,x
Dijkl
2nn
i1j1ijk1l1
其中
P,P:先验概率
ij
:x与x之间的距离度量
kl
T
(x,x)(xx)(xx)
klklkl
矩阵形式的类间距离的表达式JD:
定义:类均值向量:
总均值向量:
c
~
类间离散度矩阵S的估计:SP(mm)(mm)T
bbiii
您可能关注的文档
- (43)--10-5开关型稳压电路.ppt
- (43)--第二章 贝叶斯决策理论模式识别.pdf
- (44)--7-6正弦波振荡电路.ppt
- (44)--10.4 Sour Pres - China美式酸啤酒的科学与艺.pdf
- (44)--M6-3_6.3.2 有源低通滤波器电路设计.pdf
- (44)--第三章 概率密度函数模式识别.pdf
- (44)--静态分析—估算法.ppt
- (45)--10.5 IPA酿造技术啤酒工艺学.pdf
- (45)--M6-3_6.3.2 有源低通滤波器电路设计.pdf
- (45)--第四章 线性分类器模式识别.pdf
- 全过程工程管理造价咨询工程监理项目服务方案投标方案(技术部分).doc
- 招标代理服务投标技术服务方案(技术方案).doc
- AI大模型与AIGC技术在公安领域的应用解决方案(99页 PPT).pptx
- 工业4.0智能制造数字工厂规划方案.pptx
- 树立社会主义核心价值观.docx
- 三年(2023-2025)中考历史真题分类汇编(全国)专题21 科技文化与社会生活(解析版).docx
- 2025年中考道德与法治真题完全解读(吉林卷).pdf
- 2025年中考道德与法治真题完全解读(安徽卷).pdf
- 三年(2023-2025)中考历史真题分类汇编(全国)专题14 人民解放战争(解析版).pdf
- 三年(2023-2025)广东中考历史真题分类汇编:专题03 中国近代史(八年级上册)(解析版).docx
最近下载
- 云南乌铜走银工艺品艺术符号的现代呈现途径与思路.doc VIP
- GB_T 43852-2024 冷热水用钢增强塑料复合压力管.docx VIP
- 各级配电箱接线系统图.docx VIP
- 组织学和胚胎学泌尿系统.pdf VIP
- 2025及未来5年中国碳酸锂行业市场调研及行业投资策略研究报告.docx
- DB12_T598_3-2024建设项目用地控制指标第3部分:公用设施项目.pdf VIP
- 卫生管理正副高级卫生高级资格理论考试试题库(含答案).docx
- 唐古特白刺NtP5CS和NtCIPK2基因克隆与功能解析:解锁植物耐旱奥秘.docx
- 部编版小学五年级上册道德与法治第八课《美丽文字民族瑰宝》测试题附答案(共3套).pdf VIP
- 《生物材料与医疗应用》课件.ppt VIP
原创力文档

文档评论(0)