第14讲基于非参数的技术的分类方法.pptVIP

下载本文档

3
0
约 62页
2017-04-06 发布于北京
举报
版权申诉

第14讲基于非参数的技术的分类方法.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第14讲基于非参数的技术的分类方法

第16讲基于非参数技术的分类方法要点: 基本问题非参数化方法的两种基本思路类条件概率密度的估计后验概率的估计基本问题类条件概率密度p(X|?j)对基于统计决策的分类来说是非常关键的，如果已知其参数形式，就可以用极大似然估计和贝叶斯估计等方法估计p(X|?j)。如果事先不知道对p(X|?j)的数学形式，仅仅给定一个充分大的独立抽取的样本集，那么应该怎样估计p(X|?j)？或者怎样估计后验概率p(?j|X)？返回非参数化方法的两种基本思路 1.如何从训练样本中估计类条件概率密度p(X|?j)。在结果可靠时，可以把估计结果当作真正的p(X|?j)。 2.如何利用训练样本直接估计后验概率p(?j|X)？在结果可靠时，可以直接利用p(?j|X)进行分类。返回类条件概率密度的估计基本思想及其数学描述前提条件和约束关系 Parzen窗方法 kn-近邻估计方法返回基本思想利用样本落在某点邻近区域中的频率除以该区域的体积来估计该点的概率密度。返回基本思想的数学描述设p(X)表示待估计的连续概率密度，样本集D={X1,X2,…,Xn}根据p(X)独立抽取: 计算一个样本落在某区域R中的概率P 计算k个样本落在区域R中的概率Pk 用频率和体积估计概率密度p(X) 返回计算单样本落在某区域中的概率一个样本落在区域R中的概率P为计算示意图返回区域概率示意图返回计算多样本落在某区域中的概率 k个落在区域R中的概率为其中k的期望值为概率P=E(k)/n?k/n 返回用频率和体积估计概率密度如果包含X的区域R足够小，则有：如果定义样本落在R中的频率，那么有: 示意图返回概率密度估计示意图返回前提条件概率密度的估计为：如果样本数n固定，那么当V充分小时，落在区域中的样本数k将为零，从而p(X)?0，因此需要在k、n和V之间建立一定的约束关系。返回约束关系构造一系列包含X的区域Rn(n=1,2,…)，对Rn使用n个样本，Vn表示Rn的体积，kn表示落在Rn中的样本个数，pn (X)表示对p(X)的第n次估计: 如果要求pn (X)表示p(X)，就必须满足3个条件。返回 3个条件 (1) : 保证区域均匀收敛和平均估计P/V收敛于 p(X)。 (2) : 只对p(X)?0的点有意义，可使频率在概率的意义上收敛于概率P。 (3) : 是pn(X)收敛于p(X)的一个必要条件。返回 Parzen窗方法选择区域序列Rn的方法选择窗函数?(u)的方法 pn(X)的计算及其冲击表示 pn(X)的基本性质 Parzen窗方法举例返回选择区域序列Rn的方法根据某一个确定的体积函数,比如来逐渐收缩一个给定的初始区域。通常Rn取为d维超立方体，用hn表示超立方体的边长，那么其体积就是：返回体积函数示意图返回选择窗函数的方法窗函数?(u)必须满足下面两个条件： (1) ?(u)?0 (2) 常用窗函数有：方窗函数，三角窗函数，正态窗函数返回方窗函数方窗函数?(u)表示一个以原点为中心的单位超立方体返回三角窗函数返回正态窗函数返回 pn(X)的计算如果取?(u)为方窗函数，取Rn为d维超立方体，那么有：因此落在超立方体中的样本个数是：从而返回 pn(X)的冲击表示如果定义冲击响应函数(或狄拉克函数)为则可以把pn(X)表示成冲击响应的叠加：返回 pn(X)的基本性质 (1) pn(X) ?0 且试证明(1) 如果用和表示pn(X)的均值和方差，那么在一定条件下： (2) 且试证明(2) 返回证明(1) 返回 pn(X)收敛到p(X)应满足的条件 (1) (2) (3) (4) 返回证明(2) 返回 Parzen窗方法举例对混合双均匀分布的估计对一维正态分布的估计对二维正态分布的估计对混合三角均匀分布的估计返回对混合均匀分布的估计设，假定待估计的概率密度函数是两个均匀分布密度函数的混合，即：窗函数为正态窗函数，h1取0.25、1和4三个