- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
教学课件课件PPT医学培训课件教育资源教材讲义
而现实往往是: 我们不知道每个x属于哪个分布,也就是说z是我们观察不到的,z是隐藏变量(latent variable) 实际问题 为了将k个高斯分布用一个随机变量表示 可以采用1-of-K的表示法,例如k=3时: ?z1=1表示(1 0 0), 并p(z1=1)=π1, ?z2=1表示(0 1 0), 并p(z2=1)=π2, ?z3=1表示(0 0 1), 并p(z3=1)=π3 这里的粗体z表示的是形如(1 0 0)这样的向量 ? 隐藏变量Z ?将Z引入后 最终得到 隐藏变量与混合高斯分布? 在后面的讨论中我们约定P(x)和P(x|参数)是相同的。例如混合高斯分布中 P(x)=P(x|π,μ,Σ) 另外,对于观察集{X}中的各个观察值xi, 我们认为相互之间独立。特别的,如果x1,x5,x9来自于同一高斯分布,我们认为他们满足i.i.d.(独立同分布) 前面说过,在简化问题中我们观察到的是{X,Z},因此根据以下两个式子 ? 可以得到 N是数据集X的大小 两个问题的比较 ?回忆我们的最终目标是:找一组合适的π,μ,Σ,满足数据集{X}的分布。 ?即:maximum log-likelihood ?对原始问题,我们要找π,μ,Σ,使下式最大 ? 对简化问题,同样要找π,μ,Σ,使下式最大 Znk表示Zn的第k个元素 后者的ln直接作用于正态分布,使正态分布由连乘的形式变为连加的形式 计算复杂度 为了最大化上式,由于Znk已知,我们可以把上式按观察到的(x,z)分为k组: ??????????????????????? 由于这k组分布相互独立,我们只需要分别最大化每一组Σ 简化问题的计算1 简化问题的计算2 至此我们已经解决了简化问题的参数求解。但是,实际上我们往往不知道Znk,即Z往往是隐藏变量。也就无法运用前面简化问题的算法 ?虽然不知道Znk,但是我们可以用它的期望E[Znk]去估计Znk 实际问题 ?根据前面提到的这两个公式,及贝叶斯公式 可以得到Z的后验概率 Znk的期望估计1 ? 代入简化问题中的 现在我们要使该式最大,也就是期望值最大(Expectation Maximum-EM ) Znk的期望估计2 4.3谱系聚类法(层次、系统聚类法) 条件及约定 设待分类的模式持征矢量集为{x1,x2,…,xN} ,Gi(k)表示第k次合并时的第i类。 基本思想 视N个模式各成为一类,计算类与类之间的距离,选择距离最小的一对合并成一个新类,计算在新的类别分划下各类之间的距离,再将距离最近的两类合并,直至所有模式聚成两类为止。 算法步骤 (1)初始分类。令k=0,每个模式自成一类,即Gi(k)={xi}(i=1,2,…N) (2)计算各类间的距离Dij,由此生成一个对称的距离矩阵D(k)=(Dij)m*m,m为类的个数(初始时m=N) (3)找出前一步求得的矩阵D(k)中的最小元素,设它是Gi(k)和Gj(k)间的距离,将其两类合并成一类,于是产生新的聚类G1(k+1) G2(k+1) …,令k=k+1,m=m-1 (4)检查类的个数:如果类数m大于2,转至(2);否则,停止。 如果某一循环中具有最小类间距离不止一个类对,则对应这些最小距离的类对可以同时合并。上述算法步骤给出了从N类至2类的聚类过程。 改进: 可将类间距离门限T作为停止条件,当D (k)中最小阵元大于T时,聚类过程停止; 也可将预定的类别数目作为停止条件,在类别合并过程中,类数等于预定值时,聚类过程停止。 例 给出6个样本待征矢量如下,按最小距离原则进行聚类。 x1 =(0,3,1,2,0)’ x2=(1,3,0,1,0)’ x3=(3,3,0,0,1)’ x4=(1,1,0,2,0)’ x5=(3,2,l,2,1)’ x6=(4,1,1,1,0)’ 解(1)初始时,每一样本自成一类 G1 (0) ={x1} G2 (0) ={x2} G3 (0) ={x3} G4 (0) ={x4} G5 (0) ={x5} G6 (0) ={x6} 按欧氏距离计算距离矩阵D(0)。 表1 D(0) (2) D(0)中最小阵元为 sqrt(3) ,它是G1 (0)与G2 (0)之间的距离,将它们合并为一类,得一新的分类为 G1 (1) ={ G1 (0), G2 (0) }={x1, x2} G2 (1) =G3 (0) G3 (1) = G4 (0)
您可能关注的文档
最近下载
- (高清版)-B-T 34590.2-2022 道路车辆 功能安全 第2部分:功能安全管理.pdf VIP
- 水果超市水果产期及收货标准.xls VIP
- 环境中抗生素抗性基因传播途径.docx VIP
- 2025年监理员考试题库及答案.docx VIP
- Hopewind禾望HV510系列高性能变频器用户手册.pdf
- 2025年度中秋国庆节前安全教育培训.pptx
- 多肉拼盘.pptx VIP
- 养生保健品商业计划书.pptx
- 第六章 智能网联汽车_3 课件(共33张PPT)- 《汽车文化》同步教学(上海交大版).pptx VIP
- 2025-2026学年小学劳动苏科版2023二年级上册-苏科版(2023)教学设计合集.docx
文档评论(0)