- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
周志华《机器学习》第十三章课后习题
参考解答
13.1推导式(13.5)~(13.8)(生成式半监督高斯混合模型)
1.前提与符号定义
•数据集:有标记样本L\{(\boldsymbol{x}_1,y_1),...,(\boldsymbol{x}_l,y_l)\},无标记样本
U\{\boldsymbol{x}_{l+1},...,\boldsymbol{x}_{l+u}\},总样本数ml+u;
•模型假设:数据来自高斯混合模型,每个类别c\in\mathcal{Y}对应一个高斯分布
\mathcal{N}(\boldsymbol{\mu}_c,\Sigma_c),类别先验为\pi_cP(yc);
•目标:最大化联合似然P(L,U|\Theta),其中\Theta\{\pi_c,\boldsymbol{\mu}_c,
\Sigma_c\}_{c\in\mathcal{Y}}。
2.似然函数构建
联合似然函数为有标记样本似然与无标记样本边际似然的乘积:
P(L,U|\Theta)\prod_{(\boldsymbol{x},y)\inL}P(\boldsymbol{x},y|\Theta)\cdot
\prod_{\boldsymbol{x}\inU}P(\boldsymbol{x}|\Theta)
其中:
•有标记样本:P(\boldsymbol{x},yc|\Theta)\pi_c\cdot\mathcal{N}(\boldsymbol{x}|
\boldsymbol{\mu}_c,\Sigma_c);
•无标记样本:P(\boldsymbol{x}|\Theta)\sum_{c\in\mathcal{Y}}\pi_c\cdot
\mathcal{N}(\boldsymbol{x}|\boldsymbol{\mu}_c,\Sigma_c)(对类别求边际)。
3.EM算法推导(核心步骤)
(1)E步:计算隐变量后验(无标记样本的类别分布)
对无标记样本\boldsymbol{x}\inU,定义隐变量z_{\boldsymbol{x},c}1表示\boldsymbol{x}
属于类别c,后验概率为:
\gamma(z_{\boldsymbol{x},c})P(yc|\boldsymbol{x},\Theta)\frac{\pi_c\cdot
\mathcal{N}(\boldsymbol{x}|\boldsymbol{\mu}_c,\Sigma_c)}{\sum_{c\in\mathcal{Y}}\pi_c
\cdot\mathcal{N}(\boldsymbol{x}|\boldsymbol{\mu}_c,\Sigma_c)}\tag{13.5}
(此即式13.5,对应无标记样本的类别置信度)。
(2)M步:最大化期望似然(更新参数)
期望似然\mathbb{E}[\lnP(L,U,z|\Theta)]的最大化分三个参数:
①类别先验\pi_c(式13.6)
期望似然中\pi_c的贡献项为:
\sum_{(\boldsymbol{x},yc)\inL}\ln\pi_c+\sum_{\boldsymbol{x}\inU}\sum_{c\in
\mathcal{Y}}\gamma(z_{\boldsymbol{x},c})\ln\pi_c
subjectto\sum_{c\in\mathcal{Y}}\pi_c1。
用拉格朗日乘数法求解,得:
\pi_c\frac{1}{m}\left(l_c+\sum_{\boldsymbol{x}\inU}\gamma(z_{\boldsymbol{x},c})
\right)\tag{13.6}
其中l_c|\{(\boldsymbol{x},y)\inL|yc\}|(有标记样本中类别c的数量),分母ml+u为
总样本数。
②均值\boldsymbol{\mu}_c(式13.7)
高斯分布均值的贡献项为:
-\frac{1}{2}\sum_{(\boldsymbol{x},yc)\inL}(\boldsymbol{x}-\boldsymbol{\mu}_c)^T
\Sigma_c^{-1}(\boldsymbol{x}-\boldsymbol{\mu}_c)-\frac{1}{2}\sum_{\boldsymbol{x}\inU}
\gamma(z_{\boldsymbol{
您可能关注的文档
最近下载
- 电化学储能电站并网运行验收全套表格.pdf VIP
- T CAME 30-2021 复合手术室建设标准.docx VIP
- 内地新疆高中班学生转学、休学审核表.pdf VIP
- GBT 18015.1-2017 数字通信用对绞或星绞多芯对称电缆 第1部分:总规范.pdf
- TJAASS 151-2024 水稻碳足迹评价方法.pdf VIP
- 新解读《GB_T 18015.1-2017数字通信用对绞或星绞多芯对称电缆 第1部分:总规范》最新解读.docx VIP
- 2022年苏州大学计算机科学与技术专业《计算机网络》科目期末试卷B(有答案).docx VIP
- 检验科仪器设备故障应急预案.docx VIP
- (27页PPT)K12教师试岗培训工作安排及其说明.pptx VIP
- 保姆带小孩合同协议书例文.pdf VIP
原创力文档


文档评论(0)