基于图的半监督学习笔记.docVIP

下载本文档

18
0
约1.11千字
约 6页
2020-08-30 发布于浙江
举报
版权申诉

基于图的半监督学习笔记.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第一章基于图的半监督学习第一节基本概念 1、机器学习的分类 ⑴、监督：训练样本＝已标记样本（Labeled，已标记数据） ⑵、无监督：训练样本＝未标记样本（Unlabeled，未标记数据） ⑶、半监督：训练样本＝已标记＋未标记（训练样本丢失部分信息） 2、训练集：第二节基于图的半监督学习 1、思想：相似顶点尽可能赋予相同标记，以保证图的标记尽可能平滑 2、基本概念 ⑴、定义：图 ⑵、解释：顶点集 ⑶、解释：边集 ⑷、解释：边的权重【表示顶点之间的相似度】 3、基本概念 ⑴、定义：相似矩阵 ⑵、解释：， ⑶、解释：有边相连；无边相连 3、典例：全连图（Fully Connected Graph） ⑴、定义：【高斯核/径向基函数核】 ⑵、解释：带宽系数【用于控制权值的减缓程度】 ⑶、解释：随着欧氏距离的增加而减少第三节重要算法 1、标记传递算法：已标记数据近邻未标记数据次级近邻未标记数据 2、最小割（MinCut） ⑴、概念：正例样本看作源（Source），反例样本看作汇（Sink） ⑵、思想：寻找具有最小权重和的边集，以切断从源到汇的所有连接 ⑶、公式： ⑷、解释：损失函数【已标记数据被错误标记的代价】 ⑸、解释：正则项【保证图的标记尽可能平滑】 ⑹、缺点：硬划分（Hard Classification，并未考虑样本的分类概率） ⑺、缺点：可能有多个解 3、调和函数（Harmonic function） ⑴、定义：调和函数 ⑵、解释：已标记数据【与原始标记一致】，未标记数据【加权平均】 ⑶、公式： ⑷、解释：首先引入调和函数，然后将预测标记松弛到实数域，以保证存在唯一解 ⑸、解释：最后输出标记： 4、图Laplacian矩阵 ⑴、定义： ⑵、解释：相似矩阵 ⑶、解释：对角矩阵，其中 ⑷、性质：假设：那么： ⑸、证明：关键：非负对称矩阵第四节流形正则化 1、 SVM中的正则化思想 ⑴、目标函数： ⑵、解释： ⑶、解释：损失函数【典例：平方损失函数，Hinge损失函数】 ⑷、解释：Mercer核 ⑸、解释：再生核Hilbert空间【Reproducing Kernel Hilbert Space】 2、流形正则化框架 ⑴、目标函数： ⑵、解释： ⑶、解释：含有已标记和未标记数据的正则项，以体现数据分布的内在结构 ⑷、典例： 3、两种损失函数 ⑴、平方损失函数（Laplacian正则化最小二乘法）目标函数： ⑵、Hinge损失函数（Laplacian SVM）目标函数：