- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 41 卷 第 1 期 计 算 机 研 究 与 发 展 Vol 41 ,No 1
2004 年 1 月 J OURNAL OF COMPU TER RESEARCH AND DEV ELOPMEN T Jan 2004
基于分层高斯混合模型的半监督学习算法
孙广玲 唐降龙
( 哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001)
(laughdoll827 @sinacom)
摘 要 提出了一种基于分层高斯混合模型的半监督学习算法 半监督学习算法的学习样本包括已标记类别样本和未
标记类别学习样本 如用高斯混合模型拟合每个类别已标记学习样本的概率分布 ,进而用高斯数为类别数的分层高斯混
( )
合模型拟合全部 已标记和未标记 学习样本的分布 ,则形成为一个基于分层的高斯混合模型的半监督学习问题 基于
EM 算法 ,首先利用每个类别已标记样本学习高斯混合模型 ,然后以该模型参数和已标记样本的频率分布作为分层高斯
混合模型参数的初值 ,给出了基于分层高斯混合模型的半监督学习算法 以银行票据印刷体数字识别做实验 ,实验结果
表明 ,本算法能够获得较好的效果
关键词 半监督学习; 高斯混合模型 ; 分层高斯混合模型 ; EM 算法
中图法分类号 TP181
A SemiSupervised Learning Algorithm Based on a Hierarchical GMM
SUN GuangLing and TAN G XiangLong
( )
School of Computer Science and Technology , Harbin Institute of Technology , Harbin 150001
Abstract A semisupervised learning algorithm based on a hierarchical GMM is proposed The learning
samples in semisupervised learning are a hybrid of labeled and unlabeled samples If GMM is employed to
fit the distribution of labeled samples in each class and a hierarchical GMM whose Gaussian number is the
class number is employed to fit the distribution of the whole learning samples (including labeled and unla
beled samples) , then a semisupervised learning problem based on a hierarchical GMM has emerged Based
on EM algorithm , by learning the labeled samples of each class , a GMM is obtained first Then by taking
the parameters of the obtained GMM and frequencies of labeled samples as initials , a semisupervised learn
ing algorithm based on a hierarchical GMM is presented Printed numerals in a bank check are tested in the
experiments and the results shows the good effects of the propose
原创力文档


文档评论(0)