- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
中国矿业大学计算机科学与技术学院第五章非监督学习法中国矿业大学计算机科学与技术学院第五章非监督学习法*中国矿业大学计算机科学与技术学院(20)*第1页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*将数据按它们表现出的共性进行划分有两种基本方法,从大体上去把握这种不同方法的特点。在实用中C均值算法等为代表的动态聚类方法,以及分级聚类方法是常用的方法,要重点掌握。学习中要掌握从易而难的学习方法,如对数据相似度的度主方法最容易的是欧氏距离,然后再扩展到种种非欧氏距离的方法。第2页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*本章重点1、什么叫非监督学习方法,什么叫有监督学习方法?2、非监督学习方法主要的用途。3、非监督学习方法的两种基本处理方法:按分布密集程度划分,与按相似度聚类划分。4、按分布密度程度划分的基本方法。5、动态聚类方法与分级聚类方法的概念。6、典型的动态聚类方法C-均值算法与ISODATA算法。7、使用非欧氏距离计算相似度的动态聚类方法。8、分级聚类方法。第3页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*1、非监督学习方法与监督学习方法概念的区别。2、按分布密集程度划分的基本方法。本章难点3、动态聚类方法——迭代修正的概念。4、分级聚类方法。第4页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*1、掌握非监督学习方法的概念、用途。本章学习目标2、了解非监督学习方法对数据划分有两种基本方法。3、掌握以c-均值算法,ISODATA算法为代表的动态聚类方法。第5页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*1、如果给机器一维数据,机器能自动地找出其中存在的规律吗?2、有人把非监督学习方法叫无教师的学习,而把第二章、第三章讨论的内容成为有监督学习,又称有教师的学习,你知道谁是教师吗?教师的作用体现在哪里?课前思考题3、机器能总结数据中存在的哪些规律呢?第6页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*4、机器能总结天气变化的规律,给出天气预报吗?5、机器能炒股吗?6、非监督学习方法与数据有关系吗?第7页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*§5.1引言有监督的学习方法无监督的学习方法人们日常生活中经常要观察事物与分析事物,从中寻找其规律性,这就是非监督学习方法要解决的问题。第8页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*第9页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*非监督学习与有监督学习方法的以下几种不同点:1、有监督学习方法必须要有训练集与测试样本。而非监督学习没有训练集这一说,只有一组数据,在该组数据集内寻找规律。2、有监督学习方法的目的就是识别事物,识别的结果表现在给待识别数据加上了标号。而非监督学习方法只有要分析的数据集本身,预先没有什么标号。第10页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*3、非监督学习方法在寻找数据集中的规律性,这种规律性并不一定要达到划分数据集的目的,也就是说不一定要“分类”。这一点是比有监督学习方法的用途要广泛。4、用非监督学习方法分析数据集的主分量与用K-L变换计算数据集的主分量又有区别。应该说后者从方法上讲不是一种学习方法。因此用K-L变换找主分量不属于非监督学习方法,即方法上不是。而通过学习逐渐找到规律性这体现了学习方法这一点。在人工神经元网络中寻找主分量的方法属于非监督学习方法。第11页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*无监督学习方法可以分成两大类:1、基于概率密度函数估计的直接方法,指设法找到各类别在特征空间的分布参数再进行分类。2、基于样本间相似性度量的间接聚类方法,其原理是设法定出不同类别的核心或初始类核,然后依据样本与这些核心之间的相似性度量将样本聚集成不同类别。第12页,共20页,星期日,2025年,2月5日*中国矿业大学计算机科学与技术学院(20)*§5.2单峰子类的分离方法每个单峰区域则被看作不同的决策域。落在同一单峰区域的待分类样本就被划分成同一类,称
原创力文档


文档评论(0)