- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
信息技术课件
人工智能
无师自通
分门别类
6.1当人工智能未曾听说花的名字6.2物以类聚:鸢尾花的K均值聚类6.3人以群分:相册中的人脸聚类6.4层次聚类与生物聚类6.5本章小结
6.1当人工智能未曾听说花的名字监督学习需要训练数据的标注信息的学习过程无监督学习没有标注信息的学习过程为鸢尾花分类
6.1当人工智能未曾听说花的名字监督学习无监督学习在类别信息的指导下,我们很容易找到一条最优的直线,将特征空间一分为二,使变色鸢尾和山鸢尾各居一隅。没有类别信息的指导,我们很难判断哪一些鸢尾花是相同品种,哪一些鸢尾花是不同品种,更别提使用一条直线为鸢尾花分类了。
6.1当人工智能未曾听说花的名字在无监督学习的情况下如何为鸢尾花分类?已知,同一品种的鸢尾花,花瓣宽度与花瓣长度相近。特征空间里相近的两个样本点,很可能是同一种鸢尾花。特征空间里的鸢尾花大概聚集成了两簇,分别记为A类鸢尾花与B类鸢尾花。根据鸢尾花在特征空间的聚集情况进行分类
6.1当人工智能未曾听说花的名字聚类(clustering)通过分析数据在特征空间的聚集情况,将一组数据分成不同的类。聚类旨在把一群样本分为多个集合,使得同一集合内的元素尽量“相似”或“相近”。聚类的一个重要假设,就是特征空间里相近的两个样本,很可能属于同一个类别,这一假设不一定在所有数据中都成立。聚类作为一种无监督学习过程,不需要数据的类别标注,甚至不需要预先定义类别。
6.2物以类聚:鸢尾花的K均值聚类?先从任意一组划分出发,通过调整,逐步达成上述目标。
6.2物以类聚:鸢尾花的K均值聚类对于如图所示划分方式,计算每一类鸢尾花花瓣的平均宽度与平均长度,得到每一类鸢尾花的聚类中心(图中红色记号)。由于聚类中心是由一类鸢尾花的平均特征决定的,它可以作为该类鸢尾花的代表。一株鸢尾花到某一类鸢尾花中心点的距离越小,就标识它与该类鸢尾花越相似,越可能属于该类鸢尾花。①每一类鸢尾花的聚类中心
6.2物以类聚:鸢尾花的K均值聚类发现A类鸢尾花γ与B类的聚类中心更接近,说明它与B类鸢尾花更为相似。将鸢尾花γ归入B类。②矛盾的样本γ
6.2物以类聚:鸢尾花的K均值聚类③矛盾的样本ω由于划分方式的变化,类别的聚类中心改变了,重新计算聚类中心。然而在新的划分方式中,发现A类鸢尾花ω更接近B类鸢尾花的聚类中心。为进一步改善划分结果,将鸢尾花ω归入B类。
6.2物以类聚:鸢尾花的K均值聚类④K均值聚类结果经过多次修正,终于得到一个令人满意的划分方式,所有的鸢尾花都满足聚类目标。
6.2物以类聚:鸢尾花的K均值聚类K均值聚类算法(K-meansclustering)在K均值聚类算法中,已知样本的划分方式,可以计算每一类样本的聚类中心。反之,已知聚类中心,也可以得到一个更好的划分方式。通过循环地改善中心点与划分方式,可以得到越来越好的聚类结果,指导聚类中心与划分方式不再发生变化。
6.2物以类聚:鸢尾花的K均值聚类最初的聚类中心如何获得?首先,决定聚类的类别数K,再在所有样本中随机选取K个样本作为聚类中心,就完成聚类中心的初始化了。
6.2物以类聚:鸢尾花的K均值聚类第一步:随机地从所有样本中选取K个样本,作为每一个类别的初始聚类中心。第二步:将每一个样本划分给距离最近的聚类中心对应的类别,得到新的划分方式。第三步:重新计算每类样本的聚类中心。重复第二、三步骤,直到聚类中心与划分方式不再发生变化。完整的K均值聚类算法:
6.2物以类聚:鸢尾花的K均值聚类K=3(山鸢尾、变色鸢尾、弗吉尼亚鸢尾)K均值聚类的收敛过程K均值聚类结果的组成成分分析
6.3人以群分:相册中的人脸聚类相册人脸
检测人脸
转正特征
提取人脸
聚类聚类
结果
6.3人以群分:相册中的人脸聚类相册人脸
检测人脸
转正特征
提取人脸
聚类聚类
结果
6.3人以群分:相册中的人脸聚类相册人脸
检测人脸
转正特征
提取人脸
聚类聚类
结果
6.3人以群分:相册中的人脸聚类相册人脸
检测人脸
转正特征
提取人脸
聚类聚类
结果
6.3人以群分:相册中的人脸聚类相册人脸
检测人脸
转正特征
提取人脸
聚类聚类
结果
6.3人以群分:相册中的人脸聚类相册人脸
检测人脸
转正特征
提取人脸
聚类聚类
结果
6.3人以群分:相册中的人脸聚类在相册的人脸聚类中,往往不知道数据应该分为几类,尤其是在难以直接观测和统计的高位数据空间中。那么如何确定K的大小?使用不同的K进行K均值聚类,统计K取不同值的时候每一个样本和对应聚类中心的平均距离。样本到对应聚类中心的平均距离一定程度上可以衡量聚类的效果。手肘法(elbowmethod)
6.3人以群分:相册中的人脸聚类手肘法的核心指标是SSE(sumofthesquareder
您可能关注的文档
- H3C常用凤凰端子介绍.pptx
- 辨别精神疾患与亲师合作.pptx
- 基于电子书包的教学变革与创新实践.pptx
- 事故事件案例警示手册.pptx
- 信息技术课件察异辨花.pptx
- 信息技术课件人工智能识文断字理解文本.pptx
- 信息技术课件人工智能真的来了.pptx
- 信息技术课件神来之笔创作图画.pptx
- 信息技术课件无师自通分门别类.pptx
- 信息技术课件语音识别的秘密.pptx
- 山东省临沂第三中学2024-2025学年高一下学期2月底验收考试数学试题(原卷版+解析版).docx
- 2025届河北省唐山市高三下学期第一次模拟考试政治试题(原卷版+解析版).docx
- 江苏省东台市五烈镇广山中学、五烈镇廉贻中学、五烈镇学校2024-2025学年九年级3月联考道德与法治试题(原卷版+解析版).docx
- 统编版四年级下册语文第八单元 习作:故事新编 课件(共31张PPT).pptx
- 2025届四川省资阳市安岳中学高三下学期二模考试政治试题(原卷版+解析版).docx
- 四川省攀枝花市盐边县2024-2025学年九年级上学期1月期末数学试题(原卷版+解析版).docx
- 2025届河北省石家庄市高三下学期一模政治试题(原卷版+解析版).docx
- 统编版六年级下册第三单元习作让真情自然流露课件(共20张PPT).pptx
- 江苏省盐城市射阳县2024-2025学年九年级下学期3月月考英语试题(原卷版+解析版).docx
- 江苏省徐州市鼓楼区东苑中学 2024-2025学年八年级3月月考道德与法治试题(原卷版+解析版).docx
文档评论(0)