相似性,概念及聚类的分析.ppt

相似性,概念及聚类的分析.ppt

相似性,概念与聚类分析 于剑 北京交通大学计算机学院. Email: jianyu@bjtu.edu.cn 机器学习的目的之一:概念 人们学习的目的是学习知识, 因此, 机器学习的一个自然期望是: 从数据中学习到知识 什么是知识的最基本单位: 概念 什么是概念? 经典概念的定义:(Plato and Aristotle) 概念的内涵: 必要而且充分条件(命题描述, 命题可以是复合命题) 概念的外延: 给出论域中符合该概念的所有样例 符合排中率(law of the excluded middle) 要么符合这个概念,要么不符合这个概念 这种经典的概念形式称为定义法 概念与数据分析 数据分析的一个重要的应用就是从数据中学习到概念(语义). 相应的机器学习问题(I) 已知:既定概念和该既定概念外延的一个有限子集(即: 标定样本) 期望: 学习既定概念的内涵定义 机器学习:分类, 回归等技术可以归为此类问题, 即所谓的有监督学习 相应的机器学习问题(II) 已知: 样本集, 但其中的样本属于哪一个概念未知 (未标定样本) 期望:学习出与人类认知相符的概念.最好得到概念的内涵表示, 否则,也希望得到概念的外延子集. 机器学习: 聚类分析可以归为此类问题, 无监督学习 本次演讲的重点 如何从未标定的数据集中提取概念, 即聚类分析 Outline 概念的形成(Gesta

文档评论(0)

1亿VIP精品文档

相关文档