- 南京大学.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
- 南京大学

相似性,概念与聚类分析 于剑 北京交通大学计算机学院. Email: jianyu@bjtu.edu.cn 机器学习的目的之一:概念 人们学习的目的是学习知识, 因此, 机器学习的一个自然期望是: 从数据中学习到知识 什么是知识的最基本单位: 概念 什么是概念? 经典概念的定义:(Plato and Aristotle) 概念的内涵: 必要而且充分条件(命题描述, 命题可以是复合命题) 概念的外延: 给出论域中符合该概念的所有样例 符合排中率(law of the excluded middle) 要么符合这个概念,要么不符合这个概念 这种经典的概念形式称为定义法 概念与数据分析 数据分析的一个重要的应用就是从数据中学习到概念(语义). 相应的机器学习问题(I) 已知:既定概念和该既定概念外延的一个有限子集(即: 标定样本) 期望: 学习既定概念的内涵定义 机器学习:分类, 回归等技术可以归为此类问题, 即所谓的有监督学习 相应的机器学习问题(II) 已知: 样本集, 但其中的样本属于哪一个概念未知 (未标定样本) 期望:学习出与人类认知相符的概念.最好得到概念的内涵表示, 否则,也希望得到概念的外延子集. 机器学习: 聚类分析可以归为此类问题, 无监督学习 本次演讲的重点 如何从未标定的数据集中提取概念, 即聚类分析 Outline 概念的形成(Gestalt Theory) 概念的非经典定义 聚类分析 类的复杂性讨论 未来展望 概念的形成 可分为实体类别(natural kinds)与抽象类别( abstract kinds) Max Wertheimer (1923)说: “我站在窗前, 看到的是房屋,树, 天空.”… 不可能认到一个一个的像素点这种程度. 提出了实体类别的组织原则 概念的形成 格式塔理论与样本的概念归属 格式塔学派——整体上认识视觉,提供了根据二维数据形成概念的基本依据 邻近律 相似律 连续律 封闭律 对称律 概念的形成 相似律 Law of Similarity 概念的形成 Law of proximity邻近律 概念的形成 Gestalt 准则的推广性 封闭律, 连续律, 对称律在高维空间的推广挑战性高, 比如对称性:二维与三维不同. 相似律和近邻律的推广性受数据空间维数的影响相对较小,因此对于概念的研究来说, 似更为重要. 另外,封闭律, 连续律在概念不重叠和相切的情形下可以由相似律和近邻律来反映 概念“游戏”内包含的对象 不包含共有的特性 马术, 游泳, 下棋,网球等 都属于游戏 概念的非经典定义 Eleanor Rosch’s 的发现 上个世纪70年代,Eleanor Rosch 的工作在认知科学领域彻底终结了经典概念的定义-“The big book of concepts”, written by M.L. Murphy, 2002, MIT 典型样本与非典型样本 概念的非经典定义 Examples of items studied by Rosch Mervis (1975), ordered by typicality Fruit: orange, apple, banana, peach, pear, apricot, plum, grapes, strawberry, grapefruit, pineapple, blueberry, lemon, watermelon, honeydew, pomegranate, date, coconut, tomato, olive Furniture: chair, sofa, table, dresser, desk, bed, bookcase, footstool, lamp, piano, cushion, mirror, rug, radio, stove, clock, picture, closet, vase, telephone 概念的非经典定义 Prototype view of concepts A single prototype as a category representation It avoids the contradictable features A feature list as a category representation It is not popular as computational complexity 概念的非经典定义 Exemplar view of concepts (Medin and Schaffer, 1978) Concepts by represented by exemplars 概念的非经典定义 K

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档