聚类详解.ppt
聚类方法 北京10月机器学习班 邹博 2014年11月1日 温故,以知新 最大熵模型,是极具发展潜力的模型。熵作为不确定性的度量,在目标函数的建立中常见使用。 如:决策树的建立过程中,对特征的选择。 Logistic回归建立的对数似然函数,是凹函数 二阶导Hessian矩阵半负定 使用梯度上升得到的解,是全局最优解 回归分析的一个具体示例 三维空间各项异性椭球的建立 Logistic回归参数估计 假定: 对数似然函数 主轴的设置 副轴的设置 三维椭球和自动套合 本次目标 掌握K-means聚类的思路和使用条件 了解层次聚类的思路和方法 理解密度聚类并能够应用于实践 DBSCAN 密度最大值聚类 掌握谱聚类的算法,初步理解谱聚类的内涵 聚类的定义 聚类就是对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小 无监督 向量间相似度计算的方法 欧式距离(闵可夫斯基距离) 杰卡德相似系数 余弦相似度(cosine similarity) 聚类的基本思想 给定一个有N个对象的数据集,划分聚类技术将构造数据的k个划分,每一个划分代表一个簇,k≤n。也就是说,聚类将数据划分为k个簇,而且这k个划分满足下列条件: 每一个簇至少包含一个对象 每一个对象属于且仅属于一个簇 基本思想:对于给定的k,算法首先
您可能关注的文档
- 给水排水施工图详解.ppt
- 给水管材及管件管材与管件详解.ppt
- 给水管材及管件阀门基础知识详解.ppt
- 给水管道卫生学详解.ppt
- 绞车培训详解.ppt
- 统一绿茶广告策划书详解.ppt
- 统计学教案(上海财经大学)详解.ppt
- 统计过程控制详解.ppt
- 继电保护章详解.ppt
- 继电保护第章详解.ppt
- 【人民日报】十五五规划必刷100题及答案.docx
- 国家电网有限公司高校毕业生招聘考试公共与行业知识题库及答案(2026版).docx
- 高中入团积极分子考试题库及答案.docx
- 北京工业大学耿丹学院《社会福利思想》2025-2026学年期末试卷.doc
- 北京工业大学耿丹学院《新中国史》2025-2026学年期末试卷.doc
- 北京工业大学耿丹学院《文献信息检索与利用》2025-2026学年期末试卷.doc
- 活动策划丨长城炮越野皮卡上市发布方案 .pdf
- 【中考动员】主题班会《100天做自己的六边形战士+》.pptx
- 中考英语高频词汇第二部分 阅读技能·提升练(学用).pdf
- 商业综合体安全生产管理制度.docx
最近下载
- 2025年湖北省工程专业中级职务水平能力测试(林业)综合试题及答案一.docx VIP
- 八年级劳动国家质量监测考试模拟卷(四).docx VIP
- 道德经全文及译文,老子道德经全文及翻译.docx VIP
- 毕业设计 毕业论文 管壳式换热器.doc VIP
- 城乡规划专升本2025年核心考点模拟试卷(含答案).docx VIP
- 2025年湖北省工程专业中级职务水平能力测试(林业)综合试题及答案.docx VIP
- 简明法语教程(上册)第11课.ppt VIP
- 2025年蚂蚁集团面试题库及答案.doc VIP
- (完整版)常用低压电器图形符号和文字符号 .pdf VIP
- 2025年湖北省工程专业中级职务水平能力测试(林业)综合试题及答案.docx VIP
原创力文档

文档评论(0)