- 8
- 0
- 约2.23万字
- 约 26页
- 2016-11-27 发布于北京
- 举报
摘要: 聚类(clustering),简单地说就是把相似的东西分到一组,同 分类(Classification)不同,对于一个分类器(classifier) ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个分类器(classifier) 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做监督学习( supervised learning ),而在聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起,因此,一个聚类算法通常只需要知道如何计算相似 度就可以开始工作了,因此聚类(clustering) 通常并不需要使用训练数据进行学习,这在 Machine Learning 中被称作无监督学习(unsupervised learning)。模式识别方法的首先要结局的一个问题就是特征的选择,目前许多方法只考虑了有监督学习的特征选择问题,对无监督学习的特征学则问题却涉及的很是很少,依据特征对分类结果的影响和特征之间相关性分析两个方面提出了一种基于K-均值聚类方法的特征学选择算法,用于无监督学习的特征选择问题。本次课题中,我们主要研究K-均值聚类方法。
K-均值聚类(K-means),属于聚类分析中基于划分的比较经典的算法之一,简捷性和适应性很强,对于多种数据类型都能进行聚类分析。而且
您可能关注的文档
- 【论文】1.5Mta榆林常压催化柴油加氢精制工艺设计.doc
- 【论文】TBM综合管理系统运行管理模块的设计与实现.docx
- 【论文】丙酸锌合成工艺研究毕业论文.doc
- 【论文】城市的规划设计.doc
- 【论文】高级电化学氧化技术在偶氮染料废水处理中的应用.doc
- 【论文】矿1.80Mta新井设计.doc
- 【论文】汽车金融行业风险控制存在的问题以及对策研究.doc
- 【论文】设计年产炼钢生铁480万吨、铸造生铁40万吨的炼铁车间设计.doc
- 【论文】税务会计——个人所得税改革.doc
- 【论文】温室大棚用全自动扫雪器的设计.doc
- 【人民日报】十五五规划必刷100题及答案.docx
- 国家电网有限公司高校毕业生招聘考试公共与行业知识题库及答案(2026版).docx
- 高中入团积极分子考试题库及答案.docx
- 北京工业大学耿丹学院《社会福利思想》2025-2026学年期末试卷.doc
- 北京工业大学耿丹学院《新中国史》2025-2026学年期末试卷.doc
- 北京工业大学耿丹学院《文献信息检索与利用》2025-2026学年期末试卷.doc
- 活动策划丨长城炮越野皮卡上市发布方案 .pdf
- 【中考动员】主题班会《100天做自己的六边形战士+》.pptx
- 中考英语高频词汇第二部分 阅读技能·提升练(学用).pdf
- 商业综合体安全生产管理制度.docx
原创力文档

文档评论(0)