- 497
- 0
- 约3.19千字
- 约 34页
- 2017-10-24 发布于湖北
- 举报
KNN讲解
* * 不足 (1)分类速度慢; KNN算法的时间复杂度和存储空间会随着训练集规模和特征维数的增大而快速增加。因为每次新的待分样本都必须与所有训练集一同计算比较相似度,以便取出靠前的K个已分类样本。整个算法的时间复杂度可以用O(m*n)表示,其中m是选出的特征项(属性)的个数,而n是训练集样本的个数。 * * (2)各属性的权重相同,影响了准确率; 当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的K个邻居中大容量类的样本占多数。该算法只计算“最近的”邻居样本,如果某一类的样本数量很大,那么可能目标样本并不接近这类样本,却会将目标样本分到该类下,影响分类准确率。 * * (3)样本库容量依赖性较强; (4)K值不好确定; k值选择过小,得到的近邻数过少,会降低分类精度,同时也会放大噪声数据的干扰;而k值选择过大,如果待分类样本属于训练集中包含数据较少的类,那么在选择k个近邻的时候,实际上并不相似的数据也被包含进来,造成噪声增加而导致分类效果的降低。 * * * * 5 KNN的一些改进策略 (1)从降低计算复杂度的角度 当样本容量较大以及特征属性较多时,KNN算法分类的效率就将大大降低。可以采用以下方法进行改进。 如果在使用KNN算法之前对样本的属性进行约简,删除那些对分类结果影响较小
您可能关注的文档
- HMG辅酶A还原酶抑制剂.ppt
- HPV产品市场分析.ppt
- Homeless_to_Harvard公开课 4.ppt
- HRT9(碾压试验).ppt
- HART475中英文说明书.doc
- HR医疗期.ppt
- HS610e超声波探伤仪操作说明书.doc
- hust编译原理实验报告2.doc
- HSPA业务跨RNC切换策略分析.ppt
- HXN3机车考试题库.doc
- 北京市第八十中学2025_2026学年高二上学期12月月考历史试题(文字版,含答案).docx
- 山东莒县第三中学2025_2026学年度七年级上学期期末素养能力测试历史试题(扫描版,含答案).docx
- 广西壮族自治区“贵百河”2025_2026学年高二上学期12月月考历史试题(文字版,含答案).docx
- 山西省忻州市第一中学校等校2025_2026学年高一上学期2月质量检测政治试题(文字版,含答案).docx
- 河北省廊坊市安次区2025_2026学年八年级上学期1月期末历史试题(文字版,含答案).docx
- 云南省“美美与共”民族中学联盟2025_2026学年高二上学期联考(三)历史试题(文字版,含答案).docx
- 安徽省耀正优名校2025_2026学年高三上学期12月阶段检测历史试题(PDF格式,含答案).docx
- 北京育才学校2025_2026学年高一第一学期期末地理试卷(文字版,含答案).docx
- 广东省茂名市2025_2026学年第一学期期末教学质量监测高一政治试题(文字版,含答案).docx
- 安徽合肥市第八中学2025_2026学年高二上学期2月期末考试政治试题(文字版,含答案).docx
最近下载
- 2025年吉林省长春市中考二模物理试卷含详解.docx VIP
- 精品解析:2026届广东省广东实验中学高三上学期第二次阶段性考试物理试卷(原卷版).docx VIP
- 2026年厦门中考地理备考全攻略(含考点、真题、计划).docx VIP
- SYT-5329-2012水质推荐指标.doc VIP
- 2026届湖北省随州市高三下学期二模物理试题(试卷+解析).pdf VIP
- 化学_年产1亿片阿司匹林片生产工艺设计.docx VIP
- 2024年广东省五年一贯制学校招生考试数学试卷.docx VIP
- 建筑结构荷载规范.docx VIP
- 海康公安视频实战应用平台解决专题方案.docx VIP
- 党的二十届四中全会精神知识题库.docx VIP
原创力文档

文档评论(0)