自动化前沿 第四讲 数据挖掘技术及其应用 宋执环 浙江大学工业控制研究所 主要内容 一、数据挖掘概述 数据挖掘概念 数据挖掘--从大量数据中寻找其规律的技术,是统计学、数据库技术和人工智能技术的综合。 数据挖掘是从数据中自动地抽取模式、关联、变化、异常和有意义的结构; 数据挖掘大部分的价值在于利用数据挖掘技术改善预测模型。 数据挖掘与KDD 知识发现(KD) 输出的是规则 数据挖掘(DM) 输出的是模型 共同点 两种方法输入的都是学习集(learning sets) 目的都是尽可能多的自动化数据挖掘过程 数据挖掘过程并不能完全自动化,只能半自动化 异常检测 异常检测是数据挖掘中一个重要方面,用来发现”小的模式”(相对于聚类),即数据集中间显著不同于其它数据的对象。 异常探测应用 电信和信用卡欺骗 贷款审批 药物研究 气象预报 金融领域 客户分类 网络入侵检测 故障检测与诊断等 什么是异常(outlier)? Hawkins(1980)给出了异常的本质性的定义:异常是在数据集中与众不同的数据,使人怀疑这些数据并非随机偏差,而是产生于完全不同的机制。 聚类算法对异常的定义:异常是聚类嵌于其中的背景噪声。 异常检测算法对异常的定义:异常是既不属于聚类也不属于背景噪声的点。他们的行为与正常的行为有很大不同。 异常检测方法的分类 基于统计(statistical-b
您可能关注的文档
- 战略制定中竞争情报工作.ppt.ppt
- 房地产专业知识和实务.doc
- 房地产营销渠道构建流程.doc
- 所和所字短语析疑.doc
- 手表基于Proe参数化设计及运动仿真.ppt
- 才能辨清今后发展方向.ppt
- 扎实工作 勇于创新.doc
- 执法人员行为准则.doc
- 技术负责人具有15年以上从事工程技术管理经历材料.doc
- 投资(股权分置PPT课件).ppt
- 2024-2025学年湖南省邵阳市新宁县回龙寺镇人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市平原县王杲铺中小、王凤楼中小、腰站镇中小青岛版一年级下册3月月考数学试卷.docx
- 第四单元 课题3 物质组成的表示-初中化学新教材预习学案(人教版2024九年级上册).docx
- 2024-2025学年山东省济宁市梁山县人教版一年级下册期中测试数学试卷.docx
- 2024-2025学年山东省德州市德州经济技术开发区长河小学等校青岛版一年级下册期中考试数学试卷.docx
- 2026《基于国产开源单片机GD32VF103的输变电设备物联网传感器设计》8300字.docx
- 2024年中考道德与法治真题完全解读(北京卷).docx
- 2026《基于机器视觉识别的工件边缘曲线重构方法分析》9000字.docx
- 课时9.4 物体的浮与沉【一大题型】八年级全一册物理(沪科版2024).docx
- 2024-2025学年广东省江门市开平市人教版一年级下册期中综合素养评价数学试卷.docx
最近下载
- 工程造价咨询服务成本参考标准.docx VIP
- 补全对话-六年级英语下学期期末专项复习(人教PEP版)含答案解析.pdf VIP
- 江西港口集团校招面笔试题及答案.doc VIP
- 脑出血后遗症个案护理.pptx VIP
- 新解读《GB_T 42912 - 2023金属和合金的腐蚀 金属材料在静态浸入熔盐或其他液体条件下的高温腐蚀试验方法》最新解读.pptx VIP
- 江苏海博BRITORK HQT电动执行机构说明书1308版.pdf VIP
- 一种硼酸三甲酯的气相检测方法.pdf VIP
- 2025年3月29日全国事业单位联考B类《职业能力倾向测验》笔试试题(广西_贵州_海南_黑龙江_湖北_吉林_江西_宁夏_山西_新疆_云南_辽宁_重庆_青海_内蒙古_湖南_安徽)(网友回忆版)(含答案).pdf VIP
- 高中物理必修一《质点-参考系和坐标系》.ppt VIP
- DB52T 764-2012云南松二元立木材积生长率表.docx VIP
原创力文档

文档评论(0)