数据挖掘(偶然看到比较好的--推.ppt

  1. 1、本文档共176页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘(偶然看到比较好的--推

工业控制技术研究所 样本的抽取(批量生产过程) t t x1(t) y1 y2 y3 x2(t) x3(t) X Y 样本1 样本2 样本3 …… 工业控制技术研究所 连续生产过程的样本抽取 连续过程 ? 批量过程 T1 T2 T3 v x1 x2 x3 t T3 T2 T1 0 质量检验! 0 T1 T2 T3 T t t1=x1 / v t2=x2 / v t3=x3 / v 0 质量检验! t1 t2 t3 工业控制技术研究所 如何“组装”时间序列? T1 T3 T2 质量检验! t T3 T2 T1 0 t1 t2 t3 质量检验! T 组装前 t 0 t1 t2 t3 T 组装后 样本 工业控制技术研究所 关于生产质量改变的模式假设 生产质量不良的原因是工艺参数设计或控制有问题: 设计阶段:工艺参数设计有错误; 控制阶段:工艺参数未能控制在设计值; 上述因素都可通过生产过程中工艺参数的时间序列实测样本反映出来。 工艺参数的时间序列中某些特征的改变,引起生产质量从量变到质变。 时间序列的特征,可以用模式来描述。 时间序列的模式改变,是生产质量不良的原因。 数据挖掘的目的,就是要寻找引起生产质量不良的工艺参数模式。 工业控制技术研究所 时间序列的模式抽取 目的: 将时间序列样本集合转换为特征模式样本集合,每一种模式(或若干种模式的一种组合)用一个整数来编码,从而将数据挖掘的对象从时间序列空间转换为整数空间。 其中,mi 为 xi (t) 所包含的特征模式的集合。注意: mi 不再是时间序列 mi 可能是多元素的集合,即 xi(t) 可包含多种模式 模式抽取 工业控制技术研究所 时间序列的模式抽取 时间序列分析理论中已给出一类模式抽取的方法:根据时间序列建立 ARMA模型。 或理解为把时间序列空间映射到 ARMA模型中的参数空间,也称为时间序列的 ARMA特征空间。 这一方法的优点是: 成熟 有严密的数学基础 缺点是: ARMA特征没有物理意义,难以据其改进产品质量。 工业控制技术研究所 时间序列的模式抽取 (有物理意义的)模式抽取问题: 给定(有物理意义的)模式集合,寻找时间序列中存在的模式种类。 给定模式集合的方法: 有先验知识 —— 根据先验知识构造与产品质量有关的模式类 没有先验知识 —— 穷举构造所有可能的有物理意义的模式 只有部分先验知识 —— 上述两种方法的组合 寻找时间序列中模式的方法: 给出模式的特征 给出计算特征匹配的指标 在时间序列中进行特征匹配 工业控制技术研究所 常见的有物理意义的特征模式 统计模式 均值、方差(标准差)、最大值、最小值、中间值、局部极值出现频率 趋势模式 单调性(单增、单减)、变化性(最大、最小、平均、中值)、凹凸性 偏差模式 与标准值(设定值)之间的偏差(最大、最小、平均、中值) 累积模式 时间累计、绝对值时间累计、偏差值时间累计、平均值时间累计 工业控制技术研究所 数据挖掘的两种应用方式 数据挖掘 生产历史数据 质量问题分析 寻找质量事故的原因(质量分析): 相关分析问题:发生质量事故后,分析导致该事故的可能原因。这也是一种离线应用。 避免质量事故的发生(质量预测): 设计验证问题:设计新的工艺参数组合时,质量模型用于根据工艺参数的设计值验证是否会导致质量问题。这是一种离线的应用。 质量模型 工艺设计数据 产品质量预测 工业控制技术研究所 质量分类模型的挖掘 给定特征模式样本的集合 {(mi, yi)}i=1,2,?,n , 构造分类器 f (m),满足 f (mi) = yi 。 在复杂情况下,可构造分类决策树。 这是一个类别已知( yi, i=1, 2, ?, n 已知)情况下的分类模型建立问题。 数据挖掘 质量分类模型 工业控制技术研究所 质量分析结论的挖掘 给定特征模式样本的集合 {(mi, yi)}i=1,2,?,n , 建立质量指标 yi 与特征模式 mi 之间的相关关系。 该相关关系直接作为结论提供给用户。 数据挖掘 质量分析结论 工业控制技术研究所 一个示例:加热炉生产质量数据挖掘 生产工艺:间歇式加热过程(均热炉) 烟道 T 燃料喷嘴 钢锭 翻板 炉膛 炉壁 F G H F -燃料流量 T -炉膛温度 G -翻板开度 H -烟气成分 预热段 加热段 均热段 0 0.5 1.0 1.5 2.0 t T 800 1200 160000 2000 典型加热工艺 工业控制技术研究所 一个示例:加热炉生产质量数据挖掘 质量指标:钢锭内裂 影响质量的因素(先验知识): 各加热段之间切换时温度变化太快; 各加热段的温度设定值相差太大; 燃料燃烧不充分; 加热时间太短; 某些钢种的钢锭特别容易裂; 大型钢锭比小型钢锭容易裂。 工业控制技术研究所

文档评论(0)

泰山之颠 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档