SAS数据挖掘在钢铁生产管理数据集市中的应用.docVIP

  • 3
  • 0
  • 约3.61千字
  • 约 8页
  • 2019-10-08 发布于北京
  • 举报

SAS数据挖掘在钢铁生产管理数据集市中的应用.doc

PAGE PAGE 1 SAS数据挖掘在钢铁生产管理数据集市中的应用   [摘要]SAS数据挖掘应用在钢铁生产管理数据集市中能有效地进行数据分析、发现数据之间的关联、找出数据背后潜在的知识。本文首先建立数据集市,为数据挖掘提供挖掘平台;其次分析数据挖掘的主要过程以及SAS数据挖掘方法;最后列举SAS数据挖掘在钢铁企业生产管理数据集市中的实例。通过实例分析,根据各无委托原因之间的关联,不仅找到了快速解决无委托板坯量的途径,而且提供了提高完成合同率的解决方法。   [关键词]数据集市;SAS/EM;数据挖掘;生产管理   [中图分类号]TP311.1[文献标识码]A[文章编号]1005-6432(2013)6-0056-03   1引言   随着经济的发展,钢铁企业面临的市场竞争越来越大,在钢材的品种、规格上,用户提出的需求越来越多样化,客户需求越来越体现多品种、小批量的特点。因此,钢铁企业除了在保证产品质量和交货期内交货的情况下,还要大力加强生产管理体制,才能增强企业的市场竞争力[1]。把数据挖掘技术引入到钢铁生产管理领域中,以指导钢铁生产,从而节约了不必要的资源浪费,提高了企业效益。在这些潜在的信息中列举某一个:合同管理中出现大量由于板坯无委托原因所致的合同完成下降问题。如何快速地找出这些原因以及找出这些原因之间的关系,是需要解决的问题。   2钢铁生产管理数据集市的建立   传统的操作型数据库系统技术,主要是事务驱动、面向应用的,而数据挖掘和决策支持需要把各种不同源的数据进行统一,产生质量高的、纯洁的、集成的数据。因此,尽管操作型数据库中的数据很丰富,但用于决策和数据挖掘还是不足的,建立数据集市或数据仓库以提供给数据挖掘和决策分析是必然的。   数据仓库也就是数据的集合,这种集合的特点主要有:面向主题、集成、相对稳定、反映历史变化。数据仓库的实施周期相对较长、成本比较大,且见效比较慢;数据集市与数据仓库相比,数据集市则是在某一特定部门决策支持的需求基础上建立起来的,它是一种更小、更集中的、面向特定主题的数据仓库,为决策者提供了一个部门级的数据分析的应用系统。   在钢铁生产管理系统的基础上,将数据挖掘和数据集市引入到钢铁生产管理领域中,能获得有效的管理模型,从而进一步提高钢铁生产管理的水平,整个系统如图1所示。   2.1数据集市的实现方法   在生产管理数据集市的实现过程中,充分利用了已有的生产管理数据仓库和其他操作型环境下的数据,采用“利用已有”和“吸收四围”结合的方法如图2所示,其中技术质量、生产管理都是企业最关心的问题,结合当前的需求进行建立初始的数据集市,然后根据实际问题和日常变动的动态情况随时扩充完善该数据集市。   2.2数据集市的实现过程   无论是数据仓库还是数据集市都是为数据挖掘和决策支持服务的,从数据源抽取时,一般经过清洗、转换、集成等步骤。经过对数据源数据进行聚集、转换和最后导入数据集市等几个过程最终构建成钢铁车间数据集市。   (1)数据聚集   数据聚集就是对数据源中的相关数据进行汇总。在此聚集的过程中要考虑到数据集市的粒度划分。粒度指的是数据仓库中数据单元的详细程度和数据单元的级别,数据越详细,粒度越小,级别越低;反之数据综合度越高,粒度越大,级别就越高。   (2)数据转换   数据转换就是对数据进行一定的格式转换以方便进行数据挖掘。在数据集市中,例如:对于板坯热送标志来说,不是采用“计划下线”、“计划热送”、“必须热送”来存储,而是将它们分别转换为“0”、“1”、“2”,不但提高了数据集市的存储性和访问性能,而且还增强了数据挖掘的简便性。   (3)数据导入   数据导入过程就是将转换好的数据或数据源中本来不需要转换的数据直接放入到数据集市中。钢铁生产车间原操作数据库存储了一些如物料消耗信息、工艺信息、工序信息和班组信息等静态的数据信息,这些数据可以直接导入到数据集市中。[2]   以上3个过程是相互融合的,并不是孤立的一个过程。对于静态数据的导入,只有在静态信息更新时才会重新导入;而对于聚集,通常在每月的最后一天进行聚集,同时对需要转换的数据进行必要的转换。   3数据挖掘技术   3.1数据挖掘的基本步骤   数据挖掘并不是一个简单的过程,其主要步骤归结为:①数据清洗,目的是清除数据噪声以及清除与研究目标显然无关的数据。②数据集成,其过程就是把多方数据源中的相关数据进行组合。③数据转换,其作用就是将数据转换成为数据挖掘所能识别的数据存在形式,即对数据进行一定的格式转换。④数据挖掘,利用挖掘算法寻找用户所需的数据模式或规则以及规律知识。⑤模式评估,根据特定的评估标准筛选出有意义的规则、趋势、类别、模型等。⑥知识表示,对所挖掘出来的模式进行可视化,把挖掘的结果展示给用户。   3.2

文档评论(0)

1亿VIP精品文档

相关文档