- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在钢材仓储管理中的应用研究
摘要:提出了数据挖掘技术在钢材仓储管理中的实施方案,并以钢材仓储管理中实时库存的统计分析为例介绍了该方案的实施过程。仓库管理者能够找到有关影响钢材库存损耗的因素,从而改进仓储钢材的利用方法,必然对仓库的效益起到积极的作用。
关键词:数据挖掘;分类算法;钢材剪裁
中图分类号:TP301文献标识码:A文章编号:1009-3044(2009)34-9638-02
The Application Study of Data Mining in the Steel Warehousing Management
MA Li
(The School of Software, Southeast University, Nanjing 210000, China)
Abstract: This paper puts forward the plan of data mining in the steel warehousing management and introduces the implementation process of it using the example of the statistic analysis of steel store. in the steel warehousing management. The supervisor can find the factors of affecting steel store, and improve the usage of the steel warehousing. This will have a positive effect on the warehouse efficiency.
Key words: data mining; sorting algorithm; steel cutting
随着各行各业对钢材的规格的要求的急剧增长,现在的钢材仓储管理者很难再像从前那样直接从客户的要求中找出钢材规格的规律性,并根据此规律进行决策。因此必须借助于相应的数据仓库分析工具,自动发现数据中隐藏的规律或模式,为决策提供支持。
数据挖掘(简记为DM)是一种决策支持过程,它是基于AI、机器学习、统计学等技术,高度自动化地分析各组织原有的数据,做出归纳的推理,从中挖掘出潜在的模式,为钢材仓储管理者的决策提供支持。以钢材规格为例,钢铁公司对钢材的分析处理一般仅仅是统计各口径的螺纹钢、线材钢、盘肋等的重量,而钢材仓储管理者在实际利用过程中必须按客户的要求来对钢材进行各种剪裁,如果钢材仓储管理者能够找到有关客户需求的因素,必然对钢材剪裁的损耗起到积极的作用。过去,对钢材剪裁过程中产生的大量数据信息的处理通常采用数据库的处理方法。现在采用数据挖掘中的分类算法处理上述数据的方法,从而可以将大量的数据转化为分类规则,从而更好地分析这些数据,图1为分类挖掘流程图。
1 实例
1.1 确定挖掘对象及目标
在该例中设计了一种网上调查系统,采集到了100名客户的需求数据,试图根据这些数据来分析哪些因素可能对盘肋钢的剪裁产生影响,并期望用所获得的分析结果来指导钢材仓储管理者的盘肋钢剪裁工作。
1.2 数据采集
数据采集的目的主要是为了获取两方面的数据:
1)客户需求量表。包括客户编号、客户名、年需求量。这些信息可通过钢材仓储管理者的年度报表获得,如表1所示。
2)客户需求调查表。这些信息主要通过网上调查,由客户填写产生。内容包括客户对盘肋钢的品牌、产地、强度等级、口径、剪裁长度、年使用量等。
1.3 数据预处理
1)数据清理。从客户需求调查表中可以看到,虽然有一些重要的属性缺少属性值,但鉴于数据挖掘中的C4.5算法的特点,这样的记录,可以予以保留。但如果有些客户填写的信息与实际相差过大,他们的需求调查将会被认为是非法数据,因为无法根据他们的需求调查写出分类结果,所以对其进行了删除。经过数据清理后,总记录数为98条,占参与调查人数的98%。
2)数据消减。由于客户需求调查分析数据库中的属性字段很多,因此为了便于决策树模型的建立,根据实际情况,将采用盘肋钢的品牌、产地、强度等级、口径、剪裁长度的依据。经过数据预处理后,客户需求调查分析数据库结构如下:“强度等级”、“口径”、“剪裁长度”、“年使用量”为非类别属性,“剪裁是否合理”为类别属性。
1.4 使用C4.5算法生成决策树模型
因剪裁方式过多,上图只举出较为合理的方式,其他剪裁方式统一以“其他”来标记。
2 决策树的修剪
上述算法得到的树往往生长得太大以致对剪
文档评论(0)