基于决策树的企业成本控制.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2008年第7期 福 建 电 脑 121 基于决策树的企业成本控制 严 华 (福建医科大学数理计算机教学部 福建 福州 350001) 【摘 要】:本文应用决策树的C4.5算法,分析企业生产中造成损耗的主要原因。生成的规则经检验具有较高的可靠性, 可提供给生产技术人员参考。从而采取相应对策,达到降低成本、加强企业竞争力的作用。 【关键词】:决策树成本控制C4.5 1、引言 根据数据和问题本身的特点,比较了多种决策树算法后,本 在企业发展战略中.成本控制处于极为重要的地位。如果同 文采用C4.5算法生成材料损耗的决策树。C4。5是ID3的改进 类产品的性能、质量相差无几,则决定产品在市场竞争的主要因 算法.不仅可以处理离散值属性。还能处理连续值属性。 素是价格.而成本决定了产品价格高低,只有降低了成本,才有 C4.5算法是以ID3算法为核心的完整的决策树生成系统。 可能提高企业的竞争力 它通过两个步骤来建立决策树:树的生成阶段和树的剪枝阶 成本主要由以下几个部分:采购成本、生产成本、人工成 段。在每一步的分裂中使用信息增益率选择属性。 本。在成本的构成中。一部分是不可改变的。如工人的工资。厂 对于连续值属性A.C4.5按照属性的信息增益率将其划 房设备等。为固定成本;另一部分则是可控制的。如生产过程中 分为两个不同的子集:属性值大于分割点和属性值小于等于分 的损耗;如果能降低损耗。稳定产品质量,减少次、废品,避免不 割点。即使用如下的测试形式:A≤r和Arlr为分割点。C4. 必要的浪费,则可以提高生产效率、降低成本.确保企业在竞争 5寻找最优的r的方法是: 中获胜。 f1)首先采用快速排序法将训练集的样本根据属性A的值 本文的数据来自一家生产汽车配件的公司.由于与汽车厂 排序: 配套,质量要求很高,一个零件不合格,会造成批量返工,因此质 (2)然后按顺序逐一将两个相邻的样本的A的平均值r=:(A 量成本较高。造成的损耗也比较大。据公司统计.一般公司零件 ,+A2),2作为分割点(假设训练集有n个样本,则共有n一1个分 造成的损耗占公司总成本的5%左右。为提高公司的竞争力。公 割点)。每个分割点都可将训练集划分为两个子集,线性扫描lr 司希望能够找出损耗的真正原因,以采取对策降低损耗。 r,。 … , ., 比较所有可能的分割点,使得信息增益率最大并将其 决策树是解决分类问题的数据挖掘方法.能够从一组无次 作为最优的分割点r。按照上述方法求出当前侯选属性集所有属 序、无规则的事例中推理出以决策树形式表示的分类规则。本文 性的信息增益率.选出信息增益率最高的属性,然后按照该属性 考虑用决策树方法.从企业积累的损耗数据库中挖掘出造成高 的分割点.将当前样本分为两个子样本集。对子样本集采用同样 损耗的主要原因 的方法继续分割直到不能再分割或达到停止条件为止 2、数据的预处理 4 剪枝 企业损耗数据库。其原始数据存在多张表中,一共收集了两 数据库中有两年的记录。经过整理后的损耗表中有 1052条 年来各种损耗的数据。属性包括零件名称、允许故障数、领用数、 数据。由此可见.当我们把零件名称概化到一个较高的层次:零 装配损耗数、操作不良、工艺整形、新手作业不良、工装原因不 件类别后,数据量减少了。这也在一定程度上降低了树的复杂 良、单价、允损与实损量差、允损与实损差额、补料数量、补料金 度。随机选其中的70%作为训练集。利用C4.5算法对数据生成 额等。 决策树。选择另外的3O%做为测试集,用K一折交叉确认,取K 在对损耗数据分类前。需要对数据进行预处理,转换为适用 为1O,训练和测试进行

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档