基于数据挖掘技术的企业信息系统建设.pdf

基于数据挖掘技术的企业信息系统建设.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据挖掘技术的企业信息系统建设.pdf

《冶金自动化)2006年增刊(S2) 基于数据挖掘技术的企业信息系统建设 刘佳瑜1,王雪梅2 (1.北京首钢自动化信息技术有限公司自动化研究所,北京100041;2.北京首钢设计院) [摘要]针对数据准备、数据挖掘及其它需要注意的问题,阐述了企业如何做好信息系统中的数据准备与挖 掘。 【关键词]数据;准备;收集;编码规则;挖掘 O前言 (1)数据的准备 企业信息建设是一项艰巨的过程。充分利用 我们可以简单地将信息系统实施所要准备的 挖掘企业的海量数据是建设好信息系统的基础, 数据分为两大类:即静态数据和动态数据,也可称 也是现代企业运用科学管理、决策分析的基础。 为基础数据和事务数据。 信息系统建设一般分为前期数据准备,中期过程 静态数据是指开展业务活动所需要的基础数 实施和后期数据挖掘三个阶段。其中前期数据准 据,如:人员基本信息、客户、财务的科目体系等。 备工作量最大,后期数据挖掘最重要。北京首钢 其特点是它在整个数据的生命周期中基本保持不 设计院在进行信息系统建设过程中,面临的问题 变,同时它是动态数据的基础,所有业务人员通过 是随着业务规模的不断扩大,企业已经积累了大 调用静态数据来保持同一数据在整个系统中的唯 量的数据,其容量逞几何级数增长,但由于传统的 一性。 事物处理系统的局限性,新的问题也开始应运而 动态数据是指实际设计生产时产生的事务处 生;由于产生了大量的历史数据,如何管理这些数 理信息。动态数据又可以分为期初数据和日常数 据已成为迫在眉睫的问题;现有的信息处理系统 据。其中上线时点的数据对信息系统上线前的数 只能实现业务流程的自动化,而如何对大量的历 据准备尤其重要,它代表系统在期初上线这样的 史数据进行深层次的挖掘,从中发现企业业务与 时间点上,动态数据的当前状态,我们称其为期初 经营的内在规律,从而为管理人员的决策提供支 数据(或者称为初始数据)。 持已经成为企业迫切需要解决的问题。因此采用 我们可以将数据的分类和数据准备的先后次 数据挖掘等技术进行企业信息系统的开发,已成 序列表,并对每项数据设计一个收集表,下发到各 为新的趋势。 部门,摸底调查。 1如何进行信息系统上线前的数据准备 (2)制定编码规则和完成基础数据收集 很多企业在信息系统的实施过程中发现基础 在明确有哪些数据要准备后,就可以着手编 数据的整理是最耗时、繁琐的过程。数据的整理 码了。实际上,数据准备工作中最难的是制定编 工作量极大,以至于不少企业因为无法坚持这一 码规则,这也是最占用时间的工作。一个考虑周 枯燥的过程而前功尽弃,使系统上线都成为了泡 全的编码体系需要跨部门反复讨论。不同的数据 影。而有的企业只做了部分基础数据的整理勉强 可能有不同的编码结构,但必须遵循共同的编码 上线,但却导致了大量冗余或垃圾数据的产生。 原则: 同时,没过基础数据整理这一关,也就意味着数据 1)唯一性必须保证一个编码对象仅被赋予 挖掘成了一句空话。 一个代 一个代码只反映一个编码对象。 数据准备要考虑的因素有: 2)头用性编码体系应当符合

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档