浅析大数据分析在中小型企业管理中的应用.docVIP

浅析大数据分析在中小型企业管理中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析大数据分析在中小型企业管理中的应用

浅析大数据分析在中小型企业管理中的应用   0 引言   大数据是维克托middot;迈尔-舍恩伯格在2008 年的著作《大数据时代》中提出的概念,在维基百科中解释为无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。主要特点为Volume (大量)、Velocity (高速)、Variety(多样)、Value(价值)。对于技术收益方,大数据的概念显得通俗易懂,体现在大数据并不在“大”,而在于“有用”、价值含量高。   随着互联网的发展,越来越多的企业实行无纸化办公、数字化管理,在这一过程中,企业各方面的管理包括技术质量、人力资源、财务、现场生产组织等均形成了一定规模的基础数据。但是,这些数据是独立的,伴随企业的发展形成了数据孤岛,导致宝贵的信息资源不能得到有效利用。如何以这些连续或者离散的基础数据为基本保障,进行数据挖掘,形成知识,实现数据的有效利用受到越来越多企业的重视。本文以铸造企业熔炼过程中材质的化学成分对铸件裂纹焊补率的影响为课题,对大数据进行研究,探讨大数据分析在中小型企业管理中的应用。   1 数据准备   1.1 信息收集   信息收集是根据确定的数据分析对象抽象出在数据分析中所需要的特征信息,然后选择合适的信息收集方法,将收集到的信息存入数据库。本文研究的是材质为ZG15Cr1Mo1V 的铸钢件的裂纹焊补率与熔炼过程中化学成分之间的关系。需要收集的信息包括在焊接过程控制系统中提取目标参数裂纹焊补率,在熔炼过程控制系统中提炼熔炼参数、熔炼过程中检测到的化学元素、熔点等。   1.2 数据集成   数据集成是把不同来源、格式、特点、性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。由于铸件号的唯一性,本文的结果参数和影响因子可以通过铸件号结合在一起,实现了数据集成。   1.3 数据规约   数据规约技术可以用来得到数据集的规约表示,它小得多,但仍然接近于保持原数据的完整性,并且规约后执行数据挖掘结果与规约前执行结果相同或几乎相同。由于本文使用的数据样本数量没有达到百万级别以上,因此没有必要做数据规约。   1.4 数据清理   数据库中的数据有一些是不完整的或者含噪声的,或者是不一致的,因此需要进行数据清理,将完整、正确、一致的数据信息存入数据仓库中。   本文在对数据集成完毕存入数据库后,对基础数据进行了修订和清理,将不符合的数据从数据仓库清理掉,确保数据的真实性和可靠性。   1.5 数据变换   通过平滑聚集,数据概化、规范化等方式将数据转换成适用于数据挖掘的形式。对于有些实数型数据,通过概念分层和数据的离散化来转换数据也是重要的一步。   本文所研究课题的目标是找出对裂纹焊补率有影响的关键化学元素,由于数据样本量不是很大,所以对结果裂纹焊补率结果进行了分类。按照中位数进行排列,在中位数以下的样本定义为低裂纹,中位数以上的样本定义为高裂纹。这样的定义避免过大或者过小的因子对整体结果的影响,也更有利于数据挖掘的分析。   2 数据挖掘   根据数据仓库中的数据信息,选择合适的分析工具,应用统计分析、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法等方法处理信息,得出有用的分析信息。   2.1 工具选择   可以进行数据挖掘的软件有免费和付费两种。免费的主要有以下:Weka:其支持几种经典的数据挖掘任务,显著的数据预处理,集群,分类,回归,虚拟化,以及功能选择。JHepWork:其主要是用开源库来创建一个数据分析环境,并提供了丰富的用户接口来实现自己的挖掘算法。付费的主要有以下几种:SAS:是一个模块化、集成化的大型应用软件系统,可以处理大数据下的挖掘和统计,缺点是价格高。SPASS:“统计产品与服务解决方案”软件,相比于SAS 价格较低,操作简单,但是功能没有SAS强大。SQL Server Business Intelligence Development:是微软Sqlserver 数据库自身携带的关于商务智能的模块,能和数据库非常好的结合起来,提供了线性回归、贝叶斯算法、关联、逻辑回归等算法。本文的数据挖掘工具选择微软的商务智能平台。   2.2 挖掘算法确认   根据不同的目标确立不同的挖掘算法,本文研究课题主要采用以下几种挖掘算法。   ①朴素贝叶斯算法。这是基于贝叶斯定理与特征条件独立假设的分类方法,它能检查所研究的实体的每个属性,从而确定该属性本身在何种程度上影响了想要预测的那个属性。   ②神经网络。Microsoft 神经网络算法通过构造多层感知器网络创建分类和回归挖掘模型。当给定可预测属性的每个状态时,Microsoft 神经网络算法可以计算输入

文档评论(0)

wangshirufeng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档