数据挖掘在蔗糖生产中应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在蔗糖生产中应用

数据挖掘在蔗糖生产中应用   摘要:数据挖掘是信息管理领域一项重要技术。文章把数据挖掘技术应用于农业中的蔗糖生产过程,如预测分析技术在估产中的应用、序列分析技术在种植技术上的应用以及聚类分析技术在收割管理中的应用等方面。在蔗糖生产中企业最关心的收割管理需要聚类分析的结果,合理的收割能够减少糖分增长不足和回糖带来的损失,聚类结果有利于企业作为确定收割次序的依据;并通过优化收割提高经济效益。   关键词:数据挖掘;预测分析;序列分析;聚类分析;蔗糖生产      一、 数据挖掘与蔗糖生产      数据挖掘是一个包括数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高性能计算和数据可视化等多学科领域交叉的产物,是一个专门面向海量数据并从中提取信息和知识的新领域。数据挖掘是运用一系列数据分析工具,发现蕴藏在杂乱无章的海量数据中的模式和这些数据间的联系,如规则、约束、规律等等。数据挖掘的任务就是发现隐藏在数据中的知识、模式。   在农作物生产中应用数据挖掘技术存在一定的难度,如数据的采集和数据精度。但蔗糖生产的一些特殊性,使之具备应用数据挖掘技术的优势。主要表现在:   1. 特殊的经济作物。甘蔗的种植是农业行为,甘蔗的压榨制糖在榨糖企业的流水线中完成。蔗糖生产中工业与农业结合的特殊性使之比其他作物更具有应用数据挖掘的优势。   2. 具备工业生产的优势。蔗糖的提炼工序由工业企业完成,工业企业在资金、技术等方面具有优势,有较强的新技术应用推广的意识和能力,拥有遍布蔗区的蔗站,能够带动甘蔗种植方面的革新。   3. 具备农业种植的优势。甘蔗的种植存在国营农场和蔗农两种情况。国营农场具有较充足的资金、技术,应用新技术的难度低于普通农户;蔗农的组织性较强。与耕种其他作物农户不同的是,企业由于管理的需要建立蔗站,通过蔗站将蔗农组织成整体,作为原料蔗砍收、资金、技术分配的依据。   4. 新设备新技术的采用为数据挖掘提供数据条件。榨糖企业应用“按质论价”体系时,选用了一系列的新设备新技术,使得蔗糖生产的现代化程度大大提高。原料蔗进厂时的糖分数据已由以前的抽检上升到每车检测,由此也带来了大量的数据。      二、 数据挖掘在蔗糖生产中的应用      1. 回归分析研究原料蔗糖分波动模型。根据数据方程描述,现有文献可查的糖分积累预测模型可分为两种:   (1)二次曲线模型。张木清等人通过检测锤度(蔗茎蔗汁固溶物占蔗汁重量的百分比值,近似地表示蔗茎蔗糖份),对春植甘蔗糖份积累进行研究,并得出结论:甘蔗糖份的累积用二次曲线模拟最佳,模拟结果回归方差最小,决定系数最大。其数学模型方程如下:   y=ax2+bx+c   式中:y为糖份含量值,x为时间变量,a、b、c为待定系数。   (2)分段Logistic曲线模型。另有符合、吴全衍等人根据广西13家糖厂历年甘蔗糖份资料,提出蔗糖份动态变化过程的模型:      式中:SCmax为蔗糖份含量上限值,a、b、c、P、q为常数,t为时间变量,th为曲线上升与下降的转折时间。   从研究对象来看,二次曲线模型是在实验田里进行研究所得出的结论,分段Logistic曲线模型是基于跨度较大的多家糖厂的数据进行分析。事实上,由于蔗区特定的地理、土壤、品种、管理技术等因素存在差异,尤其是有些地方甘蔗砍收持续较长时间,出现了糖分持续较高的峰值段,上述两种理想模型都无法适用;这就需要探讨企业生产中所面临的糖分波动模型。经过对原料蔗进厂时的糖分数据进行回归分析,得出适于企业生产的复合Logistic曲线模型:      式中:y为糖份含量值,x为时间变量,a、b、c、e、d、f为待定系数。   该模型是糖分积累与消耗的复合,能够从植物种群层面解释蔗区存在的峰值段现象。当种群较小时,曲线的形状与上述两种模型比较接近。   2. 预测分析技术在估产中的应用。估产是为了合理安排榨季,尽量避免甘蔗没有足够成熟就进行收割和已经出现严重回糖才进行收割的工作。其是蔗糖生产中的一个重要过程,是由榨糖企业带领种蔗单位、蔗站、蔗农等对蔗区的甘蔗进行全面的调查,检测成熟度,估算甘蔗总产量,进一步根据企业的日生产能力确定开榨时间。   预测分析技术是利用现有信息,对未来的趋势进行预测。甘蔗估产的预测分析主要是利用植物生长、糖分积累、气象预报数据等,结合蔗糖分积累的模型,对整个榨季的产量进行预测。建立在糖分数据挖掘上的预测分析主要表现在:   (1)从估算提升到预测分析,更科学合理。基于充足的糖分数据,产量预测的精度更高,甘蔗开榨的时间确定更科学。根据从历年数据分析,将传统估产方式确定的开榨日期适当调整,整个榨季的总糖分产量可提高近1个百分点。

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档