化学数据挖掘技术和应用.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 合成氨优化控制系统的数据处理流程 数据文件 输入 样本筛选 数据文件 评估 数据结构分析 相关分析 自变量筛选 建模 3.3 在工业优化中的应用 实例:合成氨优化控制系统 * 合成氨优化控制系统的软件结构 数据采集 建模与模型维护 诊断与预测 操作指导 公用程序 生产数据 简易 方法库 数据库 模型库 * 合成氨优化系统优化生产实施步骤 现场调研 初步分析 数据挖掘二 模型评价和修改 数据挖掘一 收集数据一 收集数据二 综合分析 定制系统 提交方案 现场安装调试 实施 项目开始 * 合成塔生产优化 优化目标:新鲜气流量。 影响目标的变量:新鲜气氢含量、冷激三流量、合成塔一段入口温度、合成塔二段出口温度、合成塔三段9点温度、合成塔三段12点温度、合成塔四段温度、废锅入口气温度及水冷器出口温度等。 新鲜气流量每小时大于26500 升的样本为优类样本(定义为1类),小于等于26500升的样本为差类样本(定义为2类)。样本总数为1646个。 * 各变量对新鲜气量的相对重要性 合成塔一段入口温度与合成塔四段温度是影响入塔新鲜气量的主要工艺参数 * 双因子图 一段入口温度 合成塔四段温度 * 新鲜气量的定性建模(Fisher法) 总样本区优类样本约占49.45%,优类样本区中优类样本约占95.38%。 * 4 数据挖掘技术小结 (1)我们的数据挖掘软件zMiner是复杂数据处理的有用工具,既可用以定量分析,又可用以半定量和定性分析。 (2)不同的数据挖掘方法各有所长,可以取长补短,综合运用,组成合理的数据处理流程,得到行之有效的数学模型。 (3)数据挖掘技术的应用成本低廉,实施容易,见效快,可望在化学化工等领域推广应用。 * References Chen Nian-Yi, Lu Wen-Cong, Li Guo-Zheng, Yang Jie, Support Vector Machine in Chemistry, World Scientific Publishing Co. Pte. Ltd., 2004 * 致 谢 国家自然科学基金委 上海市科委 中国铝业公司 上海宝钢集团 * Thank you Welcome to Shanghai University Email: wclu@ cell phone:/ * Thank you * * 化学数据挖掘技术和应用 陆文聪  上海大学理学院化学系 * 1 数据挖掘(Data Mining) 利用计算机和现代统计科学理论对复杂数据进行整理、分析、建模等研究工作,达到总结规律、预报未知的目的。 1.1 概念 * 数据挖掘技术涉及到数据库、人工智能、模式识别、数理统计、计算机可视化等多种技术和学科,是近十多年愈来愈为人们所关注的技术热点。 * 1.2 主要难点:数据对象的复杂性 复杂数据的六大特征 * (1) 将传统的统计数学方法与现代常用的数据挖掘方法结合起来使用,彼此取长补短,组成一套完整的数据处理流程,可以解决复杂数据处理问题。 1.3 复杂数据处理和建模技术 (2) 利用Vapnik的统计学习新理论和支持向量机算法, 较好地解决了小样本、过学习、维数灾难等问题 * 2 我们的数据挖掘技术的特色 2.1 独特的信息处理流程   在实践中总结出了有效的信息处理流程,关键环节包括:数据评估、数据结构分析、样本筛选、相关分析、自变量筛选、优化建模等。 *   将模式识别新方法与传统的统计数学方法相结合,如最佳投影回归方法;将模式识别的优化控制区作为人工神经网络预报的边界条件以避免错误的外推方向和误报,等等。 2.2 独特的复合方法 *    根据数据的不同拓扑结构, 采用不同的变量筛选方法: 对于偏置型数据用投票法 对于包络型数据用熵小法 (2) 用超多面体模型筛选变量 2.3 独特的变量筛选方法 *    (1) 逆投影方法 (2) 最佳投影方法 (3) 超多面体方法 (4) 逐级投影方法 (5) 最佳投影回归方法 (6) 多目标的模式识别方法 2.4 独特的模式识别新方法 * 2.4.1 逆投影方法 X3 X1 X2 Y(2) Y(1) *    最佳投影法和主成份分析法的 模式识别分类结果比较 2.4.2 最佳投影方法 (a) 最佳投影分类图 (b) 主成份分析分类图 * 用超平面组合法形成超多面体模型示意图 2.4.3 超多面体方法 * 2.4.4 逐级投影方法 用最佳逐级投影组合法形成优化控制区示意图 * 2.4.5 最佳投影回归方法 最佳投影回归示意图 X1 X2 高维空间向低维空间投影 降维后噪声下降 预报能力增强 * 2.4.6 多目标的模式识别方法 多目标的模式识别方法形成优化

文档评论(0)

***** + 关注
实名认证
文档贡献者

本账号下所有文档分享可拿50%收益 欢迎分享

1亿VIP精品文档

相关文档