《洗衣粉效能预测最优模1.docxVIP

下载本文档

5
0
约1.36万字
约 16页
2017-01-16 发布于北京
举报
版权申诉

《洗衣粉效能预测最优模1.docx

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

《洗衣粉效能预测最优模1

洗衣粉效能预测最优模型摘要本文建立了基于洗衣粉属性来判定其去污效能的两种预测模型，一是主成分降维统计预测模型，二是灰色多变量预测模型。针对问题一，由于所缺失的值均是洗衣粉的属性值，缺失值都集中在PP2、PP3、PP4、PP5这几种属性中，即有缺失值的洗衣粉品种的属性数据缺失率为9.52%或19.04%，且其中PP2、PP3的缺失值占该两种属性数据总量的5.75%，PP4、PP5的缺失值占该两种属性数据总量的33.72%。经上述分析，本文选择用均值替代缺失值。针对问题二，本文基于主成分降维的思想，用SPSS统计软件，将从洗衣粉21种属性中提取出5个主成分，再将每个主成分所对应的方差贡献率作为权重，计算出属性主成分综合模型。同理，从洗衣粉去除18种污渍的效能中提取4个主成分，最终计算出效能主成分综合模型。将上述两个模型求解得的86种洗衣粉的属性综合值及效能综合值进行相关性检验，得出找出其Pearson相关系数为0.36，该相关系数的显著性值为0.04，小于0.1，即属性综合属性X和综合效能Y之间的线性关系显著。由此本文对其进行线性拟合所得的模型如下：上述模型拟合的相对平均误差为1.03。针对问题三，本文采取以相对误差为评判标准来评判所建立的多个预测模型。关键词：主成分分析灰色多变量预测模型§1 问题的重述一、背景知识洗衣粉是通过其中的化学成分溶于水后改变水溶液的物理化学性质来实现去污的作用的，因此通过测量洗衣产品溶于水后的溶液的一些属性就可以了解产品去污的功效。如果能建立溶液属性和产品功效之间的模型，就可以找出能够最大化产品功效的溶液的属性，根据这些属性和化工技术知识我们就可以找出最优的配方。二、已有的数据：现有86个产品的物理属性及功效数据，从中随机选取了10个产品作为验证模型预测精度的数据，请用剩下的76组数据来建立模型每一个产品的21个属性作为输入变量 (PP1—PP21)产品在18种污渍上的功效作为输出变量 (O1—O18)三、要解决的问题对此数据用多种不同的方法进行分析，考虑所有输入变量的线性项，根据模型的需要选择它们的平方项及交互作用项；根据现有数据拟合出一个统计模型，使得模型能够基于产品的属性数据对产品的功效做出比较可靠的预测，并提供数据说明拟合出的模型的预测能力。选择合适的能够反映模型预测能力的评价准则（可以根据需要提出新的准则），并根据准则选出最优的建模方法和最优模型；注意：某些产品的某些属性有缺失数据，但用来验证模型的10组数据里没有缺失值。§2 问题的分析洗衣粉的效能确定问题是一类大样本多数据的计分析与预测类问题。对本问题的处理要分三个步骤进行：第一，对所给数据进行分析及恰当的处理；第二，在经处理后的数据的基础上，建立拟合出几个统计模型，使得模型能够基于产品的属性数据对产品的功效做出比较可靠的预测，并提供数据说明拟合出的模型的预测能力；第三，选择合适的能够反映模型预测能力的评价准则（可以根据需要提出新的准则），并根据准则选出最优的建模方法和最优模型。要合理准确处理好本问题，关键必须弄清问题的相关知识并对问题作出深入的分析。一、对问题的具体分析1、对问题一的分析：问题要求对此数据用多种不同的方法进行分析，考虑所有输入变量的线性项，根据模型的需要选择它们的平方项及交互作用项。数据是86种洗衣粉的21个物理属性及在18污渍上的功效。以下是处理数据的原则。（1）补充缺少属性的数据由于所缺失的值均是洗衣粉的属性值，缺失值都集中在PP2、PP3、PP4、PP5这几种属性中，即有缺失值的洗衣粉品种的属性数据缺失率为9.52%或19.04%，且其中PP2、PP3的缺失值占该两种属性数据总量的5.75%，PP4、PP5的缺失值占该两种属性数据总量的33.72%。基于上述分析，本文认为有两种数据处理方法。法一，忽略缺失值所带来的效应，直接进行统计分析；法二，由于PP2、PP3的缺失值仅占该两种属性数据总量的5.75%，故可将PP2、PP3的缺失值用均值来替代；而PP4、PP5的缺失值占该两种属性数据总量的33.72%，其比重较大。本文在判定PP4、PP5与各污渍的去污效果的相关程度，发现PP4与O16有显著性关系，PP5与O13、O14、O16、O18这几种去污效能都有显著性关系，故虽缺失率较高，但不能剔除，故本文选择仍用均值替代缺失值。在上述数据处理的基础上以均值为参照，即将小于各属性及性能均值的离群值再剔除，以提高模型预测结果的准确性。（2）数据平方处理（3）数据交互作用处理2、对问题二的分析：问题要求在经处理后的数据的基础上，建立拟合出一个统计模型，使得模型能够基于产品的属性数据对产品的功效做出比较可靠的预测，并提供数据说明拟合出的模型的预测能力。由于本问题的输入变量有21种，输出变量有18种，这种高维数多指标的问题会使