地沟油识别问题数学建模.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
地沟油识别问题数学建模

地沟油的识别问题 摘要 本文研究根据题中所给已知优质油和地沟油的七种化学物质成分的含量的数据,建立数学模型,从而判别未知类别的样本的质量的问题。并在保证一定的准确率的情况下,减少化验指标数,达到降低检测成本的目的。 首先,本文据对题干和问题一的分析知,待解决的是模式分析中的判别问题,需要判别的对象只有两类,故针对问题一建立模型一,使用fisher判别分析法,通过MATLAB软件制作fisher判别分析器。问题二即在模型一的基础上代入未知类别的样本数据,计算结果见表。 表【1】:编号85-100的样本质量检测情况 序号8586878889909192质量优质油优质油优质油优质油优质油优质油优质油优质油序号93949596979899100质量地沟油地沟油地沟油地沟油地沟油地沟油地沟油地沟油 针对问题三,需要减少化验指标数,则要找出对样品质量影响较大的成分,对此采用线性相关分析的方法,利用spss软件分别求出各成分与样品质量之间的相关系数[见下表],根据具体的要求的检测项目,按系数的大小进行选择 表【2】各成分与样品质量之间的相关系数 成分类别成分4成分7成分1成分6成分3成分5成分2相关系数0.7710.6880.4160.2810.1670.1220.058 本文在模型简化中,假设两种油的质量区分明显,在检测未知类别的数据时,降低了由数据本身造成的错误率。模型一在建立后对已知类别的样本数据进行检测的时候,准确率达到92%以上,使得模型的可信度较高。 在模型二的建立中采用线性相关分析的方法,使得结果客观和清晰的体现变量和因变量之间的关系。 关键词:fisher判别法 MATLAB软件 相关系数 spss软件 一、问题重述 问题背景: 地沟油,泛指在生活中存在的各类劣质油,如回收的 HYPERLINK /view/660920.htm \t _blank 食用油、反复使用的炸油等。地沟油最大来源为城市大型饭?? HYPERLINK /view/53022.htm \t _blank 下水道的 HYPERLINK /view/638170.htm \t _blank 隔油池。长期食用可能会引发 HYPERLINK /view/3942.htm \t _blank 癌症,对人体的危害极大。 本文将研究讨论,根据题目所给的数据和要求建立模型来判别样品的优劣,并对模型进行优化和评价。 问题要求: 本文将研究讨论,根据题中所给已知优质油和地沟油的七种化学物质成分的含量的数据【数据见附录一】,建立数学模型,对性质未知的样本进行检测判别;并在一定保证准确率的条件下减少化验指标数,降低检测成本。 需要解决的问题: 问题一:建立判别地沟油的数学模型,并对你建立的模型进行评价。 问题二:利用你所建立的模型对编号85-100的样品进行判别。 问题三:化验7种化学物质含量花费较大,能否在保证一定的准确率条件下,减少化验指标数。 二、问题分析 分析题目的特点:样本容量大、样本特征多元化(对其七种化学成分含量进行了检测),属于统计判别类型。故初步考虑fisher线性判别分析、多元统计分析、贝叶斯判别分析和人工智能化等可行方法。 针对问题一: 如上分析,fisher线性判别分析可对特征数据分类明确的样本进行有效的判别,其基本思想是,通过寻找一个投影方向(线性变换,线性组合),将高维问题降低到一维问题解决,并且要求变换后的一维数据具有如下性质:同类样本尽可能聚集在一起,不同的样本尽可能地远。 采用fisher线性分析,就是通过给定的样本数据,确定投影方向和阈值,即确定线性判别函数,然后根据这个线性判别函数,对测试数据进行测试,得到测试数据的类别。 针对问题二: 问题二是在问题一建立的模型基础上,代入样本数据进行判别的过程,从而鉴定未知类型样品的优劣。故利用模型二的程序,代入编号85-100的样本数据,计算即可。 针对问题三: 据问题三的要求,在保证一定的准确率下减少化验指标数,则要求剩下的化验指标即化学物质成分含量更能体现样品的特征,即优劣样品中此成分的含量区别度较大。则可以利用表格,分别对已知类别的样品的成分含量进行直观的体现。 三、模型假设与约定 1:假设题中所给的七种化学成分能最大程度上代表样品的特性 2:假设题中所提供的两种油的质量区别明显 3:假设样本的成分含量都在相同的条件下测得 四、符号说明及名词定义 表示样本种类样本个体数类样本均值向量类样本总数类样本内离散度矩阵总类离散度矩阵样本间离散度矩阵投影后的一维空间中,类样本均值向量投影后的一维空间

文档评论(0)

junjun37473 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档