- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
地沟油的识别问题
摘要
本文要解决的问题是根据所给的油的成分,判断该油属于地沟油还是优质油,以及在保证一定的准确率的条件下,用最少的化验指标来判断该油的类别。
问题一模型的建立,通过fisher算法,依次计算出了地沟油、优质油的样本均值,类内离散度矩阵和类间离散度矩阵,根据类间离散度矩阵与类内离散度矩阵的比值最大,求得最正确投影矩阵。利用样本数据与最正确投影矩阵的乘积与阈值进行比拟,得出判定油类别的判别式。
问题二根据第一问题中所建立的模型,通过matlab编写程序,与阈值进行比拟后,得出最后的16组测试数据,前8组属于优质油,后8组属于地沟油。
问题三即需要减少化验指标。因为影响油的类别的因素十分复杂,该题中给了7种判别油类别的成分,我们需要用为数极少的互补相关的新变量来反映原变量所提供的绝大局部信息。此题中我们采用了主成份分析法,依次求解出相关系数矩阵、特征值、特征向量、奉献率和累计奉献率,最后通过对综合比重数据的分析,得出将第4种成分、第6种成分和第7种成分作为化验指标比拟合理。模型建立合理,结构清晰,逻辑性强,能够反映实际问题。
本文要解决的问题是根据所给的油的成分,判断该油属于地沟油还是优质油,以及在保证一定的准确率的条件下,用最少的化验指标来判断该油的类别。
本文要解决的问题是根据所给的油的成分,判断该油属于地沟油还是优质油,以及在保证一定的准确率的条件下,用最少的化验指标来判断该油的类别。对于问题一模型的建立,通过fisher算法,依次计算出了地沟油、优质油的样本均值,类内离散度矩阵和类间离散度矩阵,根据类间离散度矩阵与类内离散度矩阵的比值最大,求得最正确投影矩阵。利用样本数据与最正确投影矩阵的乘积与阈值进行比拟,得出判定油类别的判别式。问题二根据第一问题中所建立的模型,通过matlab编写程序,与阈值进行比拟后,得出最后的16组测试数据,前8组属于优质油,后8组属于地沟油。问题三即需要减少化验指标。因为影响油的类别的因素复杂的,该题中给了7种油的类别,我们需要用较少的新的变量代替原来较多的变量,而且使这些较少的新变量代替原来较多的变量所反映的信息。因此我们采用主成份分析法,依次求解出相关系数矩阵、特征值、特征向量、奉献率和累计奉献率,最后通过对综合比重数据的分析,得出将第4种成分、第6种成分和第7种成分作为化验指标比拟合理。模型建立合理,结构清晰,逻辑性强,能够反映实际问题。
关键字:fisher算法、主成分分析、地沟油、优质油
一、问题重述
问题背景
近年来,我国许多地方都存在一个令人发指的问题——“地沟油”问题,这个问题可以说已经成为一个公开的“秘密”。有些人长期以倒卖“地沟油”为生,他们把这些地沟油经过化学处理后装入成品油流入餐桌,这些地沟油入餐桌严重威胁到我国公众的生命健康。“地沟油”事件频频发生,已震惊全国,其涉及范围之广,生产规模之大,出乎人们的想象。虽然我国有关部门经过严厉打击,但“地沟油”事件依然阴魂不散,据专家统计每年返回餐桌的地沟油达百万吨级。在利益的驱使下,“地沟油”制售从小作坊升级到大工厂,产业分工细化为掏捞、粗炼、倒卖、深加工、批发、零售等多个环节,“地沟油”生意不但打不死,甚至越做越大。这个事件背后折射出的政府监管缺失、立法体制不完善、社会道德缺失严重等等都是值得我们深思的。因此,怎么鉴别地沟油显得尤为重要。
题目要求
地沟油,泛指在生活中存在的各类劣质油,如回收的食用油、反复使用的炸油等。地沟油最大来源为城市大型饭店下水道的隔油池。长期食用可能会引发癌症,对人体的危害极大。
下面一组数据〔见附件1〕,分别是优质食用油〔编号1-60〕和地沟油〔编号61-84〕的7种化学物质成分的含量,请利用数据解决下面问题。
本文要解决的问题
〔1〕 建立判别地沟油的数学模型,并对你建立的模型进行评价。
〔2〕 利用你所建立的模型对编号85-100的样品进行判别。
〔3〕 化验7种化学物质含量花费较大,能否在保证一定的准确率条件下,减少化验指标数。
二、模型的假设
假设1:假设一组样本数据中有一种成分数值明显错误,该组的数据无参考意义
假设2:此题中所给的数据真实
假设3:假设采集的样本具有一定的参考价值
假设4:各成分之间对判别结果的影响是相互独立的。
假设5:样本数据是在相同条件下测得的。
三、数据处理
通过对前84组数据的分析,发现其中5组数据存在问题,我们利用题中所给的84组数据,测出油的类别的成功率为91.67%。
当用每种成分的均值代替这5组有问题的数据后,重新计算成功率,依然为91.67%,因此我们还是用题中所给的数据进行计算,来判定油的类别。
三、符号说明
符号
符号说明
优质油的样本数据集合
地沟油的样本数据集合
i
油中包含的每一种成分
优质油中成分为i样本均值
地沟油中成分
您可能关注的文档
最近下载
- 高中数学《集合的概念及其基本运算》导学教案.doc VIP
- 人教版八年级下英语单词默写表格(整理打印).pdf VIP
- 九年级下册数学《二次函数》二次函数的性质.doc VIP
- 第一批产学合作协同育人项目简介.doc VIP
- 女性生育力保存PPT课件.pptx VIP
- STEAM跨学科课程整合的理念、模式构建与实施挑战研究.docx VIP
- 产学合作协同育人创新创业教育改革项目申报书模板(包含内容).docx VIP
- 110千伏输电线路工程专业监理实施细则.doc VIP
- 智慧乡村、智慧农业产供销一体化、可追溯平台建设方案.pdf VIP
- 产学合作协同育人教学内容和课程体系改革项目申报书模板—基于计算思维的大学计算机课程思政案例构建与实践(包含申报书内容、合作方案、合作协议).docx
文档评论(0)