化学计量学 g第四章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
化学计量学 g第四章

下一个最小数的边是AC: 14.1 17.3 38.7 D E B C A 4.8 无监督的分类:聚类分析 下一个最小数边是AB(40.0)但若绘入图中,将形成回路ABC,违反Kruskal算法,故应取再下一个最小数的边BD(70.7): B C 17.3 A 38.7 D 70.7 E 14.1 4.8 无监督的分类:聚类分析 将最小生成树的最大数的边切割,可得到两个类,本例中是DE和BCA;如欲再细分,可切割次大数的边(38.7),得DE、BC和A三个类,余类推。显然,这与前面叙述的方法得到的结果是相同的。 分割法较少使用,仍以TLC体系为例说明其要点。开始设A、B、C、D、E属于一类,先从A至E中找出与其它元素差异最大的元素,即计算每一元素与其它各元素的距离之和。对A而言,总距离是: AB+AC+AD+AE=300.5 4.8 无监督的分类:聚类分析 对B、C、D、E相应得:200.1、214.7、273.3、278.2,故A是与其他元素差异最大的元素。因此,可暂将ABCDE分割为BCDE和A。现对这个临时分割的BCDE进行考察,看每一元素是较接近A,抑或较接近BCDE中其它元素。例如,对于B,A与B的距离是40.0,而B与C、D、E的平均距离是(17.3+70.7+72.1)/3=53.4,故知B与A的距离同B与C、D、E的平均距离比较,B更接近A,距离差是53.4-40.0=13.4;对C而言,C更接近A,比C与B、D、E的平均距离近20.0;对D、E而言,则D更接近B、C、E,距A较远;E亦如此。故在BCDE中,C最接近A。 4.8 无监督的分类:聚类分析 将临时分割改为AC和BDE,此时又对BDE进行运算,先算B与A、C的平均距离(28.6)及与D、E的平均距离(71.4),即B更接近A、C,比与D、E的距离近42.8。同理,算得D更接近B、E(与A、C相距较远),E更接近B、D(与A、C相隔较远),故将临时分割又改成ABC及DE。现再对剩下未分割的D、E进行运算,对于D,D、E的距离是14.1,D到A、B、C的平均距离是86.4,故D更接近E。到此,可认为ABCDE的第一次分割已告确定,即应分为ABC和DE,对ABC及DE,重复前面类似的步骤,DE很自然只能分割成D和E,而ABC则首先分割成A与BC,再将BC分割成B与C。至此,每一个类只含有一个元素,分割完成。如下图: 4.8 无监督的分类:聚类分析 ABCDE ABC DE A BC B C D E 4.9 化学模式识别的应用 化学模式识别为将化学量测数据转化为有用的信息提供了有力的手段,本节仅举部分实际应用的例子。 将光谱数据转化为物质化学结构的信息是化学模式识别应用的重要方面。 在前面的讨论中提到过确定奶样是牛奶或是羊奶的例子。有文献报道,用气相色谱法测定20个奶样中15种脂肪酸作参量,分类正确率达85%~100%,比目测比较色谱图可靠。类似奶的来源的问题在化学量测中常会遇到。例如原油泄漏,需确定泄漏来源,追查有关责任。美国海岸巡警负责监视水域污染情况,确定清理责任,利用分析仪器与化学模式识别相结合的方法,能找出泄漏原油的来源。 4.9 化学模式识别的应用 作为参量,可用中子活化法分析油样中22种元素含量,用这种参量,泄漏的油样虽在天然环境中(在大气中及不同气候下)曝露发生变化,仍能有99.3%的正确分类率。在选择参量时,发现钒、镍、硫这些与原油中高分子量组分结合稳固的元素是最重要的参量,虽然经露天变化仍能保持其分辨特性。用作参量的22种元素在本例中是样本中确知其存在的物种。其实,作为化学模式识别参量,完全无需确知其是何物种的分子信号,只要这些分析信号是来自样本中存在的某种组分,就可以作为参量使用。这种情况,可称为育检技术(The blind assay technique)。 4.9 化学模式识别的应用 前面叙及的脑组织的色谱数据中156个色谱峰值,就是这种育检技术的实例。进行分类时,无需设法去确认这156个色谱峰代表的是脑组织中哪156种具体成分,因为这样的工作显然过于繁重,不了解这些参量的本性,并不影响利用它们鉴别正常脑组织与患肿瘤的脑组织。 4.9 化学模式识别的应用 类似的实例还有各酒的商标辨识.为保护威士忌的商标,需鉴定可疑的商品是否是真品。可利用酒样的气相色谱峰作参量进行这种辨识,色谱图有17个明显的峰,可直接利用这些峰作参量。研究表明,取两个峰(可能是异戊醇与乙醛的峰)即能完成这一分类。国内某地各酒的色谱图具有上百的峰,这些均可利用作为辨识的参量。为判别某一酒样是否是某种商标的产品,重要的不是要表明这上百个色谱峰是何化合物,而是要从这些峰中选出能在酒样开瓶放置后,经蒸发、加水或加冰稀释后仍能辨识真品与伪品的峰。10种来源的45个薄荷油样

文档评论(0)

feifei1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档