- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
化学计量的学 第四章
第四章 化学模式识别 化学量测的目的,在于揭示量测对象的某些性质。有时,欲了解的性质是能直接测出的,例如某些元素的含量等,但更多的情况是无法直接测试这些性质,这后种性质称为“隐含”的性质。例如,做奶的分析,人们可以测出奶中蛋白质、脂肪或其它组分的百分含量。但如果需解决的是一个涉及产品辨识的问题,例如需确定给定的奶样是牛奶抑或是羊奶,这种性质无法直接量测,因奶的来源是一种隐含的性质。在这种情况下,如果分析工作者仅提供奶样的成分含量分析数据,问题并没有得到解决。 如何由分析数据(奶样成分分析结果)上升到有用信息(奶样来源的确定),以解决相关的实际问题(例如产品的真伪辨识等)? 化学模式识别正是解决这类问题的化学计量学手段。实际上,在奶样的成分(分析数据)与奶样的来源(牛奶或是羊奶)之间,存在着内在的关系,这类关系可能已为相关的科学所揭示,亦可能尚属未知的关系。化学计量学的发展,使分析工作者有可能在与分析对象相关的学科提供的知识尚不完善的情况下,从分析数据中最大限度地提取有用的信息,化学模式识别成为我们化学量测数据转化为解决实际问题所需的信息的一种重要手段。 目录 4.1 化学模式空间 4.2 模式空间的距离与相似性量度 4.3 线性学习机 4.4 K—最近邻法 4.5 原始化学量测数据的预处理 4.6 参量选择 4.7 降维与显示技术 4.8 无监督的分类:聚类分析 4.9 化学模式识别的应用 4.1 化学模式空间 任何样本j可用一组参量xij(i=1,2,…,d)来表征。在化学模式识别文献中,这种参量值又称特征。例如第j个奶样,可以用其蛋白质含量x1j、脂肪含量x2j…等来表征。在许多情况下,这些参量实际上就是原始化学量测数据。除化学量测数据外,有时还可以包含一些物理的或其它数据,例如色、香、味等。每个样本的所有量测值构成一个化学模式,或简称模式。 4.1 化学模式空间 在二维空间,即当d=2时,每个模式就是平面上的一点(如下图) 4.1 化学模式空间 在化学模式识别中,如何选取表征样本的参量很重要,例如要确定奶样是牛奶还是羊奶,应尽量选择对牛奶和羊奶有所区别的参量(例如选定成分的含量)进行测试,摈弃对牛奶与羊奶完全等同的参量,才有可能成功地区分牛奶和羊奶。 奶样的例是一个双择分类问题,即需确定样本是属于A类或B类。如果存在这种参量,可唯一地确定样本是属于A或B,则所涉及的课题是一个简单分类问题,毋需使用化学计量学的方法。例如,设对血或尿中某一特征组分进行临床化学分析,即能确定病人是否患某种疾病。在这种情况下,化学分析数据能简单地直接转化为有用信息,但一般而言,单靠一种参量就能做直接判决的情况较为少见。 4.1 化学模式空间 例如下图的情况: 4.1 化学模式空间 一般而言,仅增加一个参量,难有如此显著的改善,但由一维空间过渡到d维空间,d愈大,改善程度愈大,则是普遍的规律,这是由于客观世界本身就是多维的,因此,我们应善于用多维的思维方法处理问题。而提供多维数据的能力恰巧是现代仪器分析方法的特征。仍以奶样为例,用传统的分析方法分析奶样,每增加一个维数,需要多使用一种奶中组分的分析方法。例如脂肪的测定方法,与蛋白质的测定方法可能完全不同。 4.1 化学模式空间 但用现代色谱分析技术,即使奶中有数十个成分,在理想的情况下,仍可能设计一种分析方法,一次得到几十个色谱峰,每一个峰的位置代表了不同组分,其高度或积分面积代表了各组分的浓度。也就是说,以几十个不同的色谱峰高作为参量,可以简便地获得d值达到数十的化学模式。取得这种化学量测数据所需的时间,可能并不比用传统纯粹化学方法作一个组分测定建立一维模式所需时间更长。 4.1 化学模式空间 化学模式识别的目标可表述为:给出一系列参量(化学量测值)表征的样品集,能否预测样本的某种无法直接量测的有用性质?这里,当然需要假设这种无法直接量测的隐含性质,与可量测的参量之间存在某种内在的,即使是当前尚未能阐明的关联。 化学模式识别是建立在一个十分直观的基本假设之上的,这个假设就是“物以类聚”,即性质相近的样本在模式空间中所处的位置相近,它们在空间组成“簇”。这里涉及的性质是我们欲予以分类的隐含性质,例如就奶样的来源而言,由奶牛产出的奶(牛奶)都是相似的。从上图的例子看,在d维空间(此例中d=2),A与B各形成一个簇。 4.1 化学模式空间 对于m个样本的集合,可写成: E={1,2,3,…,m} 簇可定义为E的一个非空子集 C ? E 及C≠Φ 分簇是指划分簇C1,C2,…,CK(簇集),这个簇集满足以下两个条件: E的每个样本均属于某一个簇 C1UC2U…U Ck=E E的每个样本仅属于一个簇,即对任意i ≠j Ci∩Cj= Φ 4.1 化学模式空间 从前面的讨论,会得到一个结论:d值愈大愈好。
您可能关注的文档
最近下载
- 【复旦大学-高级病理生理学学习】_脂质代谢紊乱及其相关疾病.ppt VIP
- 2025年昆明市规划设计研究院有限公司招聘(6人)备考练习题库及答案解析.docx VIP
- 全等三角形旋转模型(解析版) -2021年中考数学复习重难点与压轴题型专项训练.pdf VIP
- 医疗器械注册质量管理体系核查指南-解读.docx
- 国开学习网《成本管理》形考任务四答案.pdf
- 汽车换挡器基础知识跟设计要点资料精.pdf VIP
- 学术规范与论文写作(雨课堂)期末考试答案.docx VIP
- 苏州市“吴地工匠”职业技能竞赛暨第九届“吴中技能状元”职业技能竞赛人工智能训练(数据标注)理论题库及答案350题.docx VIP
- 2025工业企业二次数据治理实践指南白皮书.pdf VIP
- 2024学年广东省佛山市顺德区物理高二第一学期期末预测试题含解析.doc VIP
原创力文档


文档评论(0)