- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于没有交集的主成分模型下的模式识别方法外文文献及翻译大学论文
xx工 业 大 学
毕业设计(论文)外文资料翻译
学 院:
系(专业):
姓 名:
学 号:
外文出处: Pattern Recognition
附 件: 1.外文资料翻译译文;2.外文原文。
指导教师评语:
签名:
2010 年6 月 日
附件1:外文资料翻译译文
基于没有交集的主成分模型下的模式识别方法
化学计量学,化学研究所,离群这些模型可以用来解决问题的一般分类和处理上面讨论的其他问题。这些是后来证明本文是基于简单的泰勒展开式的模型推导。由此产生的模型形式是主成分(PC)的模型总模型由一组不相交集的模型;一个模型每个类。 不相交集的模型由福永,渡边等人福永声望调查指出,当数据分析的单一的目的是分类,你可能想放弃模型拟合的方法,而使用的特征向量,以最大限度地。福利和桑蒙,构建最优特征向量组合。因此,的建模方法是不是最有效的分类方法。有些是在牺牲效率的优势,获得各的实证模型,也在建模有特别的优势,可以近似的类内任意连续的行为,此外,他们在测量空间的线条或超平面,这使得他们很容易映射和可视。本文的目的是在化学和生物学中使用了重点的的。因此,。作为一个例证,该方法适用于数据。类模型在模式识别方面的框架的本质,承认事实,即在一个单一的独立的类的对象,某种相似方式。在此相似,一个数学模型,在相当假设上在一个类描述了的行为因此,总的数学模型,包括为每个类一个不相交的的集合。通过对对象的观察“”分类(这些对象参考),在不同的相似性模型的参数估计(给定的数值)。未分类的对象,根据这他们最适合模型所有的参数化类模型然后分类。的可能性,可能是一种新的,以前的任何已知的类模型。因此,两部分框架组成数据和通过这些相似。这些数据包括测量值(索引i)在一个的数目(指数K)。作为一个例子,使用费雪的经典数据。该测量萼片萼片花瓣花瓣宽度。此外,认为属于给定的这些类通常。这些对象构成的参考集,有时也被称为训练集(每类1套)。山鸢尾维吉尼亚鸢尾,这些鸢尾分为两部分,第一25个为集和测试集为(后者25所假定为未知的分类)。另见附表1和2。这些数据表示为yik,共同形成尺寸M * N的(图2)的观察矩阵Y。在本文章中,这将是假设的矩阵Y完即所有的M变量衡量全部N对象。这是没有必要的假设,然而,当数据丢失模型工作,另见第3节。一个M维向量形式的对象所作的观测,可以因此被看作是一个m维空间中的点代表,这里所谓的测量空间。2.1.1转化数据。理想情况下,变量应根据其相关加权特定的分类问题。然而,有关这方面的资料之前,很少用。,习惯的变量,让他们平等的重(等于方差),所谓。这可以对参考集的基础上或使用所有可用的数据。在本例子中的4个变量的方差是相似的,但是,没有数据的已经。如果一个变量的值的分布是非常,,大多数测量比较小,但一些非常大,采取对数或平方根观测值或使用其他特殊转换可能是不切实际的在目前这个例子来说,没有这样的转变。2.2相似型目前的为每个单独的类定义一个单独的模型。因此,让我们考虑一个n个,按照定义,在某些方面是相似的单个类。在每个对象,矩阵Y 测定M的变量的值如果类的是相同的,除了由于测量误差小偏差值eik所有变量是相同的因此,对于这个简单的例子,在一个类中的数据可通过模型描述然而,方程(1)往往是的.基本假设即在一个类的对象是如此相似,他们几乎是一致的,是实际情况很少。如果我们假设都不同,第二个模型得到(见附录和导1。1)最后,之间的较大的变化,导致了相似模型(见附件可以看出,所有三个模型(1-3)分别被,1和A如果现在的对象来自的),数据可以由一个不相交的数量模型描述:对应的单级模型(1),(2)及(3)分别为零,一个或更多 让我们进一步为每个类残余方差限制,σ。模型1的几何表示,一个σq为半径的测量空间领域(图3)。这个简单的模型,事实上,很的基础,两点之间的欧氏距离是两个相应之间的相异测量空间几何模型(2)是一个半径σq(图4)模型(3)由更高的。该模型(4)利用测量和之间的变化假设的连续性获得因此,只要这些假设能够实现,在一个类中的数据不论其结构可以被描述模型(3),如果够都包括在内。因此,反过来,模型(4),该参考集数据矩阵的足够大,估计在类的数据完整的描述。这些特性
文档评论(0)