- 12
- 0
- 约5.38千字
- 约 19页
- 2019-11-13 发布于湖北
- 举报
长春工业大学本科论文外文资料翻译
毕业设计(论文)外文资料翻译
学 院: 计算机科学与工程
专 业 班 级: 计算机科学与技术120402
指 导 教 师: 徐 中 宇
姓 名 学 号: 周博文
外 文 出 处: OALib Journal
PAGE
PAGE 2
OnCoarseGrainingOfInformationAndItsApplicationToPatternRecognition
在百度学术等其他期刊都可找到这篇文献
信息粗粒化及其在模式识别中的应用
阿里加德利?
泰勒马克大学学院 波斯格伦 挪威 2014/11/13
摘要
我们提出了一种方法,它是通过观察,分类成不同的类别的数目的方法。为了证明这种方法,该方法是基于有限混合模型的一组数据。我们展示了如何通过使用最大熵方法与Pythagorean均值守恒的方法推导出混合模型的组分密度,我们可以推导出几个属于Pythagorean均值族的分布实例,还讨论了模型参数的估计,并且给出了类别的数量.
一、介绍
任何科学研究的目标就是在观测中发现规律,并把它们分为有可能分开的h和更简单的结构或类别. 反过来说,这些类别也可以用来推论出我们感兴趣的对象,这种方法的主要优点是把一个复杂的现实分解成一个简单的结构集合. 在模式识别中也有类似的方法,这个方法与发现数据中的规律有关,该方法是通过使用计算机算法来实现的,这个算法可以将数据分类成不同的类别[Biso6].任何这类的分析都必须先从定义类别开始,如果有足够的类别及其种类的信息,确定一个精确的定义将会很容易. 然而,在大多数现实情况来看并不是这样,类别的概念很难被精确定义. 在这种条件下,一个好的方法就是,将一个类别作为可以分享相同属性的对象集合. 也就是说,在现有的信息还不足以确定的情况下,我们应该量化一个对象,其属于一个已知类别. 这个类别是通过概率描述,并分布在所关注对象的空间中.
该类文学作品的主要内容是讲述处理数值方面的问题,数值的挑战会严重损害一个方法的适应性,这一点不容置疑,但是我们认为,在部分认识的情况下,建模类别的问题同样重要,在下面我们将看到一类模式识别的问题,其中一个是拥有利益对象的经验分布(直方图)和有关类别数目的先验知识,我们提出一个基于有限混合模型的方法,并对经验分布建模,它依赖于确定每个类别的相关密集性. 为了证明这个方法,我们将展示Pythagorean均值守恒,它是最常见的类的密集性,结合最大熵方法可以用来推导出混合模型的函数形式.在这篇文章中,我们限制自己使用正连续单变量的数量. 我们还将简要讨论扩展的守恒量,并且给出一个简短的概述,这是是关于推理问题的数值挑战.
二、混合模型
在不能精确定义类别的情况下,概率描述也许是唯一可能的选择. 在概率的框架中,我们只能讨论属于某一类对象的可能性. 为此,让我们假设一些实验可以观察得到X,但是它并不足以能由自己唯一确定它所属的类别. 例如,该观察可以是某些地区/国家的人的年龄,其中潜在的类别是每个人都可能属于的年龄组. 在这种情况下,考虑X作为一个随机变量,并尝试对其概率密度函数P建模. 一种为P型的方法是基于所谓的有限混合模型[TSM85].在这种方法中的基本假设是p为k密度的凸组合,其中每个密度都代表单个类别。
其中
和
和
在这种情况下,有人说X是有限的混合分布的参数,而且p是一个有限混合密度函数,πj被称为混合权重和fj的混合物中组分密度参数. 在模式识别的范畴中,k是类别数,fj是说明类别j的成员分布的密度函数. 我们应该强调的是组分密度是不一定属于同一密度族的. 每一个组分密度都代表了我们对各自类别结构的最佳猜测 ,其存在是独立于其他类别。
考虑到先验人知道类别的数目,为了能够采用混合模型用于特定的问题,需要去处理两个不同的问题,第一个问题是确定如何实现对局部知识的状态的定量描述,即确定这个组分密度函数的形式. 第二个问题是基于现有的证据来确定ψ,即经验密度.
三、组分密度的测定
一般情况下,同一类的对象比那些在其它类的对象更相似,这种相似性调用了这个概念,它是可以区分彼此类别的粗级属性. 事实上,如果我们考虑一个类作为一个同类的[1]群体,在这个群体里的成员被认为是相似的,那么,区分自己与其他类别的这个属性应该是内在的,独
原创力文档

文档评论(0)