- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
纸型识别的数学模型—Bayes多组判别分析
一、 问题的提出:在公安侦破工作中,需要诊断根据某一碳化纸张化学成分的分析数据以识别这一纸类的属性,为进一步的侦破提供准确的数量依据。
二、纸型识别的数据模型Bayes多组判别分析
1. 模型: 我们知道,在两组判别分析时,确定样品的归属是用一个线性判别函数式(在m=2时,判别函数为一个平面),把整个空间划分为二个区域。那么,在三组情况下,就需要三个判别函数式把整个空间划分为,四组就要求6个判别函数式。这样,随着组数的增加,判别函数是个数就增加很快,使用中很不方便。
因此,对于多组判别,我们不是计算组间判别函数式,而是计算新给样品属于各组的概率,即对于一个新给样品的观测数据,判别它到底属于已知个组的哪一组的方法,是计算属于第组的概率,比较的大小,将这个样品归入概率最大的这一组。
如果
将这个样品归入概率最大的第k*这一组。
2.数据:已知有个样品,每个样品有个指标的观测数据,而个样品又分别归属于个组,且每个组样品个数不一定相等,设第组的样品个数为。因此,对于每个已知观测数据可以写成下列的形式:
其中,表示第组,第个样品,第个指标的观测数据,而第一组样品的观测数据是:
第组样品的观测数据是:
上面这个组样品时已知根据所研究各种纸类的各种指标来进行划分的。现在的目的是要对已知划分为个组样品,根据个指标的观测数据求出判别函数,以便于对于任何一个未知样品(一般来说,并非上面这个已知的样品之一),都可根据这个样品的个指标的观测数据,通过判别函数判断它应该属于哪一组。
因此,这个方法的关键就是要给出一个计算的公式,下面就来给出的计算公式及其相应的理论说明。
设是第组第个样品第个变量(指标)的观测数据,
假设各组的样品都是相互独立的正态随机向量,即
其中,是组个变量的数学期望(向量)、是相应于第组个变量的协方差矩阵,在条件中,我们假定即个组的协方差矩阵是一样的,所不同的仅是个均向量。
于是根据个样品就可估计各组的及协方差矩阵。由多元正态估计,相应的估计量是:
(1)
其中
把这些估计量代入各组的分布密度表达式内,就得到各组的各变量的联合分布密度。
以第组为例,变量在第组的概率密度
其中,为总的协方差矩阵,是逆矩阵的第行第列上的元素。
任意给定一个新的样品,观察此样品的个变量所取得的值是,假定这个样品来自各组的可能性是一样的。于是,由贝叶斯公式,可以根据的数据算出这个样品来自第组的概率 (称为后验概率,它的贝叶斯解可参看[1])
其中,为样品 在第组的概率密度,它可由(15)算出;为第组的先验概率,实际应用中往往把样品的频率作为先验概率的估计值,即
因之,我们判别的准则是使为最大。事实上,如果概率密度为已知,且样品来自各组的可能性是一样的,则我们可以建立判别函数
如果
则把样品划归第组,所以,在判别是,我们只关心寻求使判别函数为最大的由于
故可对上式分子取对数:
其中及与有关,分别令
则
于是
从而
由(19),使为最大的其必为最大,因之,我们只许把样品代入(18)式中,分别计算出:
若
则把样品划归第,成为多组判别的判别函数。
3.计算步骤
(1) 计算每组各个变量的平均值:
(2) 计算各组的离差矩阵:
用表示第组的离差矩阵,用小写字母表示中第行第列上的元素
即
(3) 计算总的协方差矩阵:
(4) 求的逆矩阵
(5) 计算各组的判别函数:
设是逆矩阵的第行,则计算
(22)
由、可以定出第组的判别函数:
(23)
(6) 计算新样品属于第组的概率:
计算分类矩阵:
矩阵的元素用表示, 的数值
是
=原属第组的个样品经用计算后重新分组时属于第组的个数。
很明显,如果, 那就说明计算出后再判别属于哪一组的准确率(对原来的个样品来说)达到了百分之百,可见,与越接近越好。
4.辅助性检验
在实际工作中,已知个样品分成个组,组与组之间的差别客观上是清楚的,然而,有可能由于我人选取的变量没有反映组间的差别,因此需要观察一下这个变量是否有能力来区分这个组。这就要用广义的马哈拉诺比斯统计表量来进行检验。
的计算步骤如下:
计算各个变量总的平均值
用3中求得的计算
(24)
而统计量遵从个自由度分布(在正态分布各组之间均值,协方差全部相同的情况下)查表就可定出的临界值,当算出的大于临界值时,可能断定这个变量是能鉴别这个组的,否则,就表明这个变量还不足以鉴别这个组,应引入一些新的变量。
5.成果的有效性:经对常用的531个纸样及17个模拟样的纸类鉴别,准确率达到100%。对于案件侦破中提出的纸型予以识别确诊,有力地支持了破案工作,获公安部的认可。此项分别获1987公
您可能关注的文档
最近下载
- 电力电子技术阮新波习题答案.pdf VIP
- 2022年小学低段数学新课标解读心得体会(通用12篇).pdf VIP
- 2025贵州黔南州瓮安县招聘社区工作者50人考试参考试题附答案解析.docx VIP
- 统编版(2024新版)七年级上册道德与法治期末复习课件.pdf
- (完整版)动词单数第三人称练习题.pdf VIP
- 学术规范与论文写作(雨课堂)期末考试答案.docx VIP
- 《GBT27543-2011-手推升降平台搬运车》.pdf
- 办公室消防安全知识培训教育.pptx VIP
- 剪映短视频策划、拍摄、剪辑实战教程:短视频策划PPT教学课件.pptx VIP
- 河湖生态护岸工程技术导则.pdf VIP
原创力文档


文档评论(0)