- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章独立分量分析在模式分类特征提取中的应用.doc
第章 独立分量分析在模式分类特征提取中的应用
4.1 数据说明在本章,我们主要讨论ICA在模式分类特征提取中的应用。ICA在特征提取中的应用主要是对图像进行特征提取,在这里我们试用ICA方法像进行特征提取对项目中的鼻咽癌病人的头发中微量元素含量水平数据进行特征提取。
此组数据一共有130个人参加检查,其中30个健康人,100个病人,其中100个病人中有53个人经过了一个疗程的治疗,有23个人经过了个疗程的治疗,检测了头发中的11种微量元素,共206份样品数据数据微量元素。所有数据以.mat格式存放在np.all中,elements、k、kk、np_original、npp和npp6具体如下:elements:检测的头发的11种元素,分别为Zn、Ti、Cr、Mn、Fe、Co、Ni、Cu、As、Pb、Sr;k:参加检测的四类人健康人(health ,30个),初始病人(npc,100个),经过一个疗程治疗的人(npc-1subs,53个),经过两个疗程治疗的人(npc2subs,23个),类别号分别为1,2,3,4;kk:206个数据的类别号;np_original:获得的原始数据,以矩阵(这里,)存放,矩阵的行表示参加检查的人,矩阵的列表示参加检查的人的11种头发微量元素的含量水平;npp:对“丢失值”和“”进行处理后的数据,试验过程中,因为一些不可控制的因素,np_original中有的值可能没有观察到(为0),我们称为“丢失值”,有的值可能很大或者很小,超出 范围的点称为“”(这里 是均值、标准),“丢失值”用相应类的均值代替,“离群值” 用相应类的值或)代替从统计原理我们知道当原始数据的量级和量纲存在较大差异时,需要先对数据进行标准化,标准化方法是将原始数据的各列除以各列的标准差:。
从ICA的理论分析中我们知道当随机变量是非高斯时ICA才有意义,下面图4.1是鼻咽癌病人头发微量元素含量水平数据的直方频率分布图。图4.1明,11种头发微量元素含量水平的分布图有一个长长的“尾巴”,除了Zn的分布接近高斯分布外,其他元素的分布都是非高斯分布,非对称,满足ICA的非高斯的要求,因此可用ICA方法对这组数据进行特征提取。单个元素判决能力的评价
在进行诊断时,每个元素都有一定的判决能力,如果用单个元素进行诊断,则判决能力最强的元素可以作为诊断指标。在使用模式分类系统进行诊断的时候,所用的元素越多,诊断的正确率越
图4.1: 所有人的11种头发微量元素含量水平的直方分布图
高,但检测的元素越多,花费的成本也越大,因此,我们应该用尽量少的元素来进行诊断分析。选择哪些元素来进行诊断呢?我们就要对每个元素的判决能力进行评价。有几种方法可以对单个元素的判决能力进行测试[],如:K-W 检验, histogram方法和熵法。在这里,我们采用histogram 方法对单个元素的判决能力进行评价。histogram方法是用ROC (Receiver Operator Characteristic) 曲线下的面积大小来对单个元素的判决能力进行评价的。这种方法只能用在两类分类中,选择一个点t 作为两类的判决点第1类的错误率用()表示, 第2类的错误率用()表示。不同的t对应一系列不同的点,如图4.2是health npc-initial两类人的Cu (面积最大)和Cr (面积最小)的ROC曲线。ROC曲线的面积A 越大,相应元素作为诊断指标的能力越强。
图4.2:health Npc-initial两类人的Cu和Cr的ROC曲线
health vs npc-initial、health vs npc-1subs、health vs npc-2subs 两类人之间Zn, Ti, Cr, Mn, Fe, Co Ni, Cu, As,Pb和Sr的ROC曲线的面积表1:Histogram 方法ROC曲线下的面积
Elementhealth vs npc-Initial health vs npc-1subs health vs npc-2subs Zn 0.5938 0.5408 0.5580 Ti 0.3056 0.3694 0.3997 Cr 0.2620 0.1743 0.0987 Mn 0.6746 0.6043 0.6080 Fe 0.4613 0.5430 0.5000 Co 0.6988 0.7168 0.7482 Ni 0.6257 0.7223 0.8397 Cu 0.8210 0.8223 0.8217 As 0.4757 0.5398 0.7412 Pb 0.5840 0.6651 0.8609 Sr 0.4521 0.4974 0.5913 从表中我们可以看出health vs npc-Initia
您可能关注的文档
最近下载
- 2025-2026学年人教版英语八年级上册UNIT 8 单元综合评估卷(含答案及听力原文,无听力音频).doc VIP
- 常用电工仪器仪表使用方法PPT课件.pptx VIP
- 2025年广东省华医网公需课考题答案—人工智能赋能制造业高质量发展.docx VIP
- 基于核心素养的初中生物实验教学设计研究报告教学研究课题报告.docx
- 物流园安全生产三项制度(安全生产责任制、制度、操作规程)汇编.pdf VIP
- 2019年山东省广播电视技术能手竞赛(网络安全)答案.doc VIP
- (9月3日)铭记历史,吾辈自强——纪念抗日战争胜利80周年初中主题班会课件.pptx VIP
- 07 保护及故障信息管理子站技术规范书(通用).doc
- 2025-2026学年小学信息科技湘教版2024三年级上册-湘教版(2024)教学设计合集.docx
- 第一届全国技能大赛贵州选拔赛砌筑项目技术文件1.docx VIP
文档评论(0)