- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
绪论
绪论
1.本论文的研究内容
本文是广西壮族自治区教育厅科研项目(桂科自0339037)“建立基于头发微量元素分析的可用于辅助诊断的模式分类器”项目的一部分。计算机辅助诊断是模式识别的一个重要的应用,目的是帮助医生做诊断决定,当然最终的诊断由医生来完成。计算机辅助诊断已经应用于实际,主要研究各种医疗数据,如超声波图、脑电图等。计算机辅助诊断的需求源于医疗数据较难解释,并且解释结果多依赖于医生的经验这一事实。本项目旨在利用统计模式识别的方法来建立基于头发微量元素分析的可用于辅助诊断的模式分类器,以揭示头发中的多个微量元素含量水平与某种疾病的发生之间的定量关系。即通过获取样品容量足够大的头发样品,和在目前的技术条件下与当前设备的检测限制的情况下,获取头发样品中尽可能多的元素水平,在此基础上探求稳健可靠的模式分类器,从而建立某一种(如鼻咽癌)或几种疾病的基于头发元素水平的辅助诊断指标。
本论文(Independent component analysis,ICA)[][2][3][4][5][6]。从数学的角度来说,用ICA方法进行特征提取就是为多维数据寻找一种变换,使得数据的特征尽可能相互独立。ICA在特征提取中的应用主要是对图像进行特征提取,尝试用ICA方法对项目中的鼻咽癌病人的头发中微量元素含量水平数据进行了特征提取。
本论文的研究内容:
本文主要的工作围绕着ICA的理论、算法及对鼻咽癌病人头发微量元素含量水平数据进行特征提取中的应用而展开,具体内容如下:独立分量分析可以有效地提取非线性可分的分类问题中的高维数据的最有效的特征。1.2模式分类概述
模式识别是一门以应用为基础的学科,目的是将对象进行分类,这些对象与应用领域有关,它们可以是图像、信号波形或者任何可测量且需要分类的对象。因此它的核心问题是有关分类的问题,许多传统学科都牵涉到分类问题。模式识别本质上是根据经验数据导出问题域系统的模型,再根据所导出的系统模型对系统的未来输入做出响应预测。因此,要建立模式识别系统对问题域系统行为进行预测,首先必须获取某种程度的经验数据。根据问题域的不同,所获取的经验数据中可能含有二值数据(0-1)、类属数据(枚举、字符等)、实数数据(任何实数)等。经验数据一般可用矩阵表示,如:
矩阵的每一列表示一可观测量(可称为特征,在此特征个数为),每一行表示一次观测(可称为样品,在此样品个数为;在统计学中,样品亦指所获取的经验数据中的全部观测值;我们所称样品可指获取的经验数据中的单次观测值或全部观测值,文中确切含义可由上下文推定);特征可表示为,样品可表示为。
样品矩阵的每一样品分别来自个不同的类别,获取时,可能已知每一样品所属的可能类别,这时,可采用有监督(亦称有导师、有教师)方法进行学习,形成模式分类算法,根据所得模式分类算法可对同一过程未知类别样品进行类属划分,有监督方法可采用句法、统计、神经网络、进化途径进行学习,具体方法有:贝叶斯方法,费歇尔方法,多重判别分析法,隐马尔可夫模型法,Parzen窗法,近邻法,二次分类器,多峰识别分类器,神经网络中的认知机,神经网络中的自适应分类器,模拟退火,Boltzmann机, 遗传算法,支持向量机等。获取样品时,若样品所属的可能类别未知,这时,只可采用无监督聚类方法进行学习,具体方法有:迭代聚类,层次聚类,自适应共振网,自组织特性映射,图论方法,主分量分析法,非线性分量分析法等。具体的模式分类算法一般与问题域密切相关,理论上并不存在对任何分类问题都具最佳分类能力的分类算法。
样品矩阵中的不同特征代表所观测对象的不同物理量或某种数量,这些不同物理量或数量之间可能互相独立,完全线性相关,或存在某种程度的相关(线性的或非线性的)。若不同特征间互相独立,但一般每一特征对类别的分辨能力不同,因而需要采用适当的特征选择方法选择最合适的特征,这样既可极大减少采样的代价,又可避免维数灾难问题。不同特征间若相关,则更需要采用适当的特征选择方法乃至特征提取方法以获得最合适的特征。在建立一个模式识别系统的工作中,特征选择与特征提取是最关键和最困难的问题,特征选择与特征提取牵涉到相关特征的分类效能评价问题,因而是和分类算法紧密关联的。因此有人说,最好的特征编码器即是最好的模式分类器。
1.特征提取
在科学研究的众多应用领域中,一个普遍存在的问题是如何从采集的数据中获取信息。随着科技的高速发展,大量数据的测量及存储已经不再成问题,但是获取数据本身显然是不够的,提取产生这些数据的系统本身的信息才是根本目的所在。而且,通常我们所获得的原始数据的数据量相当大,样本处于一个高维空间,如果我们直接用原始数据进行分类器设计的话,无论从计算的复杂程度还是分类器性能来看都是不适宜的。为了有效地实现分类识别,就要把原始数据映射(或变换)到低维空间
您可能关注的文档
- 细胞的组成成分.ppt
- 细胞通过分裂产生新细胞.ppt
- 细菌的遗传和变异.ppt
- 织金县2012年面向社会公开招聘计生系统专业技术人员职位一.doc
- 绍兴市人民医院医疗器械设备供货项目征求意见.doc
- 绍兴文理学院二三学年第二学期.doc
- 经济动态.doc
- 经皮穿刺环甲膜气管切开管置入术操作记录单.doc
- 绝密启封并使用完毕前.doc
- 绝密启用前.doc
- 2025四川南充市公路管理局南充市水务局遴选3人笔试备考题库附答案解析.docx
- 2025年清水河县事业单位联考招聘考试历年真题完美版.docx
- 2025年正安县事业单位联考招聘考试历年真题完美版.docx
- 2025年金沙县事业单位联考招聘考试真题汇编新版.docx
- 2025年乐业县辅警招聘考试真题汇编及答案1套.docx
- 2025年新龙县事业单位联考招聘考试历年真题附答案.docx
- 2025年淮阳县事业单位联考招聘考试历年真题含答案.docx
- 2025年紫金县事业单位联考招聘考试真题汇编含答案.docx
- 2025年永福县事业单位联考招聘考试历年真题推荐.docx
- 2025年睢县事业单位联考招聘考试历年真题含答案.docx
原创力文档


文档评论(0)