神经信息学中的数据挖掘.doc

下载文档 降价啦

1
0
约8.81千字
约 6页
2017-09-02 发布于湖北
举报
版权申诉
保障服务

神经信息学中的数据挖掘.doc

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

神经信息学中的数据挖掘汲业大连理工大学神经信息学研究所 jeeye@163.com 1引言一门新兴交叉学科——神经信息学（Neuroinformatics））[9]。1995年10月该计划的修订版本发表，要求每个课题应包括脑（含行为）和信息学两方面的研究内容[10]。信息学方面的研究包括：数据库建立、查询方式、数据重获；数据的可视化和可操作性；数据的整合与合成；联网工具；在现有信息工具和资源之间建立桥梁。脑和行为方面的研究，则包括不同水平的结构和功能关系的研究。1997年，人类脑计划在美国正式启动，其核心内容就是神经信息学的研究。国际社会对神经科学极为重视。美国总统和国会把90年代定为“脑的十年”，美国国立卫生研究院1997年度直接与神经科学有关的经费投入为18亿美元，是其在人类基因组计划中所投入经费数量的10倍多。我国也十分重视人类脑计划与神经信息学的研究。继2000年在海口召开了首届中国神经信息学讨论会之后，2001年9月3～5日又在北京召开了“人类脑计划和神经信息学”168次香山科学会议，随后，中国成为人类脑计划的第20个成员国，这标志着我国科学家已经系统地、规范地步入这一前沿科学领域。从国际科学界看，早在50年代，部分控制论的先驱者就开始关注神经系统。从60年代起，一批分子生物学的开创者，包括诺贝尔奖得主、英国科学家克里克（F.Crick）））射线的核素标记的化合物注入人体，它们进入脑部，在体外测量射线而获得这种标记化合物在脑内分布的断层图像；PET是把发射正电子的核素标记的化合物注入人体，它们进入脑部，同时在体外测量正电子湮灭射线而获得这种标记化合物在脑内分布的断层图像。PET多用F标记的葡萄糖获得脑内血流的图像，可以进行人认知活动中脑激活区的定位；近年来在磁共振成像技术的基础上发展起来的脑功能磁共振成像技术（fMRI）是进行脑功能成像的新手段，它所检测的是脑功能区血氧水平（BOLD）的变化，将受试者放入没有危害的磁体中并给某种刺激，处于兴奋状态脑区中的含氧血红蛋白（抗磁性）补充超过氧的正常消耗，去氧血红蛋白（顺磁性）的相对含量减少，这种磁性的变化在相应的MRI像中表现为高信号强度。用这些技术得到脑功能的三维图像，其空间分辨率为数毫米，但时间分辨率较差。于是，通过对所希望研究的脑功能进行特定设计和控制,应用这些无创性脑成像技术，就可获得大量的实验数据，给研究不同功能状态的脑区激活模式带来了希望。但脑成像具有数量大、类型多、维数高和联系紧密的特点[10]。在采用无创性脑功能成像后，产生的数据是海量的，这是其它学科不能比的。其众多类型既来源于从无脊椎动物到人类的大范围种类的研究，也来源于各种水平的生物机体研究，包括分子、细胞、组织、器官以及各种水平的相互关系；此外，还来源于神经科学对整个生命过程中健康和非健康状态各式各样的理解。数据维数则不仅有二维、三维,还出现了第四维（时间）；而数据紧密联系程度更是复杂,至今其信息处理机制还没形成一个统一的框架。如何处理这些神经数据目前已成为科研机构所面临的关键性问题。跟上并整合所有的信息，已经远远的超出了每个研究者能力的范围，并且随着学科专业化程度的提高，每个研究者能力的范围还在相对地缩小，因此需要采用新的方法和工具来储存、整合、分析这些数据，信息学的研究恰好有助于寻找这些问题的解决方法。神经科学与信息科学的结合势在必行，由此形成的神经信息学正是体现了这种必要性。 3脑成像数据的数据挖掘方法对于脑成像数据的挖掘目前多是利用空间范围的统计学方法，例如流行的SPM就是对从fMRI或PET中得到的数据做假设检验的软件[2]。而把目前先进的数据挖掘的方法应用于脑成像数据在国外尚处于探索阶段。 3.1 SPM的数据挖掘方法 SPM是由英国Hammersmith医院的K J Friston等人在通用数学软件包Matlab上开发的软件系统。其统计功能非常强大。现在我们能用到的SPM99升级版的功能更是强大(((。 SPM对脑功能成像数据处理的过程一般为：首先将动态原始数据三维图相配准，以消除动态扫描过程中的头动(静态则不需要此步骤)。然后将每个人的图像都标准化到Talairach标准脑图上来，这样既可以使每个被试的脑图像在空间上保持一致便于逐像素点统计，又可以用同一的坐标来描述结果。标准化后的图像还要经过平滑处理提高信噪比，从而形成中间数据。接着，对平滑数据建立模型，进行逐个点的统计检验。在统计方法中我们最常用的是T检验，用来表示象素点的信号在功能性刺激和静息间发生变化的差异。最后选择某一置信水平，得出该置信水平下的统计参数图。由此可见，SPM的参数图像是许多单次扫描图像所包含信息的精简和压缩。这样有利于我们读取和理解。它的主要贡献是解决了不同图像数据间的比较