基于图形处理器加速医学图像配准技术进展.docVIP

下载本文档

6
0
约1.72万字
约 30页
2018-08-29 发布于福建
举报
版权申诉

基于图形处理器加速医学图像配准技术进展.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于图形处理器加速医学图像配准技术进展

基于图形处理器加速医学图像配准技术进展　　摘要：　　针对目前医学图像配准技术无法满足临床实时性需求问题，对基于图形处理器（GPU）加速的医学图像配准技术进行综述探讨。首先对GPU通用计算进行概述，再以医学图像配准基本框架为主线，对近年来基于GPU加速的医学图像配准技术在国内外发展现状进行深入研究，并针对正电子发射型计算机断层显像（PET）和电子计算机断层扫描（CT）数据的非线性配准问题，分别基于中央处理器（CPU）和GPU平台进行配准实验，通过实验结果的对比，体现GPU加速配准技术的优越性。基于GPU加速的自由形变（FFD）和归一化互信息（NMI）结合的非线性配准方法配准后互信息值略低于CPU平台的配准结果，但其配准速度是CPU平台的12倍。基于GPU加速的配准算法在保持配准精度的基础上，配准速度都得到了很大的提升。　　关键词：　　医学成像；图像配准；图形处理器；加速；空间变换　　0 引言　　医学图像配准是针对不同时间或不同模态的两幅医学图像，寻找某种空间变换，使两者达到空间位置和解剖结构上的一致，要求配准后的两幅图像上所有的解剖点或至少是所有在临床上具有诊断意义的点都达到匹配[1]。而医生进行诊断治疗，需要对医学图像中携带的解剖、生理及病理信息建立空间和时间关系，这使得图像配准已经成为一项常见的临床工作流程，广泛应用于病情监测、图像引导介入治疗[2]以及治疗效果评估等方面。　　由于诊断需求，病人需要进行多次（不同时间或不同模态）扫描。不断增加的图像数量以及临床的实时性需求，促使人们寻求更高效的配准方法。这个需求可以从两方面解决：一是优化设计配准算法，提高计算效率；二是充分利用图形处理器（Graphic Processing Unit， GPU）的计算能力，将配准过程中的大计算量步骤移植到GPU中进行，达到加速配准进程的目的。本文针对后一种配准加速方法，首先对GPU通用计算作基本介绍，再以医学图像配准基本框架为主线，调研近年基于GPU加速的医学图像配准技术的研究进展，讨论并指出了目前GPU加速配准技术的优缺点及研究前景。　　1 GPU通用计算概述　　1999年，英伟达公司（NVIDIA corporation）发布第一款GPU，主要由两个模块组成：进行32位浮点数运算的顶点处理器，以及进行定点数运算的像素处理器。此时的GPU只能处理顶点的矩阵变换，进行光照计算，不可编程。受游戏市场中愈加复杂的图形效果和军事仿真需求牵引，GPU性能飞速提升，顶点和像素处理器的可编程性也日益提高。最初，GPU只能通过计算机图形应用程序界面（Application Program Interface， API）进行编程，如：开放图形库（Open Graphics Library， OpenGL）、DirectX（Direct eXtension）[3-4]等。直到2007年，英伟达推出采用统一计算设备架构（Compute Unified Device Architecture， CUDA）的显卡，引发了GPU通用计算的革命。相比之前的图形处理架构，CUDA的优势在于：提供了通用的统一着色器架构，应用程序可更有效地利用GPU上的计算资源；还引入了片内共享存储器，支持随机写入和线程间通信。CUDA的推出使得GPU通用计算变得相对廉价且高效，为解决医学图像处理的实时性问题提供了可能[5]。下面将简单介绍GPU图形流水线及 CUDA编程模型。　　1.1 GPU图形流水线　　当前，GPU图形处理器的主要任务是处理视频游戏中的复杂三维场景，完成3D模型到图像的渲染工作。通常，图形API编程模型中的渲染流程可被分为几个高度并行的阶段，分别由图形流水线的不同单元进行处理。图形流水线以顶点（描述3D场景的几何结构的点、线、三角形和多边形）以及映射到顶点描述物体表面的纹理图像作为输入，输出从观测点观察到的3D场景的二维图像。以Direct3D 10为例，其图形流水线[6]主要由以下几个阶段组成，如图1所示。　　3D应用程序向GPU发出顶点序列，经输入装配器收集后，顶点渲染程序将每个顶点的3D位置转化成屏幕位置，并点亮顶点，决定其颜色。几何渲染程序处理3D场景的几何结构后，再建立和光栅化单元建立像素段，由像素渲染程序对每个段添加参数、纹理以及颜色。最后经光栅操作将段颜色和像素颜色合并后写入像素点。其中，顶点、几何和像素渲染为可编程阶段，其他则为固定功能模块。　　1.2 CUDA编程模型　　CUDA不需要借用图形学API，而是对C语言进行扩展，使用CUDA C/C++进行开发。图形流水线中，GPU代码和中央处理器（Central Processing Unit， CPU）代码是严格分开的。CUDA则与之相反，GP