医学论文-LIDC中肺结节注释信息的提取及数据库的建立.docVIP

医学论文-LIDC中肺结节注释信息的提取及数据库的建立.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医学论文-LIDC中肺结节注释信息的提取及数据库的建立

医学论文-LIDC中肺结节注释信息的提取及数据库的建立 【摘要】? 目的: 对LIDC数据库的注释文件中有关肺结节的相关数据进行提取、整合、汇总,并导入到Access数据库表中。方法: 通过对LIDC数据库XML格式的注释文件的分析、解读,利用Visual Basic语言编程提取数据,并导入到Access数据库表中。结果: 数据提取和显示程序将LIDC中的68个病例的相关数据(如病例号、专家号、结节号、结节的各种CT征象、结节的X坐标和Y坐标等)加以提取和显示,并保存到数据库中。结论: 将LIDC数据库中包含的每个病例CT图像的XML格式注释文件导入到Access数据库中,较之纯文本格式的数据组织更加结构化,进而可以借助数据库强有力的数据管理和查询功能对CT图像上肺结节形态、位置、CT征象等进行查询和比较。 【关键词】? LIDC; XML文件; Access数据库; CT图像 1? 引言 ??? 随着科学技术的不断发展、更新,现如今医生进行医学诊断的方法与模式已经发生了巨大的转变。与过去仅凭经验、惯例等不同的是,现今的医学诊断更多的倾向于科学的、数字化的精细诊断模式,其中最为突出的示例就是计算机辅助诊断及计算机辅助检测的飞速发展。 ??? CT的计算机辅助肺癌诊断的研究证实,CAD技术可以为病变部位的探测提供有效的帮助,甚至可以在连续的CT检查中辅助确定病变部位是否稳定或是否发生了大小的改变。为了为各种图像处理或CAD技术的相互比较和测评提供一个参考数据库,美国国家癌症研究会(NCI)于2001年4月起陆续颁布了肺部图像数据库联盟(Lung Image Database Consortium,LIDC)。该影像数据库可以通过互联网访问和下载[1]。目前LIDC包括68个病例的约10000张全肺CT扫描图像(扫描层厚1.25mm~3mm,512×512像素),总容量超过6GB。每个病例对应一个文件夹,包括完整的肺部CT扫描图像(DICOM格式)100~300张,以及一个注释文件(XML格式)。在注释文件中给出了4名放射学专家对每张CT片中出现的结节的定义,包括结节的主要CT征象,如毛刺征(Spiculation)、分叶征(Lobulation)、钙化(Calcification)等以及结节的恶性度(Malignancy)。 ??? 由于LIDC数据库中病例的注释文件是采用XML格式编写的纯文本文件,所有注释内容均以标识符加以区分,不具备数据的查找、统计等功能。本研究将LIDC数据库所提供的原始XML注释文件信息加以提取,建立相应的Access数据库进行存储,方便其他研究人员的使用。 ??? 2? 方法与实验 ??? 2.1? XML注释文件 ??? 2.1.1? XML文件? XML文档是由元素组成的,每个元素都包含一个“起始标记”(如 )、一个“结束标记”(如),以及两个标记之间的信息即元素的内容。元素可以使用属性进行注解,属性包含了关于元素及其内容的元数据。XML信息集主要用作各种XML技术使用的定义集,以正式描述需要技术处理的XML文档部分。XML信息集是XML文档的树状层次表示。一个XML文档的信息集包含许多信息项,这些信息项是XML文档组件的抽象表示,其中包括表示文档、文档的元素、属性、处理指令、注释、字符、表示法、命名空间、未分析的实体、未扩展的实体引用和文档类型声明的信息项。 ??? 2.1.2? LIDC提供的XML格式数据示例? 在每个病例的所有CT图像后面都有一个注释文件,其中给出了4名放射学专家对每张CT片中出现的结节的定义,包括结节的主要CT征象,如毛刺征(Spiculation)、分叶征(Lobulation)、钙化(Calcification)等以及结节的恶性度(Malignancy)。对于大结节(直径≥3mm的结节),给出了轮廓点的坐标,小结节(直径<3mm的结节)给出了中心点的坐标。所有信息的含义定义在一对标签中。一个典型的XML文件片段如图1所示。 ??? 2.2? 存储LIDC中肺结节数据的数据库 ??? 从每个病例的原始注释文件中提取如表1所示的基本信息,并写入相应数据库表的字段中。表1? 存储LIDC中肺结节数据的数据库表的结构注:如CT图像上某一结构为小结节(直径小于3mm)或非结节,则上述字段4~12的取值均为0。 ??? 2.3? 提取LIDC中肺结节数据 ??? Step 1? 提取患者号,以作为患者号的标识符。 ??? Step 2? 提取专家号。注释中未给出放射学专家编号,但是通过对文件的大体框架的分析可以看出,每一对中包含一位专家对这个病例做出的诊断。所以通过筛选,可以将专家号分别定义为A、B、C和D。 ??? Step 3? 判别是否为结节、非结节或是另一名专家的诊断。

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档