国家卫生数据字典.docVIP

  • 210
  • 0
  • 约5.76万字
  • 约 68页
  • 2020-02-27 发布于陕西
  • 举报
CHISC.NET - 国内第一医疗信息化网站 ,为业内人士提供最强大的交流共享平台 PAGE 附件5 国家卫生数据字典 (初稿) 卫生部统计信息中心 第四军医大学卫生信息研究所 目 录 TOC \o 1-3 \h \z \u 一、字典结构 1 1.元数据标识符 3 2.数据元表示形式 4 3.数据类型 4 4.数据格式 5 5.基本属性描述 5 二、字典内容 7 附录1 数据元条目(278个) 8 附录2 代码条目(85个) 28 附录3 大型代码表(20个) 35 附录4 词汇表条目(6个) 60 附录5 数据字典应用实例-医院出院病人数据库结构 63 PAGE 21 国家卫生数据字典(National Health Data Dictionary, NHDD)即元数据资源库(Meta Data Repository),目的是为使用者提供数据元和描述数据元的元数据,是卫生信息系统和数据库建设必须遵循的行业标准。 一、字典结构 根据元数据注册国际标准,国家卫生数据字典具有8个基本结构,见图1,其中最基本的结构是对象类、特性、表示。 对象类:现实世界中的想法、抽象概念或事物的集合,有清楚的边界和含义,并且特性和其行为遵循同样的规则,能够加以识别和标识; 特性:对象类的所有个体所共有的某种性质; 表示:值域与数据类型的组合,必要时也包括度量单位或字符集。值域是数据元允许(或有效)值的集合。比如,表示医生年龄的数据元可以用一个非负整数集(实际年龄,以年为单位)作为有效值集。另一种选择是,把有效值用事先指定的类别清单表示,且每个类别都具有一个代码值,如代码值1( 35岁),2(36~ 50岁),3(51~ 65岁),4(65岁)。前者的值域是一个非穷举域,后者的值域是一个穷举域。穷举域通常用编码系统表示,如ICD-10编码。ICD-10编码是值域的一种分类模式。 数据集和术语(词表)是国家卫生数据字典的附属结构。数据集有两个主要作用,一是用来表示需要用多个数据元表示的事务,如人的姓名的完全表示包括当前姓名、昵称、化名、笔名、中文名、外文名、曾用名、曾用名使用时间、曾用名停用时间等;二是用来规范国家最小数据集,如出生登记最小数据集、死亡报告最小数据集等。术语(词表)是供所有元数据条目参照、引用的规范词汇。 对象类是我们希望用于收集和存储数据的事物。对象类的例子有病人、医生、护士和化验单等。特性用来区别和描述对象的特征,如肤色、姓名、性别、年龄、职业、收入、住址等。另外,特性有可能需要用多个词组加以描述,这要视所用的自然语言而定。对象类和特性的组合称为数据元概念(DEC)。数据元概念是能以数据元形式表示的概念,其描述不包括任何具体的表示。例如 “医生年龄”就是对象类+特性构成的一个数据元概念,对应了两种表示:实际年龄或年龄组。因此,数据元的构成可表达为: (对象类 + 特性)+ 表示 = 数据元概念 + 表示 = 数据元 或 对象类 +(特性 + 表示)= 对象类 + 通配数据元 = 数据元 数据元(派生数据元)数据元概念值 域 数据元(派生数据元) 数据元概念 值 域 对象类 特性 分类模式 数据集 术语 (词表) 图1 元数据类型 1.元数据标识符 元数据标识符为不大于15位的字符串,见图2。 元数据类型 元数据名称 标识符 数据元 姓名 PAT01_100020 派生数据元 人口出生率 PAT020101_200001 值域 性别代码N PAT00_300031 实体分类代码 实体分类代码 元数据类型代码 NHDD元数据标识码 (5~9位) (1位) (5位) 数据元概念 派生数据元 值域 分类模式 术语(词表) 数据集 = 元数据标识符(11~15位) + + 元数据类型分类代码代码元数据类型1数据元2 元数据类型分类代码 代码 元数据类型 1 数据元 2 派生数据元 3 值域 4 分类模式 5 数据元概念 6 对象类 7 特性 8 术语(词表) 9 数据集 图2 元数据标识符示意图 2.数据元表示形式 表示形式值域 序号 表示形式 序号 表示形式 1 物理量 9 率 2 代码 10 构成比 3 文本 11 均数 4 名称 12 总量 5 识别号 13 总数 6 号码 14 总金额 7 符号 15 日期 8 比值 3.数据类型 数据类型值域 序号 数据类型 1 数字型 2 字符型 3 布尔型 4 货币型 5 日期/时间型 6 二进制型 值 表示内容 A 字符:英文字母a-z 或A-Z,也可以包含特殊字符。 N 数字

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档