- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据分类与编码标准介绍090422.ppt
数据分类与编码标准介绍 主要内容 一、背景意义 一、背景意义 内容二 标准研究意义 1.范围 2.规范性引用文件(略) 3.术语和定义(略) 1)主题优先法 2)多属性复分法 2)多属性复分法 3)组配分类法 3)组配分类法 1)主分类目界定规则 2)复分类目界定规则 3)主分类目层级约束规则 4)复分属性有限性控制 1)唯一性 在一个编码体系中,每一个编码对象仅应有一个代码,一个代码只唯一表示一个编码对象。 2)匹配性 代码结构应与分类体系相匹配。 3)可扩充性 代码应留有适当的后备容量,以便适应不断扩充的需要。 4)简洁性 代码结构应尽量简单,长度尽量短。 5)区段性 在数据集编码体系设置若干区段,每个区段表达不同的类目属性,便于实现不同维度检索。 10.分类与编码标准文档结构 内容三 * * 医药卫生科学数据共享网总中心 国家科技基础条件平台 医药卫生科学数据共享网 资源体系建设与标准规范建设培训 张业武 资源体系建设课题组 标准规范建设课题组 张黎黎 不能缺少 科学数据共享活动涉及科学数据的汇交、分发、服务和应用环节,也涉及科学数据的采集、加工和处理环节。 分类是人们认识事物的基础,对某种类别的数据作层次分类并对分类结果赋予特定代码,以达到对该种数据类别或其分类结果在语义上无歧义理解。 科学数据分类编码的目的在于准确地识别主题数据集的内容属性,将主题概念进行分析,并将分析的结果转化为分类编码语言;实施对数据的有效管理,并能按类别开发利用数据,实现数据共享。 科学数据共享 数据集内容可以从不同的属性进行划分: 疾病分类,ICD--促进死亡率统计指标的可比性; 图书文献分类、学科分类,中图法--组织藏书排架; 业务属性,数据集分类--高层进行数据归并和信息组织。 体现--数据集内容的主题属性 医药卫生科学数据集的内容,围绕数据产生过程中所容纳的一系列主题描述展开。 主题成为数据集分类与编码的内容属性之一,同时,数据集若体现机构、学科、病种等属性,也要做为内容的分类标识属性。 一、背景意义 本标准就是对医药卫生科学数据主题数据集进行分类和编码时应遵循的原则和方法,是分类和编码标准制定的指导性标准。 确立数据分类与编码的原则与方法,指导和规范各数据资源建设单位研究和制定各类共享科学数据分类与编码标准,推动和促进科学数据的集成与共享。 标准内容 封面 目次 前言 引言 名称 1.范围 2.规范性引用文件(略) 3.术语和定义(略) 4.分类原则 5.分类方法 6.类目设置规则 7.编码原则 8.编码方法 9.代码设计 10.分类与编码标准文档结构 4.分类原则 1)系统性原则 综合考虑数据主题一致性,按其内在联系进行系统化排列,确保类目唯一、结构合理、层次清晰,减少冗余。 2)实用性原则 满足数据集分类编目的简便性、可操作和通用性需求和数据集查询的一致性理解。 3)可扩展性原则 保证分类体系框架适应数据集不断丰富的内容和日益增长的种类与数量。 4.分类原则 4)兼顾科学性原则 自顶向下,优先选择最能代表卫生信息数据集主题的语言、词条定义类目名称,编制受控分类体系表。 5)稳定性原则 使用稳定的因素作为分类依据,同时提高分类体系的可延展性或兼容性,促进稳定性。 5.分类方法 分类体系首先依据主题构建主分类框架,分类框架各层级类目可表示为一级、二级、三级类目等。 5.分类方法 数据集以相同主题构建,在若干相同主题数据集中,又根据其个性,如时间、地域、疾病、学科、机构等多属性,构成辅助分类体系,即复分类体系。 5.分类方法 特有属性1 类目1 类目2 类目3 ...... 特有属性3 类目1 类目2 类目3 ...... 特有属性2 类目1 类目2 类目3 ...... 特有属性n 类目1 类目2 类目3 ...... 5.分类方法 组配分类法是按照多维度、交叉性方式,将数据集主分类框架与复分类表组合使用,对数据集进行分类的规则。在某个主分类下的卫生信息数据集的组配分类示意。 5.分类方法 6.类目设置规则 类目名称与主题对应 类目名称规范 同位类互斥 数据集存在性 类目均衡 层次逐级隶属 6.类目设置规则 复分类表的类目根据特有属性分区段设置,每个区段对应数据集的一个特有属性,构成一个复分类的类目。 复分类的类目间无层级、无关联,无顺序约束,属于分区段的松耦合约束。 复分类目区段个数可根据实
您可能关注的文档
- 提供劳务交易结果不能可靠估计时的财税处理.pdf
- 提升企业内部控制有效性的重要制度安排――关于实施企业内部控制注册会计师审计的有关问题.pdf
- 提升会计职业判断能力的探讨.pdf
- 提升建筑企业质量文化的措施.pdf
- 提升烟草商业企业公信力促进企业发展.pdf
- 提升电力企业核心竞争力的抓手.pdf
- 提升预警监督科学化水平的实践探析.pdf
- 提高上市公司财务报表附注信息披露透明度的探讨.pdf
- 提高会计人员综合素质和执业能力的途径.pdf
- 提高会计信息质量的建议与措施.pdf
- 2025年广播电视编辑记者题库试题【考点精练】附答案详解.docx
- 2025年广播电视编辑记者高分题库及答案详解(最新).docx
- 广播电视编辑记者考试彩蛋押题含答案详解(典型题).docx
- 广播电视编辑记者常考点试卷【实用】附答案详解.docx
- 广播电视编辑记者考试黑钻押题附答案详解(研优卷).docx
- 2025广播电视编辑记者考试综合练习含答案详解(综合题).docx
- 2025国家电网招聘考试自我提分评估(各地真题)附答案详解.docx
- 2025年广播电视编辑记者过关检测试卷附答案详解(精练).docx
- 2025年广播电视编辑记者考试综合练习及参考答案详解(实用).docx
- 2025年广播电视编辑记者测试卷含答案详解【满分必刷】.docx
最近下载
- QBT5510-2021 家用电冰箱保鲜性能试验方法.pdf VIP
- 纸箱生产技术培训.docx VIP
- 金属成型软件:PAM-STAMP二次开发_(14).用户界面与图形编程.docx VIP
- TJ9-74 工业与民用建筑结构荷载规范.pdf VIP
- ±800kV及以下直流架空输电线路工程施工及验收规程.pdf VIP
- 2025年勘察设计注册土木工程师水利水电工程资格考试基础考试大纲.pdf VIP
- 纸箱生产工艺流程.ppt VIP
- 2025汽车驾驶员高级技师基本理论知识考试题(+答案解析).docx VIP
- 固化剂化学品安全技术说明书.docx VIP
- 浙江省居住建筑节能设计标准.pdf VIP
文档评论(0)