科学数据质量水平的分析与评价-2014科学数据大会.PDFVIP

  • 20
  • 0
  • 约4.1千字
  • 约 22页
  • 2018-01-26 发布于天津
  • 举报

科学数据质量水平的分析与评价-2014科学数据大会.PDF

科学数据质量水平的分析与评价-2014科学数据大会

科学数据质量水平的分析与评估 西北工业大学 李正 2014-2-25 主要内容  背景  科学数据质量  数据质量因素  数据质量特征  数据质量评估 背 景 背 景  数据是信息系统的核心,数据质量保证是信 息系统建设的永恒主题。  共享推动了对数据的大量需求。  数据共享给人们带来方便的同时也带来了数 据信息真假难以辨识的问题。 背 景  科学数据反映客观实际的能力成为影响科学 技术研究水平的关键。  科学数据质量是指数据的固有特性符合具体 科学领域客观发展规律的程度。  科学数据的质量水平受到其从产生到使用的 全寿命过程中设备、技术、管理和人因等多方面 因素的综合影响。 科学数据质量影响因素 数据质量影响因素  来源于数据 产生、处理 和应用等寿 命周期的各 个过程 7 数据质量影响因素  数据产生过程的影响因素。科学数据一般是由科学试验和理论计 算获得,在其产生过程中,试验的原理或方法、使用的试验设备 、原始信息采集与记录仪器的精密度、数据分析的理论方法成熟 度、试验标准、内外部的环境条件以及数据产生过程中的人为因 素,均会对数据产生过程客观性、真实性和准确性产生影响。 8 数据质量影响因素  数据处理过程的影响因素。数据处理过程是将不同时期、不同领 域研究所形成的成果形成数据知识的过程,包括数据的收集、整 理和记录过程。在数据收集过程中,数据来源的客观性、数据内 容的代表性、数据记录格式的规范性等都会对数据的质量产生影 响。在数据整理过程中,技术缺陷、方法不足和人为因素等会影 响数据的准确性和完整性。在数据记录过程中,由于技术、方法 和软件等方面的缺陷以及人为因素的影响,可能产生数据录入( 或更新)错误、测量工具错误、简化错误、数据集成错误等数据 质量问题。 9 数据质量影响因素  数据应用过程的质量因素。在数据的应用过程中,数据要按照一 定的规则和要求进行流动。因此,数据服务的快捷性、安全性以 及数据管理的有效性是影响数据应用质量的主要因素。 10 科学数据质量特征 数据质量特征  科学数据质量存在于数据的整个生命周期  科学数据质量具有多层次及多维性特点  4类共13个数据质量维度的质量框架 12 科学数据质量特征 13 数据质量评估 数据质量评估  从数据产生的全过程考虑,数据质量应该是由多因素、多关联模式 组成的复杂的逻辑关系系统。 —— 数据环节多(包括产生、收集、加工整理、存储和发布等环节) —— 每个环节的每个操作步骤都会产生质量影响 —— 即使是同一种因素,在数据寿命周期的不同状态,质量影响作用也不同。  以层次分析法进行分析与评估 15 数据质量表征 按照不同属性分组,每组作为一个

文档评论(0)

1亿VIP精品文档

相关文档