- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高校信息化环境中数据质量问题探析
摘 要:不同的数据环境存在不同的数据质量问题,本文首先介绍数据质量的概念,分析了高校信息化中的四种数据环境及其关系,对比了不同数据环境中数据质量问题,最后给出了高校信息化建设中数据质量问题的处理建议。
关键词:高校信息化;数据环境;数据质量;问题探析
中图分类号:TP393 文献标志码:B 文章编号:1673-8454(2016)15-0059-04
一、引言
在信息技术快速发展的“互联网+”时代,各个组织都拥有大量的数据,并呈现爆炸式增长,但其中有用的信息却很贫乏[1]。数据与信息的不对等,源自多个方面:一方面,数据与信息的外延有差别,信息来源于数据却不能完全包含数据;另一方面,信息技术未能完全解决信息化过程中数据与信息的问题;最后,在信息化发展历程中,组织或个体未能有效的保证作为信息载体的数据质量,致使产生了很多无用的信息。[2]
数据与信息有关联,也有区别。数据是反映客观事物属性的记录,是信息的具体表现形式,数据经过加工处理之后,才成为信息。从信息论的观点来看,描述信源的数据是信息和数据冗余之和,可以说信息是数据的一个子集。就信息系统层面来说,数据是系统的输入,是源材料,信息是系统的输出,是产品[3]。 数据是信息的基础,数据质量是信息质量全面提升的重要保障。
高校信息化建设包括计算机化、网络化、数字化、数据化、智慧化等不同阶段:计算机化是高校信息化的最初阶段,依赖于Excel文件或单机版的数据文件来管理各类数据;网络化则开启了数据共享的时代,也逐步出现了基于网络的应用数据库;数字化是在网络化基础上,着重于把所有的手工操作转变为业务系统,数据围绕业务需求进行构建;数据化是在数字化基础上,利用数据来对事物和现象进行描述,使之能同时被人和IT设施所理解,数据可以反哺业务[4];智慧化是信息化发展的最新阶段,数据变成现实环境感知的最基本元素,使信息世界和实体世界相互对应,并使信息世界具有智慧,成为“虚拟大脑”系统。这些发展阶段造就了不同的信息化数据环境,总结起来,可以定义为四种数据环境:数据文件环境、应用数据库环境、主题数据库环境、信息检索系统环境。[5]
在实际的高校信息化建设中,高校内部部门、单位信息化建设存在很大的差异化和不平衡性,很难实现阶段性的跨越,往往形成多个阶段并存的局面,即在同一个时期存在多种多样的数据环境。不同的数据环境存在不同的数据质量问题,本文首先介绍数据质量的概念,分析了高校信息化中的四种数据环境及其关系,对比了不同数据环境中数据质量问题,最后给出了高校信息化建设中数据质量问题的处理建议。
二、数据质量概念
各种应用不断产生和结束,而其中的数据则一直存在,劣质数据使组织或个人不能做出有效的决策,只有高质量的数据,才能使各项工作高效的推进。数据质量不仅仅只涉及准确性或者可靠性,而是多维的。Wang和Strong使用一个两阶段调查和两阶段分类研究的方式提出了一个典型的数据质量层次框架[6],将从数据用户那里收集的118个数据质量特征合并为15个维度4个类别,如表1所示。
还有一些组织和研究机构也对数据质量进行了定义并形成了标准,比如麻省理工大学、美国商务部、欧盟统计局、国际货币基金组织等。总的来说,这些标准主要考虑了三个方面的内容:一是注重从用户角度来衡量数据质量,强调用户对数据的满意程度;二是数据质量是一个综合性概念,需要建立一套有效的数据质量管理体系,从多方面多角度评价数据好坏;三是把适用性、准确性、适时性、完整性、一致性和可比性作为数据质量的基本要素。[7]
三、高校信息化中的数据环境
1.数据文件环境
数据文件环境中,一般通过Excel等单机软件完成数据的记录和存储, 数据可能用于辅助管理人员或者业务办理人员完成各项工作的开展,也可能用于工作内容的备份和存档。高校之所以还存在这类环境:一方面是很多人还不能从手工或使用Excel等简单软件工作方式转变成使用信息系统的工作方式,缺乏共享意识和整体观念[8];另一方面是部分单位满足于现有的工作方式,很难接收改变,或者缺少转变所需要的资金和人才支撑。
这种数据环境下数据存储在个人办公计算机上,受众面窄,没有专门的访问控制和安全性策略,存储和表示数据的方式以个人喜好为主,没有固定的规范,数据的利用价值很低。
2.应用数据库环境
应用数据库是基于学校实际的业务需求出发,通过面向过程的方式建立而成,主要服务于高校的各类MIS系统。很多高校并无专业的设计、开发团队,往往委托技术公司完成系统的设计、数据库的构建、功能的实现和系统的运行维护。其数据的设计依赖于一些大家公认的技术规范进行,是比数据文件环境更高级的数据环境。
系统建设团
文档评论(0)