外包数据质量控制初探.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
外包数据质量控制初探.doc

外包数据质量控制初探   关键词:中国科学引文数据库(CSCD);基础数据外包;质量监控;PDCA理论   摘 要:以中国科学引文数据库(简称CSCD)基础数据业务外包的实践为例,介绍了数据外包的操作流程和管理方法,以及美国质量管理专家戴明的PDCA循环理论在数据质量管控工作中的应用;并对数据外包业务中面临的问题和解决方法提出意见和建议。   中图分类号:G258.6 文献标识码:A 文章编号:1003-1588(2013)04-0095-03   收稿日期:2013-03-16   作者简介:陆耘(1968-),中国科学院国家科学图书馆馆员。 中国科学引文数据库(Chinese Science Citation Database,以下简称CSCD)创建于1989年,由中国科学院国家科学图书馆建设,并获得国家自然科学基金委员会的支持。目前,该数据库共收录了我国自然科学、医学、农业、工程技术学等领域中英文核心期刊和优秀期刊千余种,截至2012年12月,已积累论文记录350余万条,引文记录3,500余万条。历经20多年的建设和发展,中国科学引文数据库已成为具备专业性强、数据质量优良、数据体系完整、检索方式多样、简单易用等特点的大型数据库,深受用户好评,对科技人员和科研评价等工作具有重要影响。   近年来,随着数据采集量的逐年递增,现有的数据加工人员越来越难以负荷海量基础数据的加工工作,为顺应数据库建设的发展,改变基础数据加工方式势在必行。目前,基础数据外包已经成为各类大型数据库建设的一种主流方式,CSCD数据库亦于2003年实行了基础数据外包,这一改变是数据库建设发展中的一次重要跨越,CSCD数据库建设小组的工作模式亦由具体操作的作坊型向主要负责规划设计、组织协调的统筹型转变,原数据加工人员的工作分别转向用户需求分析、数据质量监控以及与数据供应商的协调等方面。其中,外包数据的质量控制更是新工作方式的重中之重。基础数据质量的高低不仅影响数据后期规范化处理、统计产品的可靠性,还直接影响到数据库对外服务水平,比如:与各类资源的融合度、开放链接服务水平等,直接关系到数据库的生存和发展。笔者将结合CSCD建设的工作实践,对如何做好外包数据质量控制进行初步的探讨。   1 选择适合的外包服务公司,签订职责明确的合同与协议   数据外包公司的服务质量直接决定数据质量。在对数据外包公司的选择上,着重考虑了以下几个方面:首先,要求外包公司具备相应资质和信誉,重点考察其相关工作的经历和业绩;其次,考虑外包服务的成本是否合理;第三,考虑到外包服务是初步阶段,只将非核心业务外包,积累对数据外包工作的管理经验。   综合以上几点,我们拟定了业务外包实施方案,经主管部门批准后,遵循公开、公平、公正的原则,采取对外公开招投标,由专家组成的评标委员会评标,择优选择了适合CSCD建设要求的外包数据服务公司。   在选定了外包公司之后,与中标公司签订详细、明确的委托外包合同,包括合同期限、工作目标、合作范畴、运作方式、责任划分、赔偿问题等。在与外包公司签订详尽的工作协议时,围绕数据特点,尽可能考虑周全,将数据提交格式、质量标准、数量标准、任务完成期限、人员流动控制及违约的惩罚措施、解决突发问题的应急对策等可能出现的问题逐一进行约定,尽最大可能保障外包数据质量。   2 外包实施过程中数据质量控制对策   数据质量体现在对数据加工的全过程的把控,因此,数据加工各环节质量控制对策尤为重要。在外包数据的质量控制中,我们主要根据美国质量管理专家戴明的PDCA全程循环质量控制理论,制定了数据质量的全程控制模式。PDCA是一套广泛用于质量管理的标准化、科学化循环系统,它将工作流程具体分为四个阶段:计划(plan)、实施(do)、检查(check)、处理(action),流程执行实施一遍后,要对出现的问题和不足进行完善和改进,并在此基础上,再一次进行PDCA的循环,从而提升质量控制水平。在实践中,我们没有机械地把四个内容从时间上划分前后阶段,而是把质量控制PDCA四项内容贯穿到数据加工的各个环节和时段,围绕这四项内容,展开相互交融的全面的数据质量控制管理(见图1)。   图1 数据质量控制管理流程图   陆耘:外包数据质量控制初探   陆耘:外包数据质量控制初探   2.1 计划阶段(Plan)   CSCD字段繁多、著录内容多样、逻辑关系复杂,加工难度大,其数据分为3个级别:①Ⅰ级数据,也称原始数据。数据加工要求按照《中国科学引文数据库著录与录入规范》,保证数据内容完整无遗漏,数据对应关系准确,字段分解正确。②Ⅱ级数据。根据《数据审核标准和规范手册》对Ⅰ级数据进行质量检查与修正,完成标准化、规范化处理。③Ⅲ级数据。在Ⅱ级数据的基础上,根

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档