数据溯源技术综述.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
小型微型计算机系统 小型微型计算机系统 2012年9月第9期 Joumal of ChiIlese Computer Systems V01.33№.9 2012 数据溯源技术综述 明 华1,张勇1’2 ,符小辉4 1(清华大学计算机科学与技术系,北京100084) 2(清华大学信息技术研究院,北京100084) 3(清华信息科学与技术国家实验室,北京100084) 4(北京市延庆县91290部队,北京102100) E—mail:zll孤gy叽905@tsinghua.edu.cn 摘要:系统介绍数据溯源的定义,并从数据溯源的方法、模型和应用等三个方面进行了总结.概述了7种数据溯源模型:流溯 源信息模型、时间一值中心溯源模型、四维溯源模型、开放的数据溯源模型OPM、P蛔veIlir数据溯源模型、数据溯源安全模型和 PrIrIt数据溯源模型,总结出异构数据的溯源模型.并对目前最为广泛的几种溯源方法进行分析和比较,在此基础上,为达到节 省存储空间的目的,提出标注信息列存储的思想.本文分别从数据库领域、工作流领域和其它应用领域三个方面描述了数据溯 源的应用。并结合典型的实例加以说明.最后展望了数据溯源的研究热点以及发展方向. 关键词:数据溯源;数据追踪;标注法;数据溯源模型 中图分类号:哪ll 文献标识码:A 文章编号:1000—1220(2012)09-1917聊 Survev of Data Provenance MⅣG Hual,刁{ANG Yon91’2”,FUⅪao-hlli4 1(D印n砌圯町D,C钿lPM鲫&妇竹c已口以乃曲,ID妞y,乃伽g^№咖fw瑙毋。&玎加g 100084,劬讯口) 2(R删枷加硎m地D,啦向册口砌n死曲nD虹gy.乃咖咖汹E,n池捌秒,曰P玎垤100084,C舫埘) 3(乃嘲^M№砌船f肠切阳fD口归r趣p,,M砌^&ie,lce册d死c^,lD正D∥。狮g 100084,鳓汛口) 4(日e玎妇y4ng咖91290 A朋)7.BP玎诹102100。C^妇) Abstmct:T11is paper in缸oduces me concept of data prov即粕ce,彻d iIlvesdgates it舶m three aspec乜:m劬od,model趾d applica- tion. Seven da诅provenance models p陀sented:now iIl|b皿衄时on model,tiIne·value cenⅡic model,follr dim肋sions model。open pmven姐ce model-PIDVenir model,data pmVenance’s security model锄d Pdnt model.B懿ed these models,we pr0Vided a纰 pmven孤ce modd forheterogeneous№.Based ttle锄alysis of seVeral popIllar№pro、7en柚ce m悯s-wepmposed memod to extend me labelir喀memod wim colu枷storage.We described data proVenafIce appHcations in tlle fields of出I切baSe wodmow锄d otller.The typical appucation c硒es am pmVided.At 1ast。Ⅱle hot research spots and曲伐tions are舀Ven. Key words:data provenance;da矗n钯ldng;l蛐g memod;data pfoven柚ce model l数据溯源概述 为数据溯源是一种元数据,用来记录工作流演变过程、标注信 息以及实验过程等信息.在其它一些领域中还有其它一些叫 1.1数据溯源的概念 法:如数据族系(Da诅L血eage)、数据系谱(Data Pedigr∞)、数 数据溯源是一个新兴的研究领域,诞生于20世纪90年 据来源(Data origin)、数据世系等.戴超凡等‘刊将数据溯源定 代,由“data proven柚ce”翻译而来.当初,某些文献将其称为 数据志或数据档案,后来,大部分文献将其命名为数据起源, 义为记录原始数据在整个生命周期内(从产生、传播到消亡) 的演变信息和演变处理内容. 有追踪数据的起源和重现数据的历史状态之意.而我们在本 文中将其称为数据溯源,溯本追源的意思,从应用的角度出 我们认为,Da诅Pfovenance应该翻译成“数据溯源”,强 发,强调追踪的过程和方法. 调的是一种溯本追源的技术,

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档