数据元同义词在公安数据资源整合中应用研究.docVIP

数据元同义词在公安数据资源整合中应用研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据元同义词在公安数据资源整合中应用研究

数据元同义词在公安数据资源整合中应用研究   摘 要   论文分析了公安信息化在数据采集、数据汇集、数据整合、数据应用方面遇到的问题,从数据元同义词的角度,提出了一种数据元、同义词、字段关联方法,应用于公安数据标准管理中,为公安数据资源整合和应用提供了借鉴和指导。   【关键词】标准化 数据元 同义词   公安科技信息化经过多年的发展,已经建立的众多信息系统,覆盖了公安各业务条线的工作,信息系统建设已经进入了“大整合、高共享、深应用”的高速发展期,信息资源成为动态化信息化条件下的第一资源,信息化优势已成为核心战斗力的主要优势。但是,要打破部门间信息壁垒,提供更广泛的信息共享渠道,有效提高各警种综合应用信息资源的效能,需要着力解决信息资源“不够用、不好用、不能用、不敢用”的问题,为此,本文从数据元同义词技术的角度,分析和研究数据资源整合中数据元同义词的应用方式和途径,为公安信息化建设提供借鉴和指导。   1 数据元及其同义词的研究基础   1.1 数据元   数据元(Data element)又称数据类型,通过定义、标识、表示以及允许值等一系列属性描述的数据单元,在特定的语义环境中被认为是不可再分的最小数据单元。数据元是称之为数据的一个广义概念的特殊成员。总而言之,数据是事实、想法或命令的一种表示数据被收集、组织、记录、处理和存放在一个可检索的表中。数据还必须适用于以人工或自动方式进行交换、解释及加工处理。   在数据建模出现之前,“数据元”这个术语已被普遍使用,用于表示指导企业商务信息的数据单元传统上被称之为数据元。数据建模的演进就是为捕捉这些数据表示的语义提供一种有效的方法。   数据元是建立建模对象与该对象属性的桥梁。在一个数据模型中,一个实体类型、对象类等的某个特性的属性会被企业选择记录为数据,我们通常通过属性来表示这些实体和对象使用所需的信息。对每个实体,通常有许多属性会引起业务分析人员的兴趣。   1.2 数据元同义词   在标准的定义中,数据元的同义词被定义为“同义名称,即一个数据元在不同应用环境下的不同称谓,一个数据元可以有多个同义名称”。该同义词还需要和语境结合,语境是对产生或使用数据元的应用环境或应用规程的说明或描述,一个语境可以是一个业务领域、一个信息系统、数据库、文件或数据模型等,也可以是他们的组合。   因此在应用中,目前数据元的同义词仅仅是作为数据元的一个基本属性,其实际价值并没有得到更深入的体现。   1.3 数据元在政府信息化中的应用情况   早在2004年,国家标准化委员会就已发布了《电子政务数据元标准》,包括设计与管理规范,详细约定了数据元的表示规范、数据元的属性提取和分析过程、命名规则、分配规则、使用规则,以及数据元的提交注册。随后各个政府主管部门发布的各自领域的数据元目录,包括工商、船舶、税务等。2011年,公安部发布了公安数据元编写规则(GAT 542-2011),分两批次发布了约500个数据元。这些数据元目录的发布,为公安科技信息化带来了明确的数据项格式要求,为公安各业务警种的数据建模和分析应用提供了良好的数据基础。   2 公安信息化面临的问题   数据元目录的发布为公安各业务警种的标准化、规范化提供了很好的指导,但是在数据采集、汇集、整合、应用等实际应用方面,仍然存在众多问题,需要在数据元的应用上要有所突破。   2.1 数据采集方面   各警种对业务的描述方式不一致,无法做到用统一的数据元名称来表述,导致实际应用中,难以做到“归口采集、分类管理”,如何提高数据的权威性、时效性、一致性,有待从从数据建模等底层设计层面进行解决。   2.2 数据汇集方面   公安数据的汇集工作,主要是对已获取的业务、社会、互联网、多媒体等各类数据资源,进行清洗转换,保证数据的同步和一致性,形成数据资源综合库,但是汇集后的数据资源存在着数据资源字段采集不统一,后期整合不方便的问题。在数据字段的规范管理方面,必须要以数据元为标准开展数据清洗转换,建设“标准资源库”。由于数据项受业务描述的影响,同样的数据项含义有无数种不同的表述方式,需要建立标准数据元与实际应用的数据项之间的关联关系,只有建了具有对应关系的“标准资源库”,才能为数据资源的清洗、转换服务。   2.3 数据整合方面   公安机关采集录入资源库的信息数据普遍数量可观,但是很大程度上存在着数据不好用的问题需要依托综合资源库,厘清数据目录,执行好数据标准,管好数据质量,建立“一体化、规范化、标准化”的公安信息资源目录体系,推进数据的规模应用、深度应用。   2.4 数据应用方面   数据应用的关键,在于如何有效组织数据,建立与业务单位的对接,有效提供数据内容,形成数据服务工作流程,但是目前的数据

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档