- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
基于关联数据的政府数据发布
[摘要]采用关联数据标准来发布政府数据,可以提高政府数据的透明度,提升政府数据的利用率。对政府数据利用关联数据标准进行发布的优势、途径和应用进行梳理,强调利用本体技术,将各类术语体系,包括与政府运作有关的各类数据模型,开发规范成一个政府数据本体,可以使得数据更规范、更有关联,容易查找和利用。
[关键词]关联数据 政府数据 语义网 本体 电子政务
政府数据是指一切产生于政府内部或虽然产生于政府外部,但对政府活动、公共事务和普通民众有影响、有意义的数据资源的统称…。随着互联网和语义网技术的发展,各国政府日益意识到基于开放标准在互联网上发布政府数据的重要性,然而语义网并非将数据上网这么简单,更多地需要考虑数据之间的关联和复用,从而使得机器能够理解并发现更多的相关数据。2008年6月,w3c组织的e-government兴趣小组指出open government data是其最主要的研究领域。2009年6月,李爵士(tim berners-lee)发布了名为“将政府数据上网”的文章,邀请世界各国政府以关联数据为标准在网络上发布政府数据。2009年,英国和美国政府开始了关联数据的尝试,分别建立了.uk和两个采用关联数据标准的政府数据网站。与此同时,在美国、欧洲和澳大利亚,一些相关的研究机构和网站也纷纷成立。
1关联数据和政府数据发布
政府数据上网主要是基于三个因素的考量:民众对政府职能和义务的需求增加;通过网络向世界提供有价值的信息;使得政府、组织更加高效地运作。这就使得政府数据在发布上必须能够在一定范围内最大限度地利用这些数据,从而优化政务流程,规范政府行为,优化政府结构,提升服务质量。传统的政府数据存在形式既有格式化的数据如csv、xls,也有非格式化的数据如pdf、html等。大量不具备语义的非格式化数据的存在,使要实现对分布、异构的政府数据进行共享和操作变得很困难。改变政府数据的组织和发布标准显得尤为重要。
关联数据作为语义万维网第一种可行的表达方式,由李爵士在2006年提出。基于这一概念,通过规定4个简单的发布规则,所有的网络用户都可以进行自定义语义信息的发布。这4个原则是:①使用uri(统一资源标识符)作为任何事物的标识名称;②使用http uri使任何人都可以访问这些标识名称;③当有人访问某个标识名称时,以标准的形式(如rdf、sparql)提供有用的信息;④尽可能提供相关的uri,以使人们可以发现更多的事物。
简而言之,将现实世界的事物以uris来进行标识,并以机读方式进行发布,其他数据集就可以以uris的方式来互相指向。这样,人们不需要将信息拷贝到原始的数据集里面,就可以发现相关信息,实用且可操作,适用于各种形式的数据,能够满足政府数据发布的需求。从定义上来看,关联数据是一组语义网最佳实践的集合,它采用rdf数据模型,利用uri命名数据实体,来发布和部署实例数据和类数据,从而可以通过http协议揭示并获取这些数据,同时强调这些数据的相互关联以及有利于人机理解的语境信息。使用关联数据标准来发布政府数据将有助于信息的公开、复用和传播。
在关于关联数据的问答中,李爵士指出了关联数据为企业带来的种种关键性的益处,同时这些益处也成为企业采用关联数据的绝好理由,概述如下:①rdf模型可以同样地应用于非结构化、半结构化和结构化的数据与内容。②消除内部数据相互分隔的“仓储”(silos)。③整合内部和外部数据。④易于在企业、行业、开放订阅和开放数据之间进行连接。⑤对遗留模式的数据实现完全的模型化。⑥可以很容易地对现有模式进行灵活更新和变更。⑦不再需要因为商业模式的改变或者并购而重构遗留的数据模式。⑧基于模板和查询的报表创建和数据呈现,不再需要人工操作。⑨数据访问、分析和操作并推送到用户层。⑩采用现有的数据库管理程序和设施进行内部关联数据存储的能力。这些针对企业数据的优点,同样也适用于政府数据的发布。
关联数据还具有如下优点:①开放:关联数据能够被各种各样的应用获取并使用,因为数据是以开放和非私有的格式发布的。②模块化:关联数据之间可以随意混搭,甚至可以和其他关联数据的不同片段进行混搭。比如,特定区域的关于医疗健康方面的政府数据,可以和该地区的人口、环境等数据联合起来,从而对政府医疗投入的效率进行评估。而且数据使用无需长期规划,只需要在本体方面进行规范即可。③可拓展性强:对关联数据进行增删比较容易,术语和定义所发生的变化,不会影响到数据本身。
此外,关联数据所采用的rdf模型比其他数据模型具有更好的互联互通性能:①它使用uri作为唯一资源标识,可以用来链接任何事物和概念。②它允许不同的系统独立设计并在最终的边界联合起来。③它具备良好的低成本的互操作性。④它允许所有数据以混合词表的方式进行表达。这就意味着无论人
文档评论(0)