政府数据门户网站及其数据集建设研究.docVIP

政府数据门户网站及其数据集建设研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
政府数据门户网站及其数据集建设研究

政府数据门户网站及其数据集建设研究   政府数据门户网站发展及意义      随着电子政务的发展,政府各个部门聚集了大量的数据。如何让公众通过一个入口,更便利地获取自己感兴趣的数据集呢?更进一步,如果一个软件爱好者要对来自不同部门的多个数据集进行整合(marshup),建立有意义的关联,政府的信息主管(CIO)能提供一个相关的数据基础设施(data infrasture)吗?   作为有责任的政府,政府部门的一个重要任务就是向公众提供这些数据, 减少政府于公众之间的信息不对称,增强互信和理解。去年以来,美国国内掀起了一股“数据民主化”的浪潮,白宫把数十万项以前政府专有的数据库推向了互联网,设立了数据门户网站。在2009年5月21日网站上线时,11个机构提供了最早的76项数据集。而后数据集的数量激升。表1就两个时点给出美国数据门户网站上公开的数据集的发展状况。   数据门户不是简单地分类地将来自各个机构的数据源集中起来,其意义在于提供了许多数据基础设施工具。这些基础设施工具是由最适合的专业团队开发的。这些基础设施工具有机构之间相互协作的数据基础设施、反馈数据基础设施、查找数据基础设施、机构和站点仪表板数据基础设计。正因为有如此众多基础设施,一个重要的现象就是EPA原放在自己部门网站的45个关于有害物的数据集,在整合到门户之后,下载次数增加了十多倍.   数据门户网站实施原则   目前很多国家政府已经认识到向公众开放高价值数据集的作用,并主动引导形成一个创新性的社会。信息技术就是生产力。基于统一的门户网站,能避免各个职能部门在软件、硬件上的重复投资,如软件上的检索模块、硬件方面的主机设备。基于统一的门户网站,还能在政策法规上避免各个职能部门各自为政的情形,促进协调、统一,通过其数据集检验其部门任务的落实是否符合其使命,是否为社会创造了价值。   数据门户网站的实施主体是信息产业相关部门。为此信息产业相关部门推出相应的政策和实施措施。针对政务数据集,信息技术管理战略就是利用好现有数据集并推出满足公众要求的新数据集。表2给出对应战略的操作层面的实施步骤。   为了实现上面的任务,政府数据网站提出了七个原则来成就其透明、参与、协作这一系列的价值主张。   是一个高价值的政府数据集的门户网站。那么,什么是高价值的政务数据集呢?这里,主要是从数据集能起到的作用和产生的影响角度进行阐述。作为向公众开放的最原始的基础数据,高价值数据集应该能提高公众对该机构的认知和对其运作流程的理解;推进该机构的核心使命;能及时满足公众的目的和需求。   在社会可以自由获取这样的高价值的数据集之后,极大地促进了美国社会对数据的重视和应用,很多领域提出了一系列社会问题的解决方案。针对这种应用的全国范围内的比赛“apps for America”也已进行了两届。比如在航空运输服务上,民间就有程序员利用它开发了航班延误的免费查询系统(http://flyontime.us/),任何旅客都可以查询全国各航班的飞行时间和机场等候时间。其中,和航班相关的信息来源于美国交通部,安检排队等待的时间来源于普通旅行人员的提交。其带来的管理功能有:一是可以帮助消费者找到表现最佳、或者符合自己需要的航班;二是最大程度降低了旅客等待时间的不确定性;三是有利用推动航空市场的良性竞争。      数据源目录的管理      数据门户首先要求对数据源进行分类和描述,并以数据目录的形式发布政府数据。提供了三类目录,它们是原始数据目录、工具数据目录、地理空间数据目录。原始数据目录下的数据源是指在满足数据隐私、秘密、安全等要求下所能提供的最翔实的、能直接下载的数据,且具有机器可读的格式。以原始数据的形式免费提供政务数据,其范围涵盖了美国人口特征统计数据、GIS地理信息,以及环保、教育、能源、地域、健康、法令相关主题的数据。工具数据目录下的数据源是指与一定应用相关联的数据,比如由交通统计署提供的编号为123的美国航班延误数据集(Airline On-Time Performance and Causes of Flight Delays),公众可以定制自己想要的任何查询结果。地理空间数据目录则同时包含与地理空间相关的原始数据和工具。   在每个目录下数据源还按其所属范畴进行划分,提供了与职能部门有一定关系的分类准则,如地理与环境、人口等范畴。不能归入相关范畴的,专门设置一个“其他”来容纳。   对于原始数据目录、工具数据目录,是通过元数据目录来进行管理的。一个元数据目录下的目录记录大致有四部分组成,即目录记录头、数据源地址、数据源域、相关文档。其中数据源域又分为数据源本身描述和数据源机构描述两部分。   在资源描述框架RDF文件格式下,目录对应的项为,数据源机构对

您可能关注的文档

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档