- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
五、科技成果资料数字化进展
国土资源科技成果是国家经济建设非常宝贵的信息资源,大部分是由国家出资开展的基
础性、公益性和战略性基础资料和数据,具有很强的公益性特点,社会影响面和社会需求比
较广泛。另外,国土资源部的科研机构大多属于社会公益类科研机构,从事的工作以向全社
会提供公共技术和服务为主,因此国土资源科技成果具有很强的社会共享特征。部科技成果
管理办公室已保存了自 1980-2010 年登记的 11285 项科技成果资料,包括地质调查、土地调
查、信息技术及国土资源管理等各领域的成果,自国土资源部成立以来,每年的成果登记数
量以 200 项左右在增加。随着现代信息社会的发展和广大用户对国土资源信息的需求,我们
开展了国土资源部科技成果资料数据库建设,对科技成果资料进行数字化,使成果资料安全、
长期保存,并且得到深度开发和广泛利用。
(一)成果资料数字化背景
项目开始于 2007 年,2010 年结束,完成了 1980-2010 年登记的11285 项科技成果数字
化扫描工作。主要包括第一期对地质矿产部时期近 9 千项成果资料扫描后文件以图像形式存
储,成果报告存储 PDF 格式;第二期对国土资源部成立以来的 1 千多项成果报告及专著扫描
后进行矢量化,存储成双层 PDF 格式。成果资料数字化共完成数据量 1300G, 其中A4 文档
约 132 万页(双层 PDF文档 19 万页),A3 以上图幅 7 万幅。现已全部上传到中心服务器。
同时为更好满足广大用户对国土资源信息查询的更高要求,更好地开展网络环境下的社
会化服务,加快成果的推广转化,在数字国土资源工程的统一要求下,开展了科技成果资料
数据库建设,主要建设内容包括在已有的成果资料目录查询的基础上,对科技成果资料增加
部分核心元数据和扩展元数据查询,完成数据库的科技成果索引(划分领域、编写关键词、编
写成果项目摘要);对 1980 年以来的全部科技成果编写关键词、项目摘要,划分八大领域。
八大领域分别是基础前沿性研究、矿产资源调查与评价、土地资源调查与评价、矿产资源综
合利用、地质环境保护与地质灾害防治、国土资源信息技术、矿产资源勘查技术和国土资源
管理。
(二)成果资料数字化实施方案
项目工作主要是编制总体设计(包括编制成果数字化资料目录表、制定方案文档)、构
建成果资料数据库、开展成果资料数字化示范工作。
1.成果资料目录表。对 1980 年以来的成果登记资料全部进行采集,主要内容有:成果
登记号、成果名称、完成单位、密级、科研报告及专著、归档证明、任务书、评价证明、图
件或表册等数据项,并标注各种文件缺失情况及成果报告页数。
2.制定科技成果资料数字化技术要求。根据目前的信息化技术,编制“成果资料数字化
技术要求”,包括制定纸质资料数字化标准(包括资料分类、数字化基本流程、资料整理、
资料扫描、数据处理及电子文档管理)、已汇交的电子文档处理和在线登记电子文档等数字
化标准要求,建立起一套完善的成果资料数字化作业流程。
3.制定科技成果资料数字化工作方案。结合库存成果资料的实际情况,从成果资料的
管理和社会化服务两方面出发,制订成果资料数字化具体工作任务(包括数字化资料建库标
准、数字化技术指标和工作进度安排等)。
4.制定科技成果资料服务方案初稿。该方案主要是以信息系统和数据库为手段,进行数
据发布、共享,主要是制定用户权限和信息发布内容等。
5.构建科技成果资料数据库。实现了成果资料的分类管理和查询。规范了成果查询指标
体系、完善了目录查询功能、构建了不同角色用户的访问权限、构建成果资料全文图文浏览
界面、搭建成果资料数字化文档和已有目录数据库的衔接。
6.开展成果资料的数字化示范工作。针对 80 项科研报告进行数字化,主要是对成果报
告进行扫描和 OCR 软件识别的示范工作。
(三)成果资料数字化总体技术方法
1.成果资料数字化技术方法
根据国家档案局《纸质档案数字化技术规范》、《电子文件归档与管理规范》等数字化行
业标准,并针对不同历史时期形成的资料采取不同的技术方法。
首先对纸介质的成果图文资料采用扫描的办法输入计算机系统,经过消蓝、修编、数据
压缩后进行数字化存储;对国土资源部成立以来的纸介质成果报告及专著扫描后进行矢量化
(利用清华 OCR 技术),存储成 PDF 格式(双层 PDF,前台中保持原来的图像,将可搜索文
本置于图像背后,OCR 识别后使纯图像扫描页面为可搜索文
文档评论(0)