国家自然科学基金委会科学基金项目文档数字化.docxVIP

国家自然科学基金委会科学基金项目文档数字化.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国家自然科学基金委会科学基金项目文档数字化

国家自然科学基金委员会科学基金项目文档数字化需求说明项目介绍国家自然科学基金委员会自1986年成立,但是从1982年开始资助基础研究项目。由于早期计算机技术尚未普及,项目申报的申请书、项目结题的结题报告等文档有一部分采用打字机打印方式进行填写。这些文档对科学基金项目数字文档的完整性非常重要,同时也是建立科学基金基础研究知识库的必要数据来源,因此需要对这些文档进行电子化。1、资金来源:国家财政拨款2、系统概述:(1)业务需求本次国家自然科学次工程中基金提供的待电子化文档,均为1986年到1998年期间的纸质申请书及项目结题报告扫描后的图片(TIF)格式文档,其中有200DPI 和300DPI 的两种分辨率。根据项目申请科学部情况分为数理、化学、生命、地球、材料、信息、管理等共8个科学部,共计749918页文档,具体统计情况见下表。表一:历史申请书与结题报告扫描件页数统计学部总文件数申请书结题报告申请书结题报告打印份数打印页数打印份数打印页数数理63446052358964702303432161化学57275701300957482261232850生命16487158959486171487817386741地球49084797302354829261427798材料64146346398973101354638220信息51655030301654649262227902管理13181280889195667838430合计   495816 254102      749918申请书及结题报告原件基本都是打印格式的格式,具体文档内容分为纯表格形式、表格与文字的形式以及纯文字格式,具体样例如下:申请书封面打印格式:结题报告封面格式:申请书简表信息的表格格式:表格分化比较详细,表格内有文字也有数字;项目申请书摘要页:表格与文字格式;结题报告摘要格式:项目申请书正文内容页:纯文字格式;结题报告正文格式:(2)加工要求工程承担方根据基金委提供的扫描(TIF)图片文件,将其进行数字化处理,通过OCR识别及校对技术,生成目标格式文件。目标格式文件分为电子化文档的目录文件,目录文件主要内容包括项目基本信息以及每个文档的数字化处理进程,可进行查询、检索及相关内容的统计;另外,目标格式文件还包括对每一份申请书及结题报告生成可读取的电子化文档,如PDF格式。目录文件示例如下:报告种类项目编号项目负责人依托单位项目名称报告总页数电子化完成进度申请书/结题报告申请书申请书结题报告………..3、预算金额:225万元4、所要达到的目标前景:所有项目文件提供双层PDF 格式、XML格式,并实现全文检索。采购产品一览表序号服务项目名称文件页数服务时间(月)服务人数(人)服务人员的国别国家自然科学基金委员会项目文档数字化加工工程项目7499181510中国项目履约时间、地点履约时间:合同签订后3个月内提交检索系统和部分样品数据,采购人确认合格后的12个月内交付全部成品数据,具备验收条件,2、履约地点:北京市海淀区双清路83号3、现场踏勘:否采购人信息单位名称:国家自然科学基金委员会单位地址:北京市海淀区双清路83号联系人姓名:张民社联系电话:010子邮箱:zhangms@nsfc.gov.cn服务内容及指标要求重要性分为“★”、“#”和一般无标识指标。★代表最关键指标,不满足该指标项将导致投标被拒绝,#代表重要指标,无标识则表示一般指标项。序号重要性指标项指标要求#PDF文件描述PDF页面包含两层;图在上,文本在下;内容包括从封面到封底的所有页面。#PDF文件页面(1) PDF页面完整,无缺页、重页、页码顺序颠倒等情况发生;(2)PDF文件初始放大率设置为“适合页面”;(3)书签动作缩放比例设置为“承前缩放”。#PDF文件文字层(1)文字对位:双层PDF图像层和文字层的对位放大到百分之百的时候,误差不超过1毫米;(2)文字层的外文数字、标点、符号等均应采用半角OR文字层的外文数字、标点、符号等与原书同样;(3)上、下标和字体等需要在双层PDF中保留样式信息。#PDF文件图像层(1)分辨率:不低于原始图像文件;(2)倾斜度不能超过1度。#PDF文件书签(1)书签与元数据内容一致,按资料实际顺序;(2)打开PDF文件时,自动显示书签。★准确性要求(1)文字准确性,错误率万分之三以下;(2)图像准确性,错误率千分之一以下;(3)内容结构化准确性,错误率万分之三以下;(4)样式准确性,错误率万分之三以下。错误率计算方法:错误权数合计×10000抽检字符数J(错误率)=#数据检索工具(1)能够提供成熟的系统检索工具;(2)能够提供相关系统培训和维护工作。#进度保障措施进度安排合理、实施计划科学,能够保障进度按时甚至提前完成。#安全保密措施保密工作

文档评论(0)

ldj215323 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档