信息资源数字化生产质量影响因素分析.docVIP

信息资源数字化生产质量影响因素分析.doc

此“经济”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息资源数字化生产质量影响因素分析

信息资源数字化生产质量的影响因素分析   关键词:信息资源数字化;数字图像;生产质量   摘 要:信息资源数字化生产是将模拟信息资源进行数字转换的过程,其最终结果以数字图像为普遍方式。影响数字图像质量的生产因素主要有扫描分辨率、位元深度、文件格式、图像压缩、图像增强处理、数字化生产操作人员等。   中图分类号:G250 文献标识码:A 文章编号:1003-1588(2011)04-0074-02      笔者基于对信息资源数字化生产项目的考察与分析,得出影响数字图像质量的生产因素主要有扫描分辨率、位元深度、文件格式、图像压缩、图像增强处理和数字化生产操作的人员等。   1 分辨率   分辨率是一种识别空间细节的能力,是决定数字图像质量的最重要因素之一。数字图像采样时所使用的空间频率(采样频率)常常是分辨率的一个重要指标。因此,dpi(每英寸取样的点数)和ppi(每英寸取样的像素数)常常用来表示数字图像的分辨率。通常情况下,增加采样频率有助于提高分辨率。但是,无论是多高的分辨率,图像放大到一定程度后,仍可看到构成图像的单个像素。   对于数字化扫描设备来说,扫描分辨率表示扫描仪在既定文档中捕获像素的模式与数量,它决定了从原始文献中所采集信息的精细程度,扫描分辨率越高,所获得的图像越精细。扫描阶段,应尽可能多地捕获原始文献信息,以便在后面的转换处理、打印输出过程中即使丢失部分信息,仍然可以保持一定的图像信息总量,保证数字图像的相应品质。   但是,提高分辨率有一个“度”的问题,当超过这个“度”时,分辨率的增加无助于数字图像质量的提高,只能导致文件体积的增大,增加生产成本。关键问题在于寻找到抓取原始文献所有有价值信息所需的分辨率。   事实上,不存在一个“完美无缺”的分辨率用来扫描所有类型的信息资源。因此,扫描分辨率的设置没有统一的尺度,主要取决于被扫描的文献原稿、扫描需求以及图像处理要求等。一般认为,最佳扫描分辨率应该界定为,在输出的数字图像中,能够保证最小字符或最有意义的信息清晰可读。但这在实际工作中常常难以确定。首先,就最小字符而言,对于印刷文本,最小的字符常常是上标、脚注等,但手稿的最小字符就难以确定,影响手稿字迹清晰可读的因素很多,如墨色浓淡、字迹大小等等。其次,最有意义的信息的确定取决于数字图像的用途与用户的主观判断。比如,对于照片、图片和地图等文献,最有意义的信息就很难确定,一幅图片上哪个信息更为重要,是随使用目的(欣赏、作为证据、还是用于资料)以及用户需求(普通用户、研究人员、鉴赏家等)而变化的。   扫描分辨率的确定还得考虑输出的图像文件是否需要光学识别。分辨率设置不当,低版本的OCR可能根本无法识别文字材料。对于不同的扫描模式,OCR的识别能力与要求也不同。尽管目前OCR软件一般都具有识别彩色稿件的功能,但从效果看,黑白扫描模式的识别率较高。对于大多数黑白扫描的印刷型文本,300dpi是可以进行OCR识别的最低值,若被扫描的文献字体太小,分辨率就需增加,特别小的字体要增加到600dpi才可较好地进行OCR识别。反之,被扫描的字体大,分辨率可考虑减少。对于灰色模式的扫描,OCR对扫描分辨率的要求不宜低于200dpi。尽管今天的OCR技术还存在诸多不尽人意的地方,但光学字符识别代表了数字扫描与图像处理同时进行的发展趋势。   另外,在黑白扫描模式中,还有一个“阈值”的设定问题。不同的“阈值”点(0~256之间,0表示“黑”,256表示“白”)将决定捕捉到的灰度值是被转换成黑像素还是白像素。所以,同一台扫描仪以同样的分辨率进行扫描,“阈值”的设定不同,扫描效果可能很不一样。   2 位元深度   位元深度是指定义每个像素所用的位数。位元深度值越大,能够表现的色调数量就越多。位元深度直接影响数字图像的形态。数字图像的形态有黑白(或称双调)、灰色或彩色三种。   2.1 黑白图像   每个像素由一个位构成,而一个位可以表示两种色调(一般是“黑”与“白”),如用0表示黑,则1表示白,反之亦然。   2.2 灰色图像   由多个位(一般是2~8个位或更多位)的信息所表现的像素所构成。比如,在一幅2位图像中,有四种可能的组合:00、01、10、11。如果用“00”表示黑,“11”表示白,那么“01”便是深灰,“10”便是浅灰。位元深度为2,能够表现的色调数量为22,即4。如果位元深度是8,则每个像素能够有28(256)种不同的色调。   2.3 彩色图像   通常由8~24或更多的位来表现的图像。就24位元深度的图像(一般称RGB)而言,位元常分为三组:8位红、8位绿、8位蓝。这些位组合起来表现相应的颜色。一幅24位的图像,可以提供1670多万(224)色调值。越来越多的扫描仪以每个频

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档