- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈音频文件数字化存储
浅谈音频文件的数字化存储
随着信息技术的迅猛发展,数字化浪潮已经波及到包括视听领域在内的很多方面。目前,在人们日常生活和工作中已有相当一部分声音文件是以数字音频格式存储的。于是,作为完整保存人类社会记忆的档案部门,又增加了一个新的课题:如何跟随信息技术的发展,将档案部门的大量音频文件进行数字化保存。
音频文件数字化的原理
音频文件数字化,实际上就是将音频文件中的声音信号进行数字化处理。目前,最常见的方式是通过脉冲编码调制PCM。其基本原理:首先声音经过麦克风,转换成一串变化的电压信号(如图一)。图一中的横坐标表示秒,纵坐标表示电压大小。要将这样的电压信号转化为PCM格式,则先以同等时距进行分割,假设为0.01秒(如图二)。在图二中将分割线与信号图形交叉点的坐标值记录下来,得到(0.01,11.65)、(0.02,14.00)、(0.03,16.00)、(0.04,17.47)……(0.18,15.94)、(0.19,17.70)、(0.20,20.00)。此时,实际上我们已经将这个电压信号的波形以数字方式记录下来了。由于分割的时距固定为0.01秒,因此可以将横坐标省略,只记录纵坐标,于是得到一串数字11.65、 14.00、 16.00、 17.74、 19.00、 19.89、 20.34 、20.07、 19.44、 18.59、 17.47、 16.31、 15.23、 14.43、 13.89、 13.71、 14.49、 15.94、 17.70、 20.00 。这一数列就是将以上声音信号数字化的结果。这就是音频数字化的基本原理。
在音频文件数字化的过程中,主要影响数字化音频质量的参数有采样频率和采样精度两个方面。
采样频率是指对声音波形每秒钟进行采样的次数。例如在刚才的例子中,是每0.01秒采样一次,也就是说在一秒钟内每间隔0.01秒有100次等时距的采样,因此这次采样的采样频率为100Hz。人耳听觉的频率范围大约在20Hz到20kHz左右,为了保证声音不失真,数字化时采样频率应在40kHz左右。经常使用的采样频率有11.025kHz、22.05kHz和44.lkHz等。我们常见的CD光盘以PCM格式记录时,它的采样频率为44.1kHz,采样精度为16Bits。也就是说CD光盘的声音振幅最小可达 -32768(-2^16/2) ,最大可达 +32767(2^16/2),对于人耳来说,CD光盘基本上可以做到不失真的记录声音信号。因此,采样频率越高,声音失真就越小,但音频数据量也就越大。
采样精度是每个采样点的振幅动态响应数据范围,即一个采样点可以用多少个不同的数值来表示,通常有8位、12位、16位。8位则表示每个采样点可以用256个不同数值来表示,16位则表示可用65536个不同数值。
当然,影响数字化音频质量的因素除了采样频率和采样精度外,还有声道个数。记录声音时,如果每次只用一个声波数据来表示,则为单声道;每次生成两个声波数据,则为双声道或立体声。当然,如果用双声道记录声音,则数字化音频文件的存储量将增加一倍。此外还有扬声器质量、麦克风优劣、计算机声卡品质、各个设备连接线屏蔽效果好坏等,都将影响到数字化音频的质量。
音频文件数字化的操作步骤
目前,在我们档案部门的库房内,绝大部分的音频档案都是以磁带形式存储的,在长期的保管工作中,由于磁介质的自然率减、退化及老化,录音内容质量明显下降。而要用传统的复制方法进行复制备份,无论电路设计多么严谨,总无法避免一些杂音信号的介入,这些杂音信号将成为复制后档案资料的一部分,造成声音失真,并且复制次数越多信噪比越低。而采用数字化音频形式,将声音信号转化为二进制的数字,再加上各种校验码,出错的几率很小,一般情况下,无论复制多少次,二进制数字都是不变的,声音资料也就一样了,最大程度上达到了不失真。
那么,为了今后可以方便、广泛地利用数字化音频文档,档案部门首先应有计划地对库存音频档案进行数字化。
第一步,要对老旧磁带进行修复处理。老旧磁带的正常播放是音频档案数字化的前提条件,也是保证数字化音频质量的关键一步。老旧磁带普遍存在信号强度减弱、磁粉脱落、霉变、粘连等,这些都将影响数字化音频文档的质量,必须先对其进行必要的清洁和坚固,保证数字化过程中得到高质量的信号源。
然后,当一切软硬件设备,如多媒体工作站、CD-R刻录机、驱动程序和数据库程序都准备就绪后,就可以正式开始批量的音频文件数字化转存了。首先对音频文档的相关标引信息进行整理,并将要转存的文档所对应的标引信息输入到转存音频文档管理数据库中。当转存工作以多台工作站同时转录的方式进行时,数据库将按照排序规则,对每台工作站
文档评论(0)