- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索(实验报告书)
徐州工程学院
管理学院实验报告
实验课程名称 : 信息存储与检索
实验地点: 经济管理实验教学中心
2012 年 月至 2012 年 12 月
专 业 信息管理与信息系统
班 级 10信管
学生姓名 xx
学 号 20101511215
指导老师 xxx
实验报告 实验项目:信息获取技术
实验学时:2
实验日期:2012-11-1
实验要求:
(1)熟悉扫描仪、智能手机、数字摄录、条形码、触摸屏、手写技术、音频处理、网络信息采集等各种常用信息获取技术的有关知识及应用技能。
(2)在实验室提供的计算机等设备的基础上,尽可能全面地提前自备上述各类信息产品或功能相同、相近的信息产品,以便进行实物操作。
(3)确实无实物或功能近似产品可用于实习的,可以用文字描述及粘贴图片的方式记录在实验报告上。
实验内容:
1、使用任一款扫描仪设备扫描任一书籍、报刊、票据等,并用扫描仪配备的OCR软件进行文字识别及图像编辑,最终将所选定的信息资料转化成硬盘中的电子文档。(确无设备的,可查阅相关资料,将简要的文字叙述及软件窗口粘到报告中。)
中晶扫描仪尚书OCR7.5文字识别软件使用图像的输入:打开尚书OCR软件,从“文件”菜单中,我们能够看到有两种选择,就是“打开图像”和“扫描”两种方式。一般用户的图像是通过扫描得到在扫描之前,如果用户是第一次使用,建议用户进入“选择扫描仪”的项目用户选择对应自己使用扫描仪的驱动,我们这里用Scanmaker 3870扫描仪所对应的Microtek ScanWizard 5 6.60 版本的驱动。然后按下“确定”按钮在保证扫描仪已经联机的状态下,将要扫描的稿件放置在玻璃平台上,请点击“文件”菜单下的“扫描”选项需要做的是选择扫描范围,针对我们现在要扫描的报纸,我们可以将扫描范围选择得大一些,只要包含了要识别的内容即可。下面就要进行扫描前的设置:首先是选择“原稿”,默认是照片,建议此时用户选择“文档”接下来选择“扫描类型”,这里推荐使用“真彩色”或者“灰阶”然后是“输出目的”选择,这推荐使用“OCR文字识别”或者“自定义”中键入“300DPI” 如此,我们就进行完毕了扫描的设置,在控制界面窗口的下面,就可以看到扫描参数的设置信息了。
点“扫描”按钮。扫描仪将进行扫描工作。扫描完毕后,扫描的图象会传送到尚书OCR内。
识别与校对对于简单的文稿,直接用“识别”菜单下的“开始识别”识别完成后,画面会进入文字校对的画面。
如果需要,用户可以在这里,做一个字一个字的校对。通过对比,修改识别结果。在校对的时候,可以看到尚书软件已经提供了此行的行图像在文字的上方,用户可以比较方便的做原图像与识别后结果的核对工作。遇到有些字,可能识别错误,软件提供了类似字型的参考字备选。
输出结果需要用菜单上的“输出”到“指定格式文件”的功能。默认保存的路径是:尚书软件下的OUTPUT目录。
数码相机是集光学、机械、电子、电功一体化的产品。它集成了影像信息的转换、存储和传输等部件,具有数字化存取模式,与电脑交互处理和实时拍摄等特点。光线通过镜头或者镜头组进入相机,通过成像元件转化为数字信号,数字信号通过影像运算芯片储存在存储设备中。数码相机的成像元件是CCD或者COMS,该成像元件的特点是光线通过时,能根据光线的不同转化为电子信号。光笔、条码卡槽、扫描枪、激光全向扫描台、手持式激光条码扫描器 LS2208三星Galaxy Tab P1000,7.0英寸超大电容触摸屏数位电磁板和压感式电磁板的工作原理都是采用了技术。它由手写笔发射出,由写字板上排列整齐的传感器感应到后,计算出笔的位置后报告给计算机,然后由计算机做出移动或其它的相应动作。压感电磁板中又加入了压力感应技术:笔尖可以随着用力的大小微微的伸缩,一个附加的传感器能感应到你在笔尖上所施加的压力,并将压力值传给计算机,计算机则在屏幕上放映出该值笔迹的粗细。6、将本人任意一句话进行话音获取及处理,生成音频格式的文件保存在硬盘上。并用几张图片对采样、量化、编码等过程进行示意说明。
采样是每隔一个时间间隔在模拟声音的波形上取一个幅度值。
量化是对声波波形幅度的数字化。
编码是按照一定的格式把经过采样和量化得到的离散数据记录下来,并在有用的数据中加入一些用于纠错、同步和控制的数据。
7、选取任一种互联网信息采集软件,叙述其
文档评论(0)