非遗文献 OCR 识别处理师岗位招聘考试试卷及答案.docVIP

  • 0
  • 0
  • 约2.74千字
  • 约 7页
  • 2026-02-16 发布于山东
  • 举报

非遗文献 OCR 识别处理师岗位招聘考试试卷及答案.doc

非遗文献OCR识别处理师岗位招聘考试试卷及答案

非遗文献OCR识别处理师岗位招聘考试试卷

一、填空题(10题,1分/题)

1.OCR的中文全称是______。

2.非遗文献中常见的手写体类型包括______(举1例即可)。

3.OCR预处理中,将图像转为黑白两色的操作是______。

4.开源OCR引擎Tesseract最初由______公司开发。

5.非遗文献载体中,拓片属于______(纸质/非纸质)载体。

6.OCR结果后处理中,针对异体字的常见方法是______。

7.国家非遗文献保护的核心机构是______。

8.OCR识别准确率的评价指标“正确识别字符数/总字符数”是______。

9.非遗文献OCR中,处理粘连字符的预处理操作是______。

10.通用OCR工具难以识别的非遗文献特征是______(举1例即可)。

二、单项选择题(10题,2分/题)

1.以下属于商业OCR服务的是()

A.TesseractB.百度智能云OCRC.OpenCVD.PyTesseract

2.非遗文献中最难识别的类型通常是()

A.印刷古籍B.手写手稿C.拓片D.现代印刷文献

3.OCR预处理步骤的正确顺序是()

A.二值化→倾斜校正→去噪B.倾斜校正→二值化→去噪

C.去噪→倾斜校正→二值化D.倾斜校正→去噪→二值化

4.非遗拓片OCR的预处理关键是()

A.彩色增强B.笔画加粗C.背景虚化D.灰度拉伸

5.非遗文献OCR后处理中,格式还原的核心是()

A.修正错别字B.恢复文献排版C.补充缺失字符D.转换文件格式

6.以下不属于非遗文献载体的是()

A.宣纸古籍B.皮影脚本C.电脑文档D.拓片

7.OCR识别中“召回率”指()

A.正确识别/总识别B.正确识别/实际存在C.错误识别/总识别D.实际存在/总识别

8.非遗手写体OCR最有效的优化方式是()

A.更换商业工具B.增加样本标注C.提高分辨率D.缩短预处理时间

9.国家非遗文献数字化的重点不包括()

A.高清扫描B.OCR识别C.商业变现D.长期保存

10.非遗文献特有的特征是()

A.简体字B.异体字C.标点符号D.彩色插图

三、多项选择题(10题,2分/题)

1.非遗文献OCR预处理步骤包括()

A.倾斜校正B.二值化C.去噪D.字符分割

2.非遗文献载体类型包括()

A.纸质古籍B.拓片C.手稿D.数字化文件

3.OCR结果后处理方法有()

A.人工校对B.异体字对照C.格式还原D.噪声去除

4.国家支持非遗文献数字化的政策有()

A.《“十四五”非遗保护规划》B.数字化补贴

C.禁止数字化D.非遗数据库建设

5.OCR识别常见噪声类型有()

A.斑点噪声B.划痕噪声C.背景噪声D.字符噪声

6.非遗文献OCR难点包括()

A.异体字多B.手写体复杂C.载体老化D.格式统一

7.常用商业OCR服务有()

A.百度OCRB.阿里云OCRC.腾讯云OCRD.Tesseract

8.非遗文献OCR人工校对重点是()

A.异体字修正B.手写体错误C.格式恢复D.数据备份

9.OCR准确率评价指标有()

A.准确率B.召回率C.F1值D.速度

10.非遗文献需关注的特殊字符是()

A.异体字B.古体字C.符号D.简体字

四、判断题(10题,2分/题)

1.OCR预处理无需针对非遗文献特殊特征调整。()

2.Tesseract是完全免费的开源OCR引擎。()

3.非遗拓片可直接用通用OCR识别。()

4.OCR后处理必须包含人工校对。()

5.国家非遗保护中心不参与OCR项目。()

6.非遗手写体可通过通用OCR准确识别。()

7.OCR预处理去噪会影响字符识别。()

8.非遗文献数字化无需考虑版权。()

9.格式还原是非遗OCR后处理的必要步骤。()

10.异体字识别需要专属训练集。()

五、简答题(4题,5分/题)

1.简述非遗文献OCR预处理的核心步骤及作用。

2.非遗文献OCR与普通文献OCR的主要区别是什么?

3.简述OCR结果后处理中人工校对的关键要点。

4.国家支持非遗文献数字化的主要政策有哪些?

六、讨论题(2题,5分/题)

1.如何提升非遗文献中异体字、手写体的OCR识别准确率?

2.非遗文献OCR识别后的数据如何长期保存与共享?

---

答案

一、填空题答案

1.光学字符识别

2.手稿(或皮影脚本、拓片文字等合理答案)

3.二值化

4.谷歌(Google)

5.纸质

6.异体字对照表校对(或人工修正)

7.中国非物质文化遗产保护中心

8.准确率

9.粘连字符分割(或笔画分离)

10.异体字(或手写体、拓片文字等合理答案)

二、单项选择题答案

1.B2.C3.B4.B5.B6.C7.B8.B9.C10.B

三、多项选择题答案

1.ABCD2.ABC3.A

文档评论(0)

1亿VIP精品文档

相关文档