- 1
- 0
- 约9.01千字
- 约 23页
- 2026-05-13 发布于四川
- 举报
2026年高二新疆联考试题及答案
一、现代文阅读(35分)
(一)论述类文本阅读(本题共3小题,9分)
阅读下面的文字,完成1~3题。
数字人文视域下的古籍整理研究正在经历范式转型。传统古籍整理以版本校勘、文字训诂为核心,强调对文献本体的精确还原;而数字人文技术的介入,使古籍整理从“文本中心”转向“数据中心”,形成“整理即研究”的新型模式。这种转型不仅是技术手段的革新,更带来研究思维的深层变革。
在数据采集环节,OCR(光学字符识别)技术与人工校对结合,突破了传统抄录的效率瓶颈。以《全唐诗》数字化工程为例,通过深度学习优化的OCR系统,识别准确率从早期的85%提升至98.7%,单部诗集的数字化时间从人工抄录的3个月缩短至3天。但技术并非万能,古籍中的异体字、俗写字、断版残页等特殊形态,仍需人工干预。如敦煌文献中的“囗”(缺字符号)与“々”(重文符号),OCR常误识为“口”或“二”,需整理者结合上下文语境修正。
数据结构化是数字人文古籍整理的关键步骤。传统整理成果多以纸质书或PDF格式呈现,信息呈线性排列,难以实现跨文本、跨维度的关联分析。而通过XML(可扩展标记语言)或RDF(资源描述框架)对古籍进行语义标注,可将文本拆解为“作者-时间-地点-事件-关键词”等数据元,构建知识图谱。例如整理《明实录》时,将“灾异”条目标注为“自然事件”类型,关联“地震”“洪水”等子类型,并链接《中国
原创力文档

文档评论(0)