- 51
- 0
- 约3.6万字
- 约 89页
- 2025-01-14 发布于广东
- 举报
现代文阅读Ⅰ【总体分析】两则材料分别摘编自胡韧奋、李绅、诸雨辰《让AI一口气读完〈四库全书〉会怎样?》、中国教育报《古汉语大语言模型“AI太炎2.0”发布会在京举行》,适用于考查考生语文核心素养“思维发展与提升”,五道试题考查的内容与针对性各有不同,考点之间没有交叉重复,重点考查考生筛选并整合文中信息、综合文中信息进行推断以及分析原文论证的能力,要求考生具备一定的批判性思维能力。
现代文阅读Ⅰ试题呈现:1.下列对材料相关内容的理解和分析,不正确的一项是(3分)2.根据材料内容,下列说法正确的一项是(3分)3.下列案例中,哪一项最不适合作为论点“语言模型具有句读三项重要的技能点”的论据(3分)4.小刚在阅读上述材料后,绘制了一幅思维导图。请结合材料内容,下列对思维导图的解说正确的一项是(3分)5.刘教授是一名已退休的古代汉语教授,近期他正在研读一本冷门的中国古代典籍,但仅靠个人之力十分头疼,你向他推荐AI模型作为辅助工具,请根据下列交际情境拟写几条推荐要点。(6分)考查方向:主要考查学生理解和分析材料相关内容的能力,考查学生分析文外论据与文内论点是否相符的能力,考查学生分析论证效果的能力,筛选整合信息、分析概括文本内容的能力。
材料一:①近年来,人工智能技术与人文历史研究碰撞出不少火花,那么,AI对于古代汉语的理解能力怎么样?②日前,北京师范大学中文信息处理与古典文献学专业的研究者们尝试训练一个“饱读诗书”的语言模型,并让AI来参与古籍整理的工作。模型学习的对象包括《四库全书》与“殆知阁”语料库,而学习的方法则来自语言智能领域最新的深层语言模型。③2018年,谷歌公司曾推出了深层语言模型BERT,它在阅读理解等11项语言理解任务中刷新纪录。和之前的方法相比,深层语言模型一是可以吞吐超大量的数据,二是有很强的记忆和理解能力。(1.A以往语言模型无法吞吐巨量的数据,也没有强劲的记忆和理解能力,深层语言模型在这两方面具有优势。√)现有的深层语言模型覆盖了英文和中文,但却不具备理解古汉语的能力。于是,研究者们希望通过上述海量的古汉语数据来让机器“感受”一下博大精深的诗书礼乐文化。在多块计算卡上并行训练了约一周时间后,古汉语BERT初出江湖,AI可以像人一样联系上下文理解字词含义,并将其以数学向量表示。现代文阅读Ⅰ
④为了检测其理解效果,研究者们引入了句读任务。在古典文史学习过程中,句读通常是必备的基本功。古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对古汉语知识有较高要求。(2.A研究者们之所以让语言模型解决句读问题,是为了用客观的方式测试模型的理解能力,考查其在古典文史阅读中的必备技能。√)宋代大儒朱熹读韩愈文章,便有“然不知此句当如何读”之惑。在句读的过程中,有三项重要的技能点:利用古汉语特有的节奏和韵律感,联系上下文语境信息推敲求解,调用文本之外的历史文化知识。(第3题:)⑤虽然现在很多古代经典都出版了标点本,但其中常常包含错误,并且,在现有的古籍数据中,大部分文献仍未实现句读。据统计,“殆知阁”古代文献藏书2.0版语料库规模约33亿字,其中仅25%左右的数据包含标点。如果依靠人工继续整理这些古籍,则不知何年何月才能整理到头。如果依靠计算机,现有的技术方法却普遍只能达到60%~70%的准确率,还很难为人所用。(2.B现在很多古代典籍都有了标点本,但总体上错漏较多。因此现有的识别技术方法的准确率并不理想,依然很难为人们所使用。×强加关系。“虽然现在很多古代经典都有了标点本,但其中常常包含错误”与“现有识别技术方法的准确率并不理想,依然很难为人们所使用”不构成因果关系。)现代文阅读Ⅰ
⑥为了让AI在理解文义的基础上具备句读功能,研究者们准备了大量带标点的数据,包括超过30万首古诗,2万余首词,800多万段古文,模型还引入了处理标签序列的机制来专门学习句读方法。由于诗词具有较为明显的格律特征,如大部分古诗为四五七言,而词牌名可以提示断句规则,为了帮助模型更好地学习语义和韵律信息,在预处理数据时保留了古诗题目,并去除词牌名。(1.B研究者在预处理古诗文数据时保留了诗题,并去除词牌名,旨在帮助模型更顺利地学习语义和韵律信息。√)⑦在多块计算卡上并行学习了数天句读后,模型终于“出山”。在测试环节,研究者们引入了两轮难度不同的实验。普通版测试对象为一批模型从来没见过的诗词古文数据(古诗5000首,词2000首,古文5000段),实验中,模型在诗、词、古文的
您可能关注的文档
- 第1课 文明的产生与早期发展课件【高效课堂精研】高一下学期统编版(2019)必修中外历史纲要下.pptx
- 15《背影》 【知识精研】八年级上册同步备课.pptx
- 2025届高考语文八省联考作文讲评 课件.pptx
- 2025届高考语文复习:信息类文本五大类型的主观题 课件.pptx
- 2025届江苏省南京市盐城市高三一模考试语文试题 课件.pptx
- Unit 2 No Rules, No Order 第5课时 Section B(2a-2c) 【知识精研】七年级英语下册 (人教版2024).pptx
- 必修三 Unit 2 Morals and Virtues Reading for writing 【知识精研】高一英语高效课堂(人教版2019必修第三册).pptx
- 必修三 Unit 2 Morals and Virtues Words and Expressions 【知识精研】高一英语高效课堂(人教版2019必修第三册).pptx
- 初中语文八年级下册大单元教学 【高效课堂精研】 第 四单元.pptx
- 初中语文八年级下册大单元教学 【高效课堂精研】 第五单元.pptx
- 2026届广东省东莞市虎门汇英校中考四模数学试题含解析.doc
- 2026届北京市海淀区首都师大附中中考生物最后冲刺浓缩精华卷含解析.doc
- 河南省周口沈丘县联考2026届中考生物模试卷含解析.doc
- 河北省保定市雄县市级名校2026届中考试题猜想数学试卷含解析.doc
- 2026届陕西省西安市西工大附中达标名校中考冲刺卷生物试题含解析.doc
- 四川省眉山县市级名校2026届中考联考数学试题含解析.doc
- 四川省成都市育才校2026届中考数学考试模拟冲刺卷含解析.doc
- 2026届山东省安丘市、高密市、寿光市重点达标名校中考一模生物试题含解析.doc
- 2026届广东省佛山市重点达标名校中考数学全真模拟试题含解析.doc
- 2026届吉林省辽源市东丰县小四平镇中学中考押题数学预测卷含解析.doc
原创力文档

文档评论(0)