《义务教育常用词表(草案)》参照课程标准的要求研究.docxVIP

  • 52
  • 0
  • 约5.89千字
  • 约 6页
  • 2021-08-08 发布于广东
  • 举报

《义务教育常用词表(草案)》参照课程标准的要求研究.docx

《义务教育常用词表(草案)》参照课程标准的要求研究 摘要:词语难度是衡量文本复杂度的重要指标,但仅从词语频率的高低来评判难易仍有所局限。《义务教育常用词表(草案)》参照课程标准的要求对词义难度进行了分级,为选文词语难度测评提供了依据和标尺,在统编教材选文语料库中分词并结合词语常用度与词义难度进行测算后发现,统编教材选文词语难度在整体呈螺旋式上升的同时,存在部分选文词语难度过高或过低的波动现象。因此,教师应在当前的阅读教学实践中聚焦“难文”“长文”的文本特点,有的放矢地优化教学,有效利用选文提升学生的语文核心素养。 语文教材是以选文为主体的教科书,在语文学科建设及教材编制的发展过程中,选文的选择与编排一直是教材编写者与一线教师研究的热点。选什么样的文章?文章该置于哪个学段哪个单元?如何更好地利用文章的特点培养学生的语文核心素养?大大小小的问题涵盖了从教材编写到语文教学的全过程。《义务教育语文课程标准(2011年版)》(以下简称“课程标准”)在教材编写建议中提到,教材选文要“难易适度,适合学生学习”。但应以哪些指标评判选文的难易程度,如何科学、客观地确定标准,目前国内的研究者众说纷纭。无论哪种分析标准,选文中的词语作为文章的“建筑材料”,都被认为是衡量选文文本复杂度的重要因素之一。 一、词语难度评价的标尺——《义务教育常用词表(草案)》 本研究以《义务教育常用词表(草案)》(以下简称“草案”)为参照对统编教材选文中的词语难度进行了深入分析。草案根据我国义务教育阶段语文学习的要求,收录了较稳定、使用频率较高的普通话常用词语。由此可见,该词表中的词语更具针对性,更适用于基础教育阶段语文词汇学习。在有的放矢地收录词语的同时,该词表还以课程标准关于词汇学习的使用要求、中小学生的学习需要与学习特点等因素为主要依据,对应义务教育阶段的四个学段,将词语难度划分为四个级别,从而体现由易到难、由浅到深、由指物写事到描情状景、由字及词的词汇学习规律。 作为面向母语学习者的词表,草案对词语难度的划分充分考虑到母语学习者与第二语言学习者语言能力、逻辑能力等方面的巨大差异,在研究教科书难度乃至我国儿童汉语分级阅读方面较其他普通词表或汉语国际教育使用词表更加适切,其词语难度等级也可成为统编教材选文难度的有效参照指标之一。有学者指出,教材基本成形后,必须对整套教材的用词进行统计,而草案便可为之提供较为客观的评价标尺。 二、词语难度分析的数据库——统编教材选文文本语料库 对词语难度进行分析,首先应对选文文本中的词语进行划分和词性标注处理,统编教材共有288篇选文,数量较多,因此构建统编教材选文文本语料库至关重要。 语料库是计算语言学与语言学发展的结果,也是当前大数据时代和信息社会发展的需要。将语言材料存储于计算机之中,具有可读取、可转换、可统计等显著优势。郭曙纶认为,借助语料库,学者可从“多方面、多层次描写语言的特征并验证各种语言理论和假设” 首先,须对选文文本进行准确录入并清洗格式,这是保证词语难度分析准确性的前提。本研究使用的是2017年版的统编教材,由于网络上已有的电子版本不一,为保证研究数据更加精准,笔者利用OCR文本识别技术将12册教材中的相关选文依次扫描为电子版,并以计算机为主、人工监控的方式仔细校对,确保选文文本与教材完全一致。与此同时,笔者还依次对选文的相关信息,如作者、体裁、文章字符数、有无改编等统计到表格中,为后续的定量、定性研究打好基础。 由于选文原始语料中含有一定的回车符、制表符以及空格等干扰因素,笔者进一步对这些因素进行了替换或删除,确保文本格式的统一。 随后,笔者使用由教育部语言文字应用研究所计算语言学研究室研发的汉语分词系统对选文文本进行批量化词语切分和词性标注,并逐一人工校对。由于汉语是“意合”语言,许多字、词、短语的界限不尽清晰,笔者在校对分词结果时,一方面遵照《信息处理用现代汉语分词规范》(GB/T13715-92)对词语的划分标准,另一方面参照国家语言资源监测与研究教育教材中心官方网站的义务教育常用词表数据库中的分词结果,以期在客观、准确的基础上与草案中收录的词语相匹配。 经过标注、校对及统计,最终在统编教材中的255篇现代文选文中划分出132436个词符,其中有13510个词种。尽管一到六年级出现的词符数和词种数具有一定的增长梯度,但如要更加精准地评判文本难度,还应利用表格中的函数和统计功能进一步测算各词种的频次数。在以往的研究中,词频的大小是评价词语难度的唯一指标,但实际上这存在一定的机械性,尤其是小型语料库中绝大多数词语出现的频次都较低,不利于有效甄别词语难度。 信息检索与数据挖掘研究中常用的TF-IDF公式指出,字词的重要性随着它在文件中出现的次数成正比提高,但同时会随着它在语料库中出现的

文档评论(0)

1亿VIP精品文档

相关文档