基于自然语言处理图书阅读难度自动分级研究.docVIP

基于自然语言处理图书阅读难度自动分级研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于自然语言处理图书阅读难度自动分级研究

基于自然语言处理图书阅读难度自动分级研究   摘 要: 图书阅读难度自动分级系统能够帮助儿童读者快速找到适合自己认知水平的图书。文章基于图书句子难度和字难度两个维度,建立了一个图书难度分级模型,并开发出对应的图书阅读难度自动分级系统。利用该系统对常见的儿童图书进行了测试,初步实验表明:从图书中随机选取字数达到2500-3000字时,图书阅读难度分级算法测试结果误差较小,综合使用字难度和句子难度的分级算法比单纯字难度分级算法和单纯句子难度分级算法的效果更好。该系统目前仅限于白话文图书应用。   关键词: 分级阅读; 句子难度; 字难度; 汉字常用字词库   中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2017)08-01-05   Abstract: The automatic grading system of reading difficulty degree can help children find books that are suitable for their own cognitive level. Based on the two dimensions of sentence difficulty and word difficulty, this paper establishes a hierarchical model of reading difficulty degree, and develops an automatic grading system of reading difficulty degree. The common childrens books are tested by this system, preliminary experiments show that when the randomly selected books with words up to 2500-3000, the grading algorithm of reading difficulty degree results in less errors, and the grading algorithm using both sentence difficulty and word difficulty has a better result than that only using sentence difficulty or word difficulty. The system is currently limited to the books of using vernacular.   Key words: graded reading; the sentence difficulty; the word difficulty; Chinese characters commonly used thesaurus   0 引言   2011年8月??务院制定的《中国儿童发展纲要(2011-2020)》[1]首次明确提出“推广面向儿童的图书分级制”,为不同年龄儿童提供适合其年龄特点的图书。图书分级阅读[2]是指从少儿的年龄特征、思维特征、社会化特征出发,根据阅读者不同年龄段的智力和心理发育程度,有针对性地为不同阅读能力的孩子提供合适的图书,为读者提供科学的阅读计划。   孩子的阅读热情可能因不能阅读到合适的图书而降低[3]。儿童在不同成长期的阅读兴趣和阅读发展有很大的变化,如何实现图书分级阅读以满足孩子不同的阅读需求已经成为一个亟待解决的问题[4]。   近年来一些国内出版社已经开始为儿童图书做分级标引,按照不同年龄段孩子的需要,重新编辑、出版一些作家的作品。但这种分级方法不但需要耗费大量的人力财力,还要花费大量的时间[5]。由于信息时代新书增长速度越来越快,传统的图书分级方法已经捉襟见肘,不能满足儿童迫切的阅读分级需求。因此,图书自动分级研究具有重要的现实意义[6]。   与西方发达国家相比,国内的图书分级阅读还不成熟[7-8]。中文图书分级阅读,需要学习国外的图书分级理论与实践成果,但由于欧美语系与汉语差异很大,针对其英文开发的分级系统并不适用于中文图书。因此,要促进国内分级阅读的推广,需要研究一种针对中文图书的分类方法。   本研究是以图书分级阅读为背景,研究图书阅读难度分级技术,通过抽取图书的自然语言特征,结合儿童认知发展规则,建立一套中文图书阅读难度分级模型,并实现一个可以在线测试图书的阅读难度分级系统,为儿童分级阅读提供服务。   1 图书分级阅读标准   欧美比较常见的分级阅读标准有两种。一种是A―Z分级阅读标准(Guide

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档