以语文特征为基之中学阅读测验短文分级usinglinguisticfeaturesto.pdf

以语文特征为基之中学阅读测验短文分级usinglinguisticfeaturesto.pdf

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
以语文特征为基之中学阅读测验短文分级usinglinguisticfeaturesto

以語文特徵為基之中學閱讀測驗短文分級 Using Linguistic Features to Classify Texts for Reading Comprehension Tests at the High School Levels 黃昭憲 郭韋狄 李嘉玲 蔡家琦 劉昭麟 Chao-Shainn Huang Wei-Ti Kuo Chia-Ling Li Chia-Chi Tsai Chao-Lin Liu 國立政治大學資訊科學系 National Chengchi University, Taipei, Taiwan chaolin}@.tw   摘要 短文閱讀是中階語文學習者的重要功課,閱讀測驗也是語文測驗中的重要項目。掌握文 本的分級技術,是電腦輔助閱讀測驗選題和電腦輔助閱讀的重要基礎。雖然閱讀測驗的 文本部分,並不能全然決定整體試題難易度,但是文本部分的分級,仍為一個相關的基 石研究。本研究以國內高級中學程度的真實閱讀測驗文本為研究語料,考慮詞彙、句子 表面特徵與句法相關訊息等特徵,搭配不同的機器學習技術進行分類工作。我們分析了 不同類別文字資訊對於分類正確性的貢獻度,目前最高可達 53.6%的分類正確性。 Abstract We investigate the issue of classifying short essays based their linguistic issues, for English at the high school levels. A good selection of appropriate essays is crucial for the language learners and for the reading comprehension tests, which is an important type of tests for lan- guage competence examinations. Although the text alone does not allow us to judge the dif- ficulty of reading comprehension tests, the capability to identify the levels of high school students for whom the texts were used in the reading comprehension can be an important step toward computer assisted selection of reading comprehension test items. We employed word-level statistics, sentence-level statistics, and syntactic-level information of the text, and applied several machine learning techniques for this text classification problem. Experimental results show that, with the best performing combination of features and l

文档评论(0)

laolao123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档