- 142
- 0
- 约1.53万字
- 约 11页
- 2017-03-17 发布于湖北
- 举报
中国英语学习者语料库
CLEC收集了包括中学生、大学英语4级和6级、专业英语低年级和高年级在内的5种学生的语料一百多万词,并对言语失误进行标注。其目的就是观察各类学生的英语特征和言语失误的情况,希望通过定量和定性的方法对中国学习者英语作出较为精确的描写,为我国学生的英语教学提供有用的反馈信息。
表1 CLEC语料分布 类型 词次 ST2 208088 ST3 209043 ST4 212855 ST5 214510 ST6 226106 总计 1070602 言语失误标注 原则
?1. 简单合理,易于系统操作。参与标注的人比较多,分类表过于繁复,就难于掌握。我们采取两级分类,第一级有11类:词形(fm)、动词短语(vp)、名词短语(np)、代词(pr)、形容词短语(aj)、副词(ad)、介词短语(pp)、连词(cj)、词汇(wd)、搭配(cc)、句子(sn)。每一类里再用数目字细分。如[cc]为词语搭配不当,[cc1]表示名词和名词的搭配,[cc2]表示名词和动词的搭配,[cc3]表示动词和名词的搭配,等等。
?2. 分类表的类别要适中。过粗容易统一,但信息太少,不利于分析学习者的失误/过细难以统一,容易把同一种失误归到不同类别。目前我们采取的办法是对常见的失误从细(如vp和np都有9小类),对少见的失误从粗(如cj只有两小类)。现在的分类表有61个失误码,是
您可能关注的文档
最近下载
- AP宏观经济学 2004年真题 附答案和评分标准 AP Macroeconomics 2004 Real Exam with Answers and Scoring Guidelines.pdf VIP
- 五邑大学-本科-毕业论文-理科-格式模板范文.docx VIP
- 行政审批系统使用手册.pdf VIP
- 《透明式LED显示屏通用技术规范》.pdf
- 视频会议系统使用说明书.doc VIP
- 销售行业述职报告5篇.docx VIP
- 2026广东清远市阳山县融媒体中心招聘新闻人员4人备考题库及答案详解(最新).docx VIP
- 数据科学与大数据技术专业建设方案(汇报PPT).pptx
- 2025各地融媒体中心招聘笔试历年真题+模拟题答案汇总.doc VIP
- U盘接口芯片CH378在音乐播放器设计中的应用.pdf VIP
原创力文档

文档评论(0)