- 4
- 0
- 约1.11万字
- 约 14页
- 2015-08-06 发布于安徽
- 举报
国家语委十五科研重大项目-现代汉语语料库的建设及深加工
国家语委语料库科研成果简介
教育部语言文字应用研究所计算语言学研究室
一、国家语委现代汉语语料库介绍
语料库是存储于计算机中并可利用计算机进行检索、查询、分析的语言素材的总体。基
于语料库的分析方法是对传统的基于规则的分析语言的方法的一个重要补充。语料库具有
“大规模”和“真实”这两个特点,因此是最理想的语言知识资源,是直接服务于语言文字
信息处理等领域的基础工程。近十几年来,美、英、法、德、日等国家都投入巨资,相继建
立了大规模的语料库,如英国国家语料库 BNC 等。我国从 1990 年开始由国家语言文字工作
委员会主持,组织了语言学界和计算机界的专家学者共同建立了大型的国家级语料库,即国
家语委现代汉语语料库。
国家语委现代汉语语料库是一个大型的通用的语料库,以语言文字的信息处理、语言文
字规范和标准的制定、语言文字的学术研究、语文教育和语言文字的社会应用为主要服务目
标。国家语委现代汉语语料库作为国家级语料库,在汉语语料库系统开发技术上具有国际领
先水平,在语料可靠、标注准确等方面具有权威性。国家语委现代汉语语料库面向国内
原创力文档

文档评论(0)