- 2
- 0
- 约2.06万字
- 约 20页
- 2017-10-28 发布于天津
- 举报
确定切词单位的某些语法因素-中国语言文字网
Journal of Chinese Language and Computing GB
.sg/cgi-win/journal/paper.exe
中国语料库研究的历史与现状
冯志伟
教育部语言文字应用研究所
朝内南小街 51 号
100010 北京,中国
e-mail: zwfengde@
2001年11月25日提交,2002年7月25日修改
摘要
本文首先简要回顾了国外语料库的概况,然后,比较详细地介绍中国语料库的发展情况,包括早期的语料库、国家级语料库、大规模真实文本语料库、口语语料库、双语语料库、少数民族语言语料库等,接着介绍语料库的各种加工技术,如自动切分、自动词类标注、自动短语结构标注、自动双语对齐等,使我们对于语料库研究得到一个鸟瞰式的认识。最后讨论了当前语料库研究中的一些问题,如语料库的规范和标准问题,语言资源共享问题、知识产权问题等。
关键词
语料库;大规模真实文本;口语语料库;双语语料库;少数民族语言语料库;自动切分;自动词类标注;自动短语结构标注;双语对齐
语言学的研究必须以语言事实作为根据,必须详尽地、大量地占有材料,才有可能在理论上得出比较可靠的结论。传统的语言材料的搜集、整理和加工完全是靠手工进行的,这是一种枯燥
您可能关注的文档
最近下载
- 2026年度河南林业职业学院单招《数学》试卷【考试直接用】附答案详解.docx VIP
- 旅游学概论复习资料.docx
- 作业许可管理规定.docx VIP
- TPI-2021年02月25日:配备DQ500_DQ380_DQ381变速箱的车辆变速箱故障指示灯亮起并存储事件存储器条目P173500_P173600-VW(2061782-1).pdf VIP
- 化妆品生产质量管理规范检查要点及判定原则专项考核试卷.doc VIP
- 2026历年高考英语真题高频词汇必备800个(打印版).pdf
- JBT9007-2018 起重滑车-行业标准.pdf VIP
- 第五单元+长江流域的歌+《川江船夫号子》课件 +2025-2026学年粤教花城版初中音乐八年级下册.pptx VIP
- 15D500-15D505 防雷与接地图集(合订本).docx
- 《康复护理学》康复评定神经肌肉电生理检查.ppt VIP
原创力文档

文档评论(0)