- 34
- 0
- 约6.05千字
- 约 37页
- 2017-10-13 发布于天津
- 举报
现代汉语语料库建设及深加工-中国语言文字网
《现代汉语语料库建设及深加工》项目总结报告 《现代汉语语料库建设及深加工》课题组 2005-03-18 北京 本项目研究的基础 基础(一)国家语委现代汉语语料库 我国从1990年开始筹备建立大型的国家级语料库——国家语委现代汉语语料库,该语料库由国家语言文字工作委员会主持,组织语言学界和计算机界的专家学者共同建立。 语料时间分布 时间跨度为1919年~2002年,以近20年的语料为主。 语料领域分布: 13个大类,40多个小类,100多个详细分类。 国家语委语料库的语料样本包括24个详细信息: a1总号; a2分类号; a3样本名称;a4类别; a5作者; a6写作时间;a7书刊名称;a8编著者; a9出版社; a10所在省;a11出版日期;a12期号; a13版次(初版印数); a14本版印数;a15总印数; a16总页数; a17开本; a18选择方式; a19起止页数;a20样本字数;a21样本总字数;a22文章总字数;a23简繁体; a24抽样文章。 基础(二)信息处理用现代汉语词类标记集规范 《信息处理用现代汉语词类标记集规范》的制定在国家社科基金“九五”重大项目《信息处理用现代汉语词汇研究》的子项目“信息处理用现代汉语词类标记集规范”(项目编号:97@yy001-4)的基础上完成,进一步得
原创力文档

文档评论(0)