- 25
- 0
- 约1.09万字
- 约 26页
- 2018-05-10 发布于江苏
- 举报
语料标注的速成教程:自己做个半自动标注器8
《语料标注的速成教程:自己做个半自动标注器》
作者:李亮 (广东外语外贸大学 词典学中心 )
2012 年 8 月 17 日 Email: 492130980@
【步骤1】语料经过标注,就变得很有深度,能提供前所未有的信息,就从 “生语料”
变成了 “熟语料”,假设我们对good 这个形容词标注一下词性,就有下面的3 种主要
做法。国内的中文语料标注主要是斜线型,某些经典的英语语料采用了下划线型,而
最新的主流是XML 型;
【步骤2 】知识分子天天打交道的Microsoft Office Word 的功能远远超过普通人的想
象,而当代的定性标注工具在语言教学与研究中扮演着重要的角色,例如,语义韵研
究、社会语言学、语言测试、词典学、翻译学、文化学、二语习得研究,往往需要对
自然语料中的词汇的语义呀,语用呀,进行种种精细的评价或深入梳理,而我们在使
用复杂而先进的商业版的定性分析标注工具之前,往往可以自己做个半自动定性标注
工具来体验一下;
原创力文档

文档评论(0)