语料标注的速成教程:自己做个半自动标注器8.pdfVIP

  • 25
  • 0
  • 约1.09万字
  • 约 26页
  • 2018-05-10 发布于江苏
  • 举报

语料标注的速成教程:自己做个半自动标注器8.pdf

语料标注的速成教程:自己做个半自动标注器8

《语料标注的速成教程:自己做个半自动标注器》 作者:李亮 (广东外语外贸大学 词典学中心 ) 2012 年 8 月 17 日 Email: 492130980@ 【步骤1】语料经过标注,就变得很有深度,能提供前所未有的信息,就从 “生语料” 变成了 “熟语料”,假设我们对good 这个形容词标注一下词性,就有下面的3 种主要 做法。国内的中文语料标注主要是斜线型,某些经典的英语语料采用了下划线型,而 最新的主流是XML 型; 【步骤2 】知识分子天天打交道的Microsoft Office Word 的功能远远超过普通人的想 象,而当代的定性标注工具在语言教学与研究中扮演着重要的角色,例如,语义韵研 究、社会语言学、语言测试、词典学、翻译学、文化学、二语习得研究,往往需要对 自然语料中的词汇的语义呀,语用呀,进行种种精细的评价或深入梳理,而我们在使 用复杂而先进的商业版的定性分析标注工具之前,往往可以自己做个半自动定性标注 工具来体验一下;

文档评论(0)

1亿VIP精品文档

相关文档