基于Bootstrapping的交通工具名识别研究.pdfVIP

  • 2
  • 0
  • 约9.02千字
  • 约 3页
  • 2018-01-03 发布于广东
  • 举报

基于Bootstrapping的交通工具名识别研究.pdf

计算机科学2008V01.35№.4B 基于Bootstrapping的交通工具名识别*) 王振宇u谭红叶1.2.3郑家恒1-3 (山西大学计算机与信息技术学院 太原030006)1 (哈尔滨工业大学计算机科学与技术学院 哈尔滨150001)2 (计算智能与中文信息处理省部共建教育部重点实验室 太原030006)3 摘要交通工具名的正确识别对信息抽取、自动问答等信息处理任务意义重大。为了解决获取标注语料困难这个 问题,本文实现了一种基于Bootstrapping的交通工具名识别方法,其特点是:(1)通过手工标记小部分语料逐渐学习 得到大量标注信息,(2)其中评价模式和样例时采用了计算信息熵增益的方法,以便更加精确地得到它们的度量方法。 在ACE语料上进行测试,实验表明该方法在交通工具名识别中是有效的。 关键词 交通工具名识别,Bootstrapping,信息熵增益,相似度计算 P2(

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档