面向依存文法分析的搭配抽取方法研究.pdfVIP

  • 10
  • 0
  • 约 8页
  • 2017-08-26 发布于江苏
  • 举报

面向依存文法分析的搭配抽取方法研究.pdf

面向依存文法分析的搭配抽取方法研究 车万翔 刘挺 秦兵 李生 (哈尔滨工业大学信息检索组 150001 ) {car, tliu, qinb}@ir.hit.edu.cn 摘要 文通过对经分词和词性标注的大规模语料库(1.8GB )中出现的词对的个数和距离及 方差的统计,并应用t 检验的改进方法,得到了词对之间的“搭配强度系数”R ,以此来衡 量它们之间这种搭配关系的强弱。这一系数直接面向依存文法分析,以此得到一个句子中各 词搭配关系强弱的序列表,以后将要从此表中得到依存文法树。目前我们可以在智能搜索引 擎等多种场合找到此种方法的应用。 关键词 搭配 搭配强度系数 t 检验 依存文法 智能搜索引擎 Method to get away collocations oriented dependency grammar Abstract In this paper, we statistic a very large corpus (1.8GB) and work out the word pairs number, distance s mean and varianc

文档评论(0)

1亿VIP精品文档

相关文档