基于双语语料库地短语复述实例获取研究.pdfVIP

  • 9
  • 0
  • 约1.28万字
  • 约 6页
  • 2017-08-19 发布于安徽
  • 举报

基于双语语料库地短语复述实例获取研究.pdf

基于双语语料库的短语复述实例获取研究★ 李维刚 刘挺 李生 哈尔滨工业大学计算机学院信息检索研究室哈尔滨150001 E-mail:{lee,tliu,lisheng}(面一ir.hit.edu.cn. 摘要:本文提出一种基于双语语料库的短语复述实例获取方法,尤其自旨够很好的抽取歧义短语的复述实例。该方 法通过输入—个双语短语对约束短语的语义。利用词对齐的双语语料库。构造一个双向抽取模型从中抽取双语对 的复述实例。双向抽取模型通过比较每—个候选复述短语和输入短语之间的语义一致性,来确定每个候选是否成 为最终的复述实例。实验结果表明,本文短语复述实例获取方法的综合准确率达到了600/o,获取了较好的性能。 关键词:复述实例;复述获取;短语复述;双语语料库 PhrasaI i Si ti onBasedonBi I i I ParaphraseAcqu ngua Corpus Li Liu Li WeigangTmgSheng Retrieval Information Instilute 150001 Laboratory,Ha,binofTechnology,Harbin E-mail:{lee,tliu,lisheng|@ir.hit.cch.cn. 011 Abstract:Anovdmethodbased is to锄ct bilingualcorpusproposed phrasalparaphraseexamplesEspecially,it锄 exWact the allcandidate afeexlracted is paraphrasesofambiguousbilingual input.Then phrases.A p面r orisinal paraphrases fromword bi-dircctionmoddis to confident tothe aligned acquire bilinsualcorpus.The designed paraphrasesaccording coherencebd阳册thecandidateandthe of thdr$crlsos.Thet翳ttlts phrases inputphrases,insteadtagging experimental showthatthe synthesisprecision reaches600/o.Themethodachievesagoodperformance. Corpus 脚ord:ParaphraseExample,ParaphraseAcquisifion,PhrasalParaphrase,Bilingual 1引言 复述技术主要研究的是人类语言中的同义现象,能够被广泛地应用到多个领域中,包括机器 翻J犟[1-3]、多文档文摘【41、自动问答【51和信息抽取【6】等,近几年来有关复述的研究受到了越

文档评论(0)

1亿VIP精品文档

相关文档