- 9
- 0
- 约1.28万字
- 约 6页
- 2017-08-19 发布于安徽
- 举报
基于双语语料库的短语复述实例获取研究★
李维刚 刘挺 李生
哈尔滨工业大学计算机学院信息检索研究室哈尔滨150001
E-mail:{lee,tliu,lisheng}(面一ir.hit.edu.cn.
摘要:本文提出一种基于双语语料库的短语复述实例获取方法,尤其自旨够很好的抽取歧义短语的复述实例。该方
法通过输入—个双语短语对约束短语的语义。利用词对齐的双语语料库。构造一个双向抽取模型从中抽取双语对
的复述实例。双向抽取模型通过比较每—个候选复述短语和输入短语之间的语义一致性,来确定每个候选是否成
为最终的复述实例。实验结果表明,本文短语复述实例获取方法的综合准确率达到了600/o,获取了较好的性能。
关键词:复述实例;复述获取;短语复述;双语语料库
PhrasaI i Si ti onBasedonBi I i I
ParaphraseAcqu ngua
Corpus
Li Liu Li
WeigangTmgSheng
Retrieval
Information Instilute 150001
Laboratory,Ha,binofTechnology,Harbin
E-mail:{lee,tliu,lisheng|@ir.hit.cch.cn.
011
Abstract:Anovdmethodbased is to锄ct
bilingualcorpusproposed phrasalparaphraseexamplesEspecially,it锄
exWact the allcandidate afeexlracted
is
paraphrasesofambiguousbilingual input.Then
phrases.A p面r orisinal paraphrases
fromword bi-dircctionmoddis to confident tothe
aligned acquire
bilinsualcorpus.The designed paraphrasesaccording
coherencebd阳册thecandidateandthe of thdr$crlsos.Thet翳ttlts
phrases inputphrases,insteadtagging experimental
showthatthe
synthesisprecision
reaches600/o.Themethodachievesagoodperformance.
Corpus
脚ord:ParaphraseExample,ParaphraseAcquisifion,PhrasalParaphrase,Bilingual
1引言
复述技术主要研究的是人类语言中的同义现象,能够被广泛地应用到多个领域中,包括机器
翻J犟[1-3]、多文档文摘【41、自动问答【51和信息抽取【6】等,近几年来有关复述的研究受到了越
原创力文档

文档评论(0)