基于长度和位置信息的双语句子对齐方法_李维刚.pdfVIP

基于长度和位置信息的双语句子对齐方法_李维刚.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于长度和位置信息的双语句子对齐方法_李维刚.pdf

第 38卷  第 5 期 哈  尔  滨  工  业  大  学  学  报 Vol38 No5     2 0 0 6年 5 月 JOURNAL OF HARB IN IN ST ITU TE OF TECHNOLO GY M ay 2006        基于长度和位置信息的双语句子对齐方法 李维刚 , 刘  挺 , 张  宇 , 李  生 (哈尔滨工业大学 计算机科学与技术学院 , 黑龙江 哈尔滨 15000 1, Em ail: lee@ ir. h it. edu. cn) 摘  要 : 提出了一种利用句子长度和位置信息的双语句子对齐方法 ,该方法的根本思想是 :一定长度的句对 ( ) 在双语文本中的位置分布是相似的 ,利用 1 ∶1 型的句珠代替高频词作为候选锚点 ,使这种方法具有通用 性. 利用多种形式的测试数据进行的评价结果显示 ,这种方法有着 良好的健壮性和语言无关性 ,有效地解决 了双语真实文本的句子对齐问题. 关键词 : 句子对齐 ,双语语料库 ,锚点 ,长度和位置 中图分类号 : TP39 1 文献标识码 : A 文章编号 : 0367 - 6234 (2006) 05 - 0689 - 04 B ilingua l sen tence a lignm en t m ethod ba sed on sen tence length and loca tion inform a tion L IW eigang, L IU Ting, ZHAN G Yu , L I Sheng ( Schoo l of Compu ter Science and Technology, H arb in In stitute of Techno logy, H arb in 150001, Ch ina, Em ail: lee@ ir. h it. edu. cn) A b stract: Th is p ap er de scribe s a new m ethod for align ing real b ilingual texts u sing sen tence p airs’length and location inform ation. The model wa s motivated by the ob servation that the location of a sen tence p air w ith cer tain length is d istribu ted in the who le text sim ilarly. It u se s ( 1: 1) sen tence bead s in stead of h igh frequency word s a s the candidate anchors to m ake the m ethod general. The m ethod wa s develop ed and evaluated through m any d ifferen t te st data. The re su lts show that it can ach ieve good aligned p erform ance and be robu st and lan guage indep enden t. It can re so lve the alignm en t p rob le

文档评论(0)

lizhencai0920 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6100124015000001

1亿VIP精品文档

相关文档