对称与非对称中文词义消歧中局部上下文窗口问题研究.pdfVIP

  • 5
  • 0
  • 约2.89万字
  • 约 6页
  • 2016-03-28 发布于河北
  • 举报

对称与非对称中文词义消歧中局部上下文窗口问题研究.pdf

对称与非对称中文词义消歧中局部上下文窗口问题研究.pdf

情 报 学报 !# $%%% %$’( ,-./#01 -2 345 64!#0 -6!537 2-/ 6!5#3!2!6 0#8 3564#!601 !#2-/903!-# !# $%%% %$’( 第 卷第 期 , 年 月 , )* ) )(+ )(* )%$% + :; =)* #; =) )(+ )(* 0?@ )%$% !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! : O;@ $% = ’NN)PQ = @FFM = $%%%C%$’( =)%$% =%) =%%* 对称与非对称:中文词义消歧中局部上下文窗口问题研究$) $ $ ) 李 纲 寇广增 夏晨曦 ( 武汉大学信息管理学院,武汉 ; 北京市科学技术情报研究所,北京 ) $= +’%%N) ) = $%%%+A 摘要 词义消歧是一个分类过程,局部上下文是主要的分类特征。对称窗口指上下文边界与歧义词的左右距 离相等,大部分消歧系统凭经验将其作为最优的局部上下文窗口,很少选择非对称窗口。对称窗口是否优于非对 称窗口?本文以RMFRSEC’ 中文数据集为例对这一问题展开研究。首先,对训练集采用交叉验证法确定最优窗口, 它是非对称的。并采用此非对称窗口与多组经典的对称窗口进行了对比消歧测试,结果表明非对称窗口的表现优 于对称窗口。进一步在独立采用词或词性作为特征的情况下进行交叉验证评估,发现趋于对称的窗口总体上表现 是优秀的。在不进行辅助计算的情况下,可以选择对称窗口作为局部上下文窗口,但它并不是最优的。 关键词 词义消歧 中文 局部上下文 上下文窗口 : !##$%’( )*+ ,-##$%’( ./()0 1/*%$2% 3’*+/4 ’* 15’*$-$ 3/+ !$*-$ 6’-)#7’89)%’/* $ $ ) , 1@ TEMU V;I TIEMUWRMU EMO X@E 6HRMY@ ( , , ; , ) $= !#$$% $ ’( $)*+,-$( .+(+/0*0(, 12#+( 3(-40)5-,6 12#+( +’%%N) ) = 70-8 -(/ ’(5,-,2,0 $ !-0(0 +(9 :0#($%$/6 ’( $)*+,-$( 70-8 -(/ $%%%+A ,7-%)(% ( ) , Z;?O RMFR 8@FED[@UIE\@;M Z8 @F E \EF] ;^ LEFF@^@LE\@;M GH

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档