基于相对条件熵的搭配抽取方法.PDF

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于相对条件熵的搭配抽取方法.PDF

2007 年 12 月 北 京 邮 电 大 学 学 报 Dec. 2007 第 30 卷 第 6 期 Journal of Beijin g University of Posts and Telecommunications Vol. 30 No. 6 ( ) 文章编号 2007    基于相对条件熵的搭配抽取方法 1 1 1 1 2 王大亮 ,  张德政 ,  涂序彦 ,  郑雪峰 ,  佟子健 ( 1 北京科技大学 信息工程学院 , 北京 100083 ; 2 搜狐公司 研发中心 , 北京 100084) 摘要 : 针对以往研究将搭配视为词项的简单并置 ,而没有考虑词项间的倾向性问题 ,提出了一个基于相对条件熵的 搭配倾向统计模型 ,衡量中心词对上下文同现词的依赖程度. 此外 ,加入语言学启发式规则 ,利用词性过滤器和滑 动窗口的方法识别搭配边界 ,最终形成了在开放语料库环境下的搭配抽取方法. 该方法具有很强的解释性 ,有效地 揭示了搭配构成的内在机理. 经过证明 ,搭配倾向强度可以解释为由方向修正的互信息. 关  键  词 : 自然语言处理 ; 搭配抽取 ; 相对熵 ; 搭配倾向性 中图分类号 : TP391     文献标识码 : A Collocation Extraction Based on Relative Conditional Entropy 1 1 1 1 2 WAN G Daliang ,  ZHAN G Dezheng ,  TU Xuyan ,  ZHEN G Xuefeng ,  TON G Zijian ( 1. School of Information Engineering , University of Science and Technology , Beijin g 100083 , China ; 2. Department of Research and Development , Sohu. com Inc , Beijin g 100084 , China) Abstract : Current researches on collocation extraction consider that lexical combination is simply to put terms together , but ignores the collocation preference. To solve the problem , the collocation pre ference statistic model based on relative conditional entrop y is brought up to measure the dependence between headword and cooccurrence words in context . Then the linguistic heuristic rule is integrated to identify the border of collections , by partofspeech filter a

文档评论(0)

tangtianbao1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档