多策略融合的搭配抽取方法.PDF

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多策略融合的搭配抽取方法

清华大学学报 自然科学版 年 第 卷 第 期 !# $%%%%%’( - .*%% ( ( (%,(% )# $$***+,# - .=*%%= B(= B( C%C$* /012345678329 :2; 0:5 ?@A #@ 多策略融合的搭配抽取方法 王大亮$= 涂序彦$= 郑雪峰$= 佟子健* 北京科技大学 信息工程学院 北京 搜狐研发中心 北京 -$B = $%%%+D*B = $%%%(. 摘 要 以往的词汇搭配抽取统计评价方法具有大致相同 界定为 体现词项在某种显著的临近范围内组合关 E E 的效果 它们各有优劣 可以实现优势互补 该文提出多策略 $= ! ! 系的线性共现与期待 I可见搭配的含义不能由它 融合的搭配抽取方法 首先 将互信息法用于衡量二元独立 ! 的各个组成部分简单组合得到 不能随意地更改和 = 性 $ 淘汰候选的无关二元组 其次 对比 检验法与 检验 ! ! # % 替换搭配中的组成部分I $ 法 发现使用 检验法能够更合理地反映搭配组合的同现 ! # 因此 基于语料库自动实现搭配抽取的方法不 = 性和期待性 然后 使用对数似然比检验法 解决其他方法 ! ! 能完全依靠句法和语法规则来解决 必须要借助统 = 无法克服的稀疏数据问题 此外 加入构词法的启发式规 ! 计分析的方法I 就是运用统计方法自动获取 107:1 则 最终形成一个多策略融合的方法 实验结果表明该方法 ! 搭配的经典系统*= 之后 不断出现各种搭配抽取统 的准确率较高 在实际应用中取得良好效果 I = ! 计方法 例如 词频法 方差法 互信息法 检验法 = = ? ? ? ?

文档评论(0)

l215322 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档