基于统计的语言处理模型的局限性 - 北京大学中国语言学研究中心.pdf

基于统计的语言处理模型的局限性 - 北京大学中国语言学研究中心.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于统计的语言处理模型的局限性 - 北京大学中国语言学研究中心

2004 5 May, 2004 2 Applied Linguistics No12 * 袁毓林 ( 北京大学中文系 北京 100871) [ ] 本文通过介绍和评论基于统计的语言处理模型的工作原理和有关的 用 实例, 从语言学理论的角度来说明统计模型的局限性通过讨论N 元语法模型及其 在词类标注上的 用, 展示基于统计的语言处理模型的工作原理及其 用讨论了 语言结构的递归性特点和语言学知识的结构依赖性特点, 指出递归嵌入会使得统计 规律被任意数目的嵌入词语打乱, 语言学知识的结构依赖性将使得统计模型赖以实 现的独立性假设失效 [ ] 统计模型; 有限状态语法; 马尔科夫过程; 递归性; 结构依赖性 [ ] H08[ ]A [ ] 1003-5397( 2004) 02-0099-10 The Limitations of the Statistically-based NLP Models Yuan Yulin Abstract: This pape demonst ates the limitat ions of the statist ically-based natu al lan- guage p ocessing (NLP) models in the pe spective of linguist ic theo y by int oducing and com- menting the mechanism of the statist ical language models ( SLM) and thei applying cases . Fi stly, it int oduces the studies of the statist ical st uctu e of language unde the influence of info mation theo y, especially Chomsky. s demonst ation that finite state g amma ( FSG) based on Ma kov p ocess is not suited to desc iption of natu al language. Then, it eveals mechanism and possible applying fields of SLM by discussing N-g amm and its applying in pa ts-o-f speech tagging. It discusses the ecu sion p ope ty of linguistic st uctu e and the st uctu e-dependent p ope ty of linguist ic knowledge, and a gues that ecu sive nested const uctions would upset the statistic egula ity and the st uctu e-dependent p ope ty of linguistic knowledge would make the [ ] 2003- 06- 20 [ ] , , , * / 0 , / 0 ( 01JB740006) , 2004 2 # 100 # independence assumption, whe eby SLM can be ealized, l

您可能关注的文档

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档