摘 要:本文利用隐马尔可夫模型( Hidden Markov Model,简称.pdfVIP

摘 要:本文利用隐马尔可夫模型( Hidden Markov Model,简称.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要:本文利用隐马尔可夫模型( Hidden Markov Model,简称

* 基于隐马尔可夫模型和候选排序的汉语基本名词短语识别 马艳军 刘 颖 清华大学中文系计算语言学研究室 北京 100084 E-mail: yj-ma03@mails.tsinghua.edu.cn yingliu@mail.tsinghua.edu.cn 摘 要:本文利用隐马尔可夫模型(Hidden Markov Model ,简称 HMM ),并利用 A*启发式搜索算法得出 N-Best 最优路径作为汉语基本名词短语标注的候选集。利用边界匹配和基本名词短语模板对候选集进行过滤,并利 用基本名词短语模板的可信度信息对候选集进行重新排序,取得了不错的标注效果。本文的实验模型有较强 的鲁棒性和可扩展性,能够通过不断添加不同领域的知识来提高性能。 关键词:汉语基本名词短语,隐马尔可夫模型,基本名词短语模板,短语模板的可信度,过滤规则 Base Noun Phrase Identification Based on HMM and Candidates Sorting by Weighted Templates Ma Yanjun Liu Ying Computational Linguistics Laboratory, Department of Chinese Language and Literature, Tsinghua University, Beijing, 100084 E-mail: yj-ma03@mails.tsinghua.edu.cn yingliu@mail.tsinghua.edu.cn Abstract: This paper uses HMM approach and heuristic decoder to get candidates of Chinese base noun phrase tagging. We filter the noisy candidates by applying boundary match rule and phrase template match rule. Furthermore, the candidates are sorted according to the reliability of the base noun phrase templates they matched. This is a robust model. The performance is expected to be further improved by adding new features. Key words: Chinese base noun phrase; HMM; base noun phrase template; the reliability of phrase template; filter rules 1 引言 基本名词短语是自然语言的重要结构单位,也是信息传递的基本单位。在自然语言处理 领域,基本名词短语的识别和分析是自然语言浅层句法分析的重要任务之一,其分析结果可 以简化句子的结构,从而降低句法分析的复杂度;同时,基本名词短语的识别对于信息检索、 * 清华大学亚洲研究中心 2005 年度青年项目。 自动问答和机器翻译等都有重要的意义。 自然语言学习国际会议(CoNLL-2000 )提出了语块共享任务,定义了英语中 11 种基本 语块:NP ,VP ,ADJP ,ADVP ,PP ,SBAR,CONJP,PRT ,INTJ ,LST ,UCP[4] 。语块的特 点是语块之间不相交而且无嵌套[1],即句子中

文档评论(0)

jyf123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6153235235000003

1亿VIP精品文档

相关文档