现代汉语短语的机器识别.pdfVIP

  • 16
  • 0
  • 约1.08万字
  • 约 4页
  • 2017-06-30 发布于北京
  • 举报
现代汉语短语的机器识别.pdf

第2l卷 第l2期 重 庆 工 学 院 学报(自然科学) 2007年l2月 v01.2l No.12 Journal of Chong~ng Institute ofTechnology(Natural Science Edition) Dec.20Cr7 【计算机与信息技术】 现代汉语短语的机器识别 齐 波,王成良 (重庆大学软件学院,重庆 4OOO44) Machine Recognition of Modern Chinese Phrases QI Bo,WANG Chen—liang (College of SoftwareEngineering,ChongqingUniversity,Chongq~ng400)44,China) Abstract:This paper proposes an algorithm combining statistics with rules,called the priority merger algo— rithm,which merges phrases by calculating the relationship of words,checks phrases by US g phrase rules and a semantic dictionary in grammar and semantics,and recognizes Chinese phrases by the means of hier— archic analysis. Key words:natural language processing;semantic dictionary;phrase rules;priority merger 围绕短语的自动识别进行研究[¨,建立了一 短语规则表的建立就是为了解决这个问题. 种新形式的具有语义属性的词典,提取了汉语中 短语规则表的建立就是将常用短语的结构关 常用短语的搭配规则,并建立了词语的相关度模 系提取出来,并加工入库的一个过程.令短语P= 型,获得了较高的短语识别正确率. l+ 2,其中 l和 2为组成短语的词,得到的基 本规则如表l所示. 1 短语规则表 由于篇幅的限制,在词性规则中只列举了部 分具有代表性的词性,从句法上比较深刻地总结 在对短语进行机器识别的过程中,必须要有 了汉语短语的构成原理.根据表l,对下例进行分 一 个可以参考的模板,或者称之为短语匹配标准, 析. · 收稿日期:2007—10—12 作者简介:齐波(198卜 ),男,硕士研究生,主要从事自然语言理解、搜索引擎研究;王成良(1964一),男,博士,教 授,主要从事自然语言理解、数据库与数据挖掘、企业信息化研究. 齐 波,等:现代汉语短语的机器识别 145 例1 P=认真/口 学习/ 该短语P的词性规则为 + ,查找短语规 该短语P的词性规则为o+ ,查找短语规则 则表,返回的却有3(述宾短语)和5(定中短语)2 表,只有6(状中短语)符合该短语的搭配,可以直 项结果,这样就在识别上产生了歧义.根据以上词 接得出该短语的类型为6,并在句中充当 . 条的基本结构,运用XML的形式分别表示“成本” 表

文档评论(0)

1亿VIP精品文档

相关文档