- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 48 卷第 5 期 华中师范大学学报(自然科学版) Vo l. 48 No.5
2014 年 10 月 ]OURNAL OF HUAZHONG NORMAL UNIVERSITY(Nat. Sci.) Oct. 2014
文章编号: 1000-1190(2014)05-0643-07
复句关系词自动识别中规则解析的包含匹配算法研究
胡金柱I\ 胡 泉2 ,舒江波3
(1.华中师范大学计算机学院,武汉 430079;
2. 华中师范大学物理科学与技术学院,武汉 430079;
3. 华中师范大学国家数字化学习工程技术研究中心,武汉 430079)
摘 要:规则解析器作为现代汉语复句关系词自动识别系统中的一个重要的功能模块,其主要功
能是先利用复句准关系词去匹配规则库中的规则,然后对匹配成功的规则进行解析,最后调用该
规则并提取规则的结论对复句关系词进行识别.因此规则的成功匹配是能够进行规则解析的首要
条件.但是,在对规则库中的句式规则表和连用句式规则表进行匹配解析时,由于复句准关系词的
多样性和重复性,造成了匹配的复杂性,使得无法利用传统的匹配算法去匹配规则.因此,该文研
究了一种包含匹配算法,该算法是先用一个二维数组将复句准关系词序列在复句中的下标依次
存储,然后在该二维数组中寻找可能匹配的子串序列.该算法的最大优点是既不需要实现完全匹
配和回溯,还可以包含模式串的所有子串,能够得到所有的目标子串,实验结果表明,该算法在排
除规则的不完备性和分词的错误之后,正确率可以达到 100%.
关键词:复句关系词;自动识别;规则解析器;包含匹配算法
中图分类号: TP391
文献标识码:A
复句关系词(又称关联词或关系标记)是复句
在一条复句中是否为真正的关系词.在该系统中,
在语表形式上的标记,是复句中标示关系的一个重
一个重要的功能模块是规则解析器,其基本功能
要构件,是汉语语法、语义研究中的重要内容,人们
是对规则库中的规则进行解析调用.在规则解析器
对于复句的理解,往往通过抓住标记来实现[l] ,
对规则进行解析之前,需要先根据复句中的准关系
所以复句关系词的计算机自动识别成为研究复句
词找到目标规则,比较有效的方法是用复句中的准
自动识别的关键问.
关系词与规则的关键字进行匹配查找,这就是所谓
的字符串匹配问题[叫.目前国内外比较流行的
但是,由于复句中的准关系词因其所处的位置
或所起的作用不同,有时充当关系词,有时又不充
字符串匹配算法主要有单模式匹配算法和多模式
当关系词,所以复句关系词的计算机自动识别是一
匹配算法.具有代表性的有 KMP 算法.BM 算法、
大难题.例如z AC 算法、有限自动机算法等[3.6J
例 1 圣宣圭刮风下雨,还是下雪结冰,他都不
单模式字符串匹配算法主要有 1977 年
改自定的时间表,提前半小时赶到工地.
Knu
文档评论(0)