- 39
- 0
- 约2.18万字
- 约 11页
- 2017-07-24 发布于江苏
- 举报
引入标点处理的层次化汉语长句句法分析方法
中 文 信 息 学 报
第20卷 第4期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol.20 No.4
文章编号:1003-0077(2006)04-008-08
12
引入标点处理的层次化汉语长句句法分析方法
李幸 宗成庆
(中国科学院自动化研究所 模式识别国家重点实验室,北京 100080)
摘要: 在分析汉语标点符号用法和句法功能的基础上,本文提出了一种新的面向汉语长
句的层次化句法分析方法。这种方法和传统的不考虑标点符号的一遍分析方法的主要区别在
于两个方面:第一,利用部分标点符号的特殊功能将复杂长句分割成子句序列,从而把整句
的句法分析分成两级来进行。这种“分而治之”的策略大大降低了在传统的一遍分析方法中
同时识别子句或短语之间的句法关系以及子句和短语内部成分的句法关系的困难。第二,从
大规模树库中提取包含所有标点符号的语法规则和相应概率分布
原创力文档

文档评论(0)