- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
引入标点处理的层次化汉语长句句法分析方法
中 文 信 息 学 报
第20卷 第4期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol.20 No.4
文章编号:1003-0077(2006)04-008-08
12
引入标点处理的层次化汉语长句句法分析方法
李幸 宗成庆
(中国科学院自动化研究所 模式识别国家重点实验室,北京 100080)
摘要: 在分析汉语标点符号用法和句法功能的基础上,本文提出了一种新的面向汉语长
句的层次化句法分析方法。这种方法和传统的不考虑标点符号的一遍分析方法的主要区别在
于两个方面:第一,利用部分标点符号的特殊功能将复杂长句分割成子句序列,从而把整句
的句法分析分成两级来进行。这种“分而治之”的策略大大降低了在传统的一遍分析方法中
同时识别子句或短语之间的句法关系以及子句和短语内部成分的句法关系的困难。第二,从
大规模树库中提取包含所有标点符号的语法规则和相应概率分布信息,有利于句法分析和歧
义消解。实验证明我们的方法与传统的一遍图表(chart)分析方法相比,能够大大减少时间
消耗和歧义边的个数,并且提高了复杂长句分析的正确率和召回率约7%。
关键词: 人工智能;自然语言处理;句法分析;标点符号;层次化分析方法
中文分类号:TP391 文献标识码:A
A Hierarchical Parsing Approach with Punctuation
Processing for Long Chinese Sentences
Xing Li and Chengqing Zong
(National Laboratory of Pattern Recognition, Institute of Automation,
Chinese Academy of Sciences, Beijing 100080, China)
Abstract: Based on the analysis of the usage and the syntactic function of Chinese punctuations,
this paper proposes a new hierarchical approach to parsing the long Chinese sentences. In
traditional parsing approaches, the parsing procedure is performed on one-level and the
punctuation marks are not specially treated. Correspondingly, in our approach the complex long
Chinese sentences are broken into sub-sentences or units (say ‘units’ hereafter) by using of the
punctuation marks with special functions, so that the original whole sentence is parsed unit by unit.
This idea of ‘dividing-and-ruling’ greatly reduces the difficulty in the traditional parsing
approaches to recognize the syntactic relationship between the sub-sentences and phrases or inside
the sub-sentences or phrases. And also, in our approach the grammatical
您可能关注的文档
- 山亭区水泉镇南蒋村土地整理项目变更公告.PDF
- 山杨氏保胎汤联合黄体酮治疗早期先兆流产20例.PDF
- 山药种质资源核糖体rDNA-ITS区序列分析.PDF
- 山净烟供简体版.pdf
- 岭南文化 蔡李佛拳.ppt
- 峭壁上挖到500年野生何首乌举世罕见.PDF
- 峭壁边缘.PDF
- 峭壁之上.PDF
- 工业型煤燃烧固硫的研究进展.pdf
- 工业无线传感云中面向移动机器人的自适应信任演化机制.PDF
- DB23_T 3866-2024冰上龙舟赛事组织服务规范.docx
- DB32 2163-2012 棉纱单位可比综合电耗限额及计算方法.docx
- DB32∕T 2429-2013 棉花田间生长发育观察记载规范.docx
- DB23_T 3820-2024 工业互联网综合平台数据质量管理规范.docx
- DB23_T 3474-2023非煤智慧矿山信息系统技术规范.docx
- DB3201_T 1106-2022 工程地质层划分技术规范.docx
- DB33T 2515-2022公共机构“零碳”管理与评价规范.docx
- DB3301_T 0415-2023 装修垃圾收运处置管理规范.docx
- DB3311/T 106―2019“丽水山居”民宿服务要求与评价规范.docx
- DB3201T 1127-2022 慈善捐赠受赠管理规范.docx
最近下载
- 金蝶云苍穹考试认证理论考题汇总(精华版).pdf VIP
- 钢梯设计图集15J401.pdf VIP
- 在项目规划评审会上的致辞发言3.docx
- 建筑工程图集 G410-1~2:1.5m×6.0m预应力混凝土屋面板(2004年合订本).pdf VIP
- 《康复评定技术》课件——第十七章 常见神经疾病的评定技术.ppt VIP
- 山东省水产品出口贸易现状、问题及对策分析.docx VIP
- 2025年上海黄浦区中考模拟语文试卷(含答案) .pdf VIP
- 《综合与实践:白昼时长规律的探究》教案.docx VIP
- 2025年妇产科护理技术规范.pdf VIP
- 施工现场高温季节安全防护与防暑管理培训.pptx VIP
文档评论(0)