- 16
- 0
- 约1.08万字
- 约 4页
- 2017-06-30 发布于北京
- 举报
现代汉语短语的机器识别.pdf
第2l卷 第l2期 重 庆 工 学 院 学报(自然科学) 2007年l2月
v01.2l No.12 Journal of Chong~ng Institute ofTechnology(Natural Science Edition) Dec.20Cr7
【计算机与信息技术】
现代汉语短语的机器识别
齐 波,王成良
(重庆大学软件学院,重庆 4OOO44)
Machine Recognition of Modern Chinese Phrases
QI Bo,WANG Chen—liang
(College of SoftwareEngineering,ChongqingUniversity,Chongq~ng400)44,China)
Abstract:This paper proposes an algorithm combining statistics with rules,called the priority merger algo—
rithm,which merges phrases by calculating the relationship of words,checks phrases by US g phrase rules
and a semantic dictionary in grammar and semantics,and recognizes Chinese phrases by the means of hier—
archic analysis.
Key words:natural language processing;semantic dictionary;phrase rules;priority merger
围绕短语的自动识别进行研究[¨,建立了一 短语规则表的建立就是为了解决这个问题.
种新形式的具有语义属性的词典,提取了汉语中 短语规则表的建立就是将常用短语的结构关
常用短语的搭配规则,并建立了词语的相关度模 系提取出来,并加工入库的一个过程.令短语P=
型,获得了较高的短语识别正确率. l+ 2,其中 l和 2为组成短语的词,得到的基
本规则如表l所示.
1 短语规则表 由于篇幅的限制,在词性规则中只列举了部
分具有代表性的词性,从句法上比较深刻地总结
在对短语进行机器识别的过程中,必须要有 了汉语短语的构成原理.根据表l,对下例进行分
一 个可以参考的模板,或者称之为短语匹配标准, 析.
· 收稿日期:2007—10—12
作者简介:齐波(198卜 ),男,硕士研究生,主要从事自然语言理解、搜索引擎研究;王成良(1964一),男,博士,教
授,主要从事自然语言理解、数据库与数据挖掘、企业信息化研究.
齐 波,等:现代汉语短语的机器识别 145
例1 P=认真/口 学习/ 该短语P的词性规则为 + ,查找短语规
该短语P的词性规则为o+ ,查找短语规则 则表,返回的却有3(述宾短语)和5(定中短语)2
表,只有6(状中短语)符合该短语的搭配,可以直 项结果,这样就在识别上产生了歧义.根据以上词
接得出该短语的类型为6,并在句中充当 . 条的基本结构,运用XML的形式分别表示“成本”
表
您可能关注的文档
- 环境组织建议只购买FSC产品作为原生纤维.pdf
- 环境艺术教育表现课程体系建构研究.pdf
- 环境艺术设计“课题制“教学模式实验.pdf
- 环境设计在边缘与交叉中发展.pdf
- 环境资源物权抵押问题探析.pdf
- 环境问题与综合命题.pdf
- 环氧功能化纳米二氧化硅反应性研究.pdf
- 环氧化酶-2及P-糖蛋白与胃癌关系的研究进展.pdf
- 环氧改性树脂体系浇铸体试验研究.pdf
- 环氧树脂钢铅钢粘接工艺优化程度评价方法.pdf
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
原创力文档

文档评论(0)