自然语言合理句子的生成系统.docVIP

  • 0
  • 0
  • 约2.1万字
  • 约 14页
  • 2026-02-27 发布于江苏
  • 举报

《计算机学报》2010年第3期,2010,33(3)

PAGE5

自然语言合理句子的生成系统

胡玥1,2,高小宇2,1,李莉1,高庆狮1,2

1北京科技大学信息工程学院北京100083

2中国科学院计算技术研究所北京100080

huhuyue_001@

摘要

基于自然语言语法规则由Chomsky的上下文无关文法所生成的句子是合法,适合语法规则,但是不一定合理。本文提出的新生成系统所生成的句子是合法又合理。其特点是基于语言单元理论的和具有数以百万计生成规则的而不是数千个,和使用Chomsky的短语文法而不是上下文无关文法。也就是,比较精确描述自然语言的文法必须是短语文法,及基于语义单元理论百万计的生成式集。“合理”的关键是基于语义单元理论,引入了“类型参量”。类型参量不仅出现在语义单元集B-RISU中,而且还出现在类型-树C-treeI上,

关键词:多自然语言,生成系统,语义单元,语义语言,多语言机器翻译

AGeneratingSystemtoGenerateLegitimateandReasonableSentences?

?本研究工作得到863计划(No.2006AA01Z140和No.2006AA010101)的资助,和国家自然科学基金(No.GJZRJJ的资助。

HuYue1,21,2,GaoXiaoyu2,1,LiLi1,GaoQingshi

1SchoolofInformationEngineering,UniversityofScienceTechnologyBeijing,Beijing,100083

2InstituteofComputingTechnology,theChineseAcademyofSciences,Beijing,100080

Abstract

ThesentencesproducedbyChomskysContext-freeGrammararelegitimate,conformwithsyntaxrules,butnotreasonable.Thesentencesproducedbynewgeneratingsystemarelegitimateandreasonable.Itsfeatureisthat,basedonsemanticunittheoryandthatthenumberofruleisseveralmillions,ratherthanseveralthousands,andbyPhrase-structureGrammarratherthanbyContext-freeGrammar,i.e.ThegrammartodescribemoreexactlynaturallanguagemustbePhrase-structureGrammar,anditsproductionsarebasedonsemanticunitstheory.Thekeyofreasonablenessisbasedonsemantic-unitstheory,tointroducethecategory-parametersystem,whichisinthesetB-RISU,inthesetC-treeI,andinthesetFI.ChomskysPhrase-structureGrammar

Keyword:multiplenaturallanguages,generatingsystem,semanticunit,semanticlanguage,multiplelanguagesmachinetranslation

1引言

N.Chomsky形式文法理论

N.Chomsky[1]在1956年提出形式文法理论,理想的形式化的描述工具之一。不仅对语言学,而且对整个计算机科学做出了很重要的贡献。

但是,基于语法的Chomsky文法生成的句子可以是合法的但不一定是合理的。由于生成规则只反映语法规则,不能有效反映语义,要生成既合法又合理的句子就成为不可能的。

J.J.Katz的语义标式(semanticsmarker)

J.J.Katz的语义标式[2]相当于语素分析表达式,是建立在词-词组-句,词的义素(se

文档评论(0)

1亿VIP精品文档

相关文档