- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《自然语言交流的计算机模型》评介
《自然语言交流的计算机模型》评介-汉语言文学
《自然语言交流的计算机模型》评介
《自然语言交流的计算机模型—数据库语义学下的语言理解、推理和生成》(简称《自然语言交流的计算机模型》)的中译本于2016年3月在商务印书馆出版了。这是一本有独创性的计算语言学专著,我作为本书的审校者,希望通过对本书的简单评介,有助于国内读者理解这本专著的内容、方法和意义。
本书作者罗兰德·豪塞尔(Roland Hausser)是德国爱尔兰根——纽伦堡大学计算语言学教授。他先后出版了《表面组成语法》《自然人机交流》《计算语言学基础——人机自然语言交流》和《自然语言交流的计算机模型》等多部专著,发表文章近百篇。豪塞尔是“左结合语法”(Left-Associative grammar,简称LA)的创始人,后来他又进一步提出了“数据库语义学”(Database Semantics,简称DBS)和完整的“语表组合线性内部匹配”理论(Surface compositional Linear Internal Matching,简称SLIM),在计算语言学界形成了自己独特的风格。
我与豪塞尔教授曾有一面之交。2002年联合国教科文组织(UNESCO)韩国委员会在韩国首尔(Seoul)举行了一次关于“信息时代的语言问题”的学术研讨会,我和豪塞尔都被邀请参加了这次会议。在会议期间的交谈中,我对于豪塞尔的理论有了初步的了解,回国之后,我又细读了他的《计算语言学基础——人机自然语言交流》(英文版)一书,对于他的理论有了进一步的认识。我认为豪塞尔教授是一位具有独创精神的计算语言学家。
豪塞尔认为,面向未来的计算语言学的中心任务就是研究一种人类可以用自己的语言与计算机进行自由交流的认知机器。因此,自然语言的人机交流应当是计算语言学的中心任务。计算语言学研究应当通过对说话人的语言生成过程与听话人解释语言的过程进行建模,在适宜的计算机上复制信息的自然传递过程,从而构建一种可与人用自然语言自由交流的、自治的认知机器,这样的认知机器也就是机器人(robot)。为了实现这一目标,必须对自然语言交流机制的功能模型有深刻的理解。
豪塞尔提出的“语表组合线性内部匹配”(SLIM)理论以人作为人机交流的主体,而不是以语言符号为主体,突出了人在人机交流中的主导作用。SLIM理论要求通过完全显化的机械步骤,使用逻辑和电子的方式来解释自然语言理解和自然语言生成的过程。因此,SLIM理论与现代语言学中的结构主义、行为主义、言语行为等理论是不同的,具有明显的创新特色。
SLIM理论强调“表层成分”(Surface),以语表组合性作为它的方法论原则;SLIM理论强调“线性”(Linear),以时间线性作为它的实证原则;SLIM理论强调语言的“内部因素”(Internal),以语言的内部因素作为它的本体论原则;SLIM理论强调“匹配”(Matching),以语言和语境信息之间的匹配作为它的功能原则。事实上,SLIM这个名字本身就来自于这四项原则的英文名称的首字母缩写。
SLIM理论的技术实现手段叫作“数据库语义学”(DBS)。DBS是把自然语言的理解和生成重新建构为“角色转换”(turn-taking)的规则体系。“角色转换”指的是从“说话人模式”(speaker mode)向“听话人模式”(hearer mode)的转换,或者从“听话人模式”向“说话人模式”的转换。
在自然语言的实际交流过程中,第1个过程是听话人模式中的自然主体从另一个主体或者语境那里获得信息,第2个过程是自然主体在自己的认知当中分析信息,第3个过程是自然主体思考如何作出反应,第4个过程是自然主体用语言或者行动做出反馈。
DBS的输入与第1个过程相似,要求计算机或者机器人具备外部界面。接下来匹配语境和认知的内容,采用左结合语法(LA)来模拟第2个过程,这个左结合语法是处于听话人模式中的,叫作LA-hear。左结合语法的第二个变体负责在内存词库中搜索合适的内容,叫作LA-think,这一部分操作对应于第3个过程。左结合语法的第三个变体的任务是语言生成,叫作LA-speak,模拟第4个过程。如下图所示:
在这个图中,听话人模式的LA-hear模拟第2个过程,说话人模式的LA-think模拟第3个过程,LA-speak模拟第4个过程。
DBS的分析结果用DBS图(DBS graph)来表示。DBS图是一种树结构,但是,DBS图的树结构与短语结构语法(phrase structure grammar)和依存语法(dependency grammar)的树结构有所不同。
数据库语义学(DBS)有两个基础:一个是左结合语法(LA-grammar),一个是单词数据库(word bank)。左结
文档评论(0)