订票系统地自然语言接口.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
订票系统的自然语言接口 前言 超级计算机 “深蓝”战胜了国际象棋大师,让人们感到十分震动,这是否就 意味着 “电脑的智慧已经超越了人脑呢?”计算机的能力不能小觑,CPU的速度 如今已经以GHz作为单位,并且还在以摩尔所预言的速度飞快提升,加上人们为 它精心设计的众多软件,单以 “智慧”的一些衡量维度而言,比如记忆能力,反 应速度,识别能力等等,电脑确实己经超越了人脑,但是它至今仍然无法完全掌 握人类的语言!然而一个孩童却早在五岁,或者更早,就已经具备了这种能力。 人们举出了种种事实,对这个问题展开争论,然而答案也许并不那么重要。既然 计算机已经如此神奇,为何不让它进一步学习,来理解人类的语言,更好地为人 们服务呢!也许 “如何帮助计算机理解自然语言”才是一个更有意义的问Ro 其实,让人脑和电脑用自然语言实现交流,一直是一个美好的梦想。计算机 本质上只是一种通过执行人们给出的指令来解决问题的机器,目前的运行指令在 形式和内容上都不允许存在歧义,并且按照严格的结构进行组织。但是早在计算 机出现之前,人类已经有了自己的语言— 自然语言,自然语言中存在大量省略, 一语多指等机器指令所不能容忍的形式混乱,这使得人们无法用自己最自然的交 流手段使用计算机。然而人们对自己的语言又是如此依赖,以至于有时换一种交 流方式,人们就难以清楚地表达自己的思想,无法表达自己丰富的情感。实现了 用自然语言来和计算机对话,也许人与机器之间最后的障碍将被打破,计算机被 视为工业时代人类文明异化产物的历史也将终结。人们可以更自然,更安全地使 用计算机。语言学家和计算机科学家在自然语言理解这个学科的各个领域内已经 进行了庞杂的研究,大量的成果使得人类在实现梦想的道路上跨出了第一步。 本文的目的就是综合其中一些研究成果,按照 “原理一设计一实现”的步骤, 用一个统一的实例一一订票系统的自然语言接口N(AL不NAturalLanguage Ticketing),展示在一个局部应用中如何实现让计算机理解自然语言的一种可能 途径的具体步骤。这个接口,应该能够允许人们使用汉语向计算机系统进行订票。 在设计和实现的部分,一些独创的出于实践的选择和策略将被重点讨论。下面是 本文的组织。 第一章,语料调查。本章描述NALT应用的场景,介绍语料调查的方法和过 第 a页 订票系统的自然语言接口 程。 以下三个章节,分别实现NALT中的各个功能模块,每一章都会详细介绍处 理的过程,以及处理涉及的数据结构。 第二章,词法分析。本章实现NALT的自动分词和词性标注,将介绍词库的 设计,以及用于识别汉语数字的有限自动机。 第三章,句法分析。本章完成句子语法的检验,以及语法树的构造,将介绍 NALT应用的语法。虽然NALT的句法分析器采用了非回溯的算法,本章也会简单 介绍回溯的算法。 第四章,语义分析。本章将利用语法树,完成语义的合成。 第五章,应用的全景。本章将把NALT集成到基于WEB的订票应用,完成这 个实例。 第 5页 订票系统的自然语言接口 第一章 语料调查 任何一个自然语言处理的项目都是从语料调查开始的。人工语言,比如计算 机程序设计语言,可能有一本语言手册,手册中详细地定义了语言的词法、语法 和语义,处理这类语言只是纯粹的技术问题;自然语言与此不同,即使是最经典 的语言学著作也不可能完整地罗列语言中的每一个细节,对语料进行调查是处理 自然语言的第一步,细致的调查可以明确问题的难度。 本章将会介绍NALT应用的场景,NALT应用设计前收集语料的过程,以及NALT 应用的软件架构。 1.1应用的场景 计算机从命令行界面发展到图形界面,才真正踏上了它的普及之路。图形界 面很棒,轻按鼠标,阅读弹出窗口上的提示,选择 “确定”或者 “取消”,

文档评论(0)

cxmckate + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档