- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算语言学和自然语言信息处理研究和应用综述
目录
一 概述
二 语言信息处理的基础研究
2.1 面向信息处理应用的语言研究
2.2 关于语言资源建设的专题研究
2.2.1 语料的标注
2.2.2 语料的分析和处理
2.2.3 用于语言资源建设的字表、词表和标准、规范。
2.3 研究中的理性主义和经验主义方法
三 应用性的研究和实用系统的研制
3.1 机器翻译
3.1.1 基于规则的方法和基于语料库的方法
3.1.2 机器翻译中的专题研究
3.1.3 应用型机器翻译系统的研制
3.2 文本信息处理
四 语言资源的建设
4.1 语料库
4.2 语言知识库
4.3 基于语料库的语言分析方法
五 主要学术会议和期刊、论著
六 参考文献
计算语言学和自然语言信息处理研究和应用综述
一、Language Understanding)和自动生成(Language Generation)。前者从句子表层的词语符号串识别句子的句法结构,判断成分之间的语义关系,最终弄清句子表达的意思;后者从要表达的意思出发选择词语,根据词语间的语义关系构造各个成分之间的语义结构和句法结构,最终造出符合语法和逻辑的句子。
计算语言学的研究也像其他学科一样,有科学研究与技术研究两个层次。科学研究的目的是发现语言的内在规律、探索语言理解和生成的计算方法、建设语言信息处理的基础资源;而技术研究则借助应用目标来驱动,根据社会的实际需要,设计和开发实用的语言信息处理系统。
自然语言信息处理的应用目标是使人与计算机之间用自然语言进行交流。具体说,是建立各种处理自然语言的计算机应用软件系统,譬如:机器翻译、自然语言理解、语音自动识别与合成、文字自动识别、计算机辅助教学、信息检索、文本自动分类、自动文摘,还有文本中的信息提取、互联网上的智能搜索,以及各种电子词典和术语数据库。
随着互联网的广泛普及,语言信息处理的社会需求越来越大,人们迫切需要用自动化的手段处理海量的语言信息。然而,由于学科理论发展的局限和汉语本身的复杂性,目前我国计算语言学理论和方法的研究还不能为开发汉语信息处理应用系统提供足够的支持。多年来国内计算语言学和自然语言处理学科发展的特点之一是,应用型研究和实用系统开发的目标比较明确,投入相对较多,也取得了一些成果;而基础理论和方法的研究则相对薄弱。1998年-2002年期间的研究情况和发展态势依然如此。在本文上述的各种应用目标中,研究力量比较集中的项目有:文本信息检索、文献自动分类、自动文摘、语音自动识别与合成、机器翻译,还有文本信息提取和过滤。另外,语言资源的建设和基于语料库的语言分析方法也受到了格外关注,取得了比较快的进展。下面先简要叙述计算语言学和语言信息处理领域有代表性的基础研究,再介绍面向应用的研究和实用系统的研制,然后谈谈语言资源的建设,最后介绍有关的学术会议和期刊、论著。这些工作都以书面语为研究对象,针对口语的研究将作为语音识别与合成专题另文介绍。
二 语言信息处理的基础研究
作为《中国语言学年鉴》当中一个分支学科的内容,这里主要叙述的是语言信息处理领域里与语言研究直接有关的专题,或者叫作面向信息处理应用的语言研究。不包括语言计算处理方法的研究和以技术为主的工作,例如统计意义下的建模方法、机器学习的算法、文字识别与汉字输入技术,等等。
2.1 面向信息处理应用的语言研究
在计算语言学和语言信息处理学界,关于语言问题的研究往往有自上而下和自下而上两种动机。前者关心如何用语言学的理论解释某种语言(比如汉语)的现象,后者注重解决语言工程和应用实践中提出的实际问题。
自上而下的典型代表是在形式语义学的理论框架下研究汉语的语义问题,也叫做逻辑语义方法[8][12]。这种方法用内涵逻辑语义模型来分析汉语词语的构造、解释汉语词语的意义。其中的基本问题是,用形式化的方式描述词语、词语所表示的概念、词语指称的实体以及三者之间的关联关系,然后应用模型论方法对汉语语句的结构形式进行语义解释。这种观点是我国的计算机科学家借鉴国外对印欧语言的研究成果,结合汉语的实际提出来的,在词语的语义理解、歧义解读、短语构造等方面,都有个案分析的尝试。然而要想在汉语理解研究中得到系统性的结果,这种方法还有许多困难,其中之一是,它要求结构形式上的复合运算与语义上的组合运算具有同构关系,因此需要先定义一个形式化的汉语语法,才能对应地定义语义模型和语义计算规则,而目前我们还没有办法找到这样的汉语语法理论。
对于句法分析和语义分析的先后关系,《语义指向的形式模型研究》[8]则持另外一种观点,认为在很多情况下,语义分析不一定必须经过句法分析。这篇文章根据Frege的组合性原则,提出了一个形式模型,描述词或词组的语义与其所处语境的语义之间的制约关系,把语义指向定义
您可能关注的文档
最近下载
- 大学生国情社会调查报告.docx VIP
- 2025中国移动通信集团重庆有限公司社会招聘笔试备考题库及答案解析.docx VIP
- 山东科学技术版劳动实践指导手册一年级第2课清洁与卫生干干净净真舒服刷牙 教案.pdf VIP
- 人教版劳动一年级上册项目一《洗手》(教案).docx VIP
- 《南京照相馆》电影介绍ppt课件(优质ppt).pptx VIP
- 病人发生滑倒.pptx VIP
- 部编版语文三年级上册习作:写日记练习卷.doc VIP
- 部编版语文三年级上册第二单元 习作:写日记练习卷.doc VIP
- 2025广东东莞农村商业银行校园招聘笔试历年典型考题及考点剖析附带答案详解.docx
- 山东学前教育管理信息系统登录[学习].pdf VIP
文档评论(0)