- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
论语言科学与语言技术推荐
论语言科学与语言技术
论语言科学与语言技术
论语言科学与语言技术一、“语言科技”新思维的提出 虽然计算机设计的初衷是缘于数值计算,但是英国数学家图灵(a..turing)在《机器能思维吗?》(19)一文中已经预见到计算机和自然语言将结下不解之缘,并且提出检验计算机智能的最好方法就是对语言信息的处理能力。1977年,费根鲍姆(feigeau)提出知识工程,计算机信息处理出现了从“数据世界”向“知识世界”的转移趋势。知识世界的载体是语言符号系统,语言信息处理的需求促使语言研究过程和语言研究成果的技术化趋势日益明显,当代语言学已凸显出“语言科学”与“语言技术”的二分互补格局,由此我在《南京师范大学语言科技系建设发展规划》(01年2月)中提出“语言科技”的新思维。“语言科学”主要指基础性的描写语言学和理论语言学。“语言技术”主要指面向信息处理的应用语言学或计算语言学,其研究任务可划分为“文本处理技术”和“语言模拟技术”。简而言之,语言文本处理技术是通过编辑和编程,将印刷文本转化为可供计算机使用的电子文本的技术。语言系统模拟(siulatin)或者语言能力仿真(eulatin)技术是通过算法和编程,将自然语言的理解和生成能力输入计算机的技术。获得语言能力的计算机可以实现“人—机对话”而成为名实相符的“电脑”。为研制智能机服务的“语言系统模拟”,可比喻为“语言基因图谱分析工程”和“语言能力移植工程”。强调语言研究的技术化,并非忽视传统语言学研究存在技术性的一面,例如实验语音学和方言语音调查等。之所以以往未能突出语言研究的技术化,其原因在于——除语音研究可借助声学技术设备以外——语言研究的绝大多数领域还一直没有相应的实验性技术设备。 虽然当代语言学家不可能也不必要都转向计算语言学研究,但具有一定的语言信息处理意识却非常必要。早在1964年11月,美国科学院语言自动处理咨询委员会就在《语言与机器》的报告中明确指出:机器翻译遇到了难以克服的seantibarrier(义障)。然而这一警告,除了致使机器翻译研究热的暂时消退以外,并没有引起语言学界的足够重视。1982年,日本制订了一个为期10年面向ai(人工智能)的“第五代计算机”即智能机的研制计划,其中包括自然语言处理装置。1992年结束时,只部分达到了预定目标。随后又公布了另一个为期10年的“真实世界计算机(r)计划”即“新信息处理技术计划”。(许万增1996,p.61-62)据说,90年代后期日本不得不宣布暂停研制,其根本原因就在于未能穿过语言研究的“瓶颈”。自然语言处理装置的任务无法实现,计算机谈何“真实世界”或“人工智能”。时至今日,这一“义障”仍然没有跨越。在《新世纪将对人类产生重大影响的十大科技趋势》(新华社北京00年12月30日电)的报道中,列出21世纪的“认知神经科学领域”和“信息技术领域”,并分别提出来“探索意识、思维活动的本质”和“计算机向智能化方向发展”的任务,然而没有语言科技领域的合作——关键是认知语义结构络研究的根本性突破——则不可能实现。 无论从手段还是就目标,对准自然语言处理的当代语言学研究,其性质都应界定为“语言科技”。“语言科技”的内涵是以理论研究为指导,以描写研究为基础,以应用研究为枢纽,促使语言研究向计算机应用、数学、认知科学和现代教育技术领域延伸,沟通文理工相关学科以实现语言研究过程及其成果的技术化;“语言科技”的外延表现为语言工程科技、语言教育科技和语言研究科技。语言学和计算机科学等学科相结合的“语言工程科技”,研究领域是“人—机对话”,其目标主要是自然语言能力的模拟。语言学与现代教育技术相结合的“语言教育科技”,研究领域是“人—人对话”,其主要目标是实现语言教育的多媒体和络化。“语言研究科技”是将语言研究活动与计算机工具相结合,其主要目标是实现语言学自身的计算机化,包括语料库、词库和句库的研制,语言研究的分析性、统计性、比较性和实验性软件的开发等。这一新思维既突出了当代科技发展所要求的“语言学的技术化”,又体现了以语言学为本而沟通文理工相关学科的研究旨趣。 二、计算语言学的界定要突出技术性 世纪年代以后,在理论方法交叉渗透而形成诸多边缘语言学的同时,语言学与计算机结合的趋势开始出现。1954年,在美国乔治敦大学所进行的世界上首次机器翻译试验,标志着计算机科学与语言学的结合已经起步。在这一研究领域,立足于不同的学科视角或知识结构,先后出现了一系列名称术语,如“语言工程”、“语言工程学”、“自然语言的计算机处理”(工科视角)、“语言信息处理”(信息学视角)、“数理语言学”(数学视角)等等。世纪60年代以后,计算机和语言学的结合逐步深入到语言学的各个领域,形成了包括计算语音学、计算词汇学、计算语法论语言科学与语言技术
文档评论(0)