- 1、本文档共108页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人工语言脑自然语言处理装置的研制思路-ICL,PKU
人工语言脑: 自然语言处理装置的研制思路 Artificial Language Brain 李葆嘉 面向智能机研制的自然语言处理装置,其实质就是人工语言脑。 1.自然语言能力是在语言系统的建构和言语行为的交际中逐步实现的。个体语言能力的激活和成长过程,为计算机的自然语言能力移植仿生工程提供了蓝本。 2.人类语言的本质属性是语义性;语义系统的本质特点是网络性;语义网络的形成过程是建构性。 3.计算机不具备语义网络的自建构能力,必须为之建构以供语言编码和解码之用的可计算语义网络。 4.自然语言的编码过程可界定为语义关联,即基于语义网络相关义场之间的节点激活;自然语言的解码过程可界定为语义换算,即基于语义网络相关义场之间的相互阐释。自然语言的运用机制可界定为语境适应,即基于特定语域的语境选择。 5.基于语义语法学理论、元语言学理论和语言系统受限理论,人工语言脑研制工程可分解为语言基因图谱分析工程、认知语义网络建构工程、受限语言能力模拟工程。 6.以义征挖掘和义场建构为基础,以语义范畴提取和语义句模抽象为中枢,以语义网络建构为目标。最小颗粒度:语义特征;最大颗粒度:句法结构;基本功能:生成话语和理解话语。 提 纲 一、迄今未能逾越的语义障碍 二、计算机为何还不开口说话 三、自然语言能力到底是什么 四、如何教计算机一步步学说话 五、语言科学与技术的研究目标 一、迄今未能逾越的语义障碍 虽然计算机的研制初衷缘于数值计算,但是A.M.Turing在《机器能思维吗》(1950)中已经预见到计算机和自然语言将结下不解之缘,并提出检验计算机智能的最好方法就是语言信息处理能力。 同年,英国工程师A. D. Booth和美国洛克菲勒基金会副总裁W. Weaver就提出了语言自动翻译的设想。 1949年, Weaver提出两点设想:一是翻译类似于解读密码的过程;一是原文与译文表述的是同样的内容。 基于“词典解码论”,早期机译系统的研制思路是试图通过查词典实现词与词的自动机译。 显而易见,Weaver们远远没有看到自然语言在生成和理解方面的复杂性,并不了解人类语言的真正属性。 1966年,美国科学院语言自动处理咨询委员会在《语言与机器》中指出:机器翻译遇到了难以克服的semantic barrier。 然而这一警示,除了致使机译系统研究一度降温以外,并没有促发语言学界和计算机学界转向语义的深入研究。 80年代,机译系统研究主要是基于语形规则和中间语言的转换方法。其症结在于规则的覆盖度、冲突性以及规则库的规模度,即规则的解释力和穷尽性问题上。 90年代,机译系统研究进入语料库或语言知识库时期。 基于统计的方法是依据平行语料库的词句对译概率统计而获得机译系统。其症结在于统计方法仅仅可以分析线性关系,而无法深入非线性关系。 基于实例的方法是利用双语对齐的翻译实例库而获得机译系统。其症结在于,实际上是把人工译文语篇数码化以供机译系统提取。 显而易见,基于语料库或语言知识库的方法,不过是从词对译到句对译,再到语篇对译的文本处理技术,并非真正的语言能力模拟。 从语言学角度考察,以往的机译系统研究主要依据词汇和语形规则。迄今为止,语义障碍仍然是机译系统道路上的拦路虎。 研制思路不转到语义立场上来,即使补充一些词汇语义和知识背景,也不可能引起机译系统的质的飞跃。 1982年,日本制订了一个为期十年的面向人工智能的第五代计算机研制计划。预期性能有智能接口、知识库管理等。除运用自然语言与人会话并解释图片,还设想具有学习、联想、推理等行为。1992年,只达到了部分预定目标。 随后,又公布了真实世界计算机研制计划。90年代后期宣告:这一项目已经失败,在10年内要完成一项高智能系统是不可能的。 人类的最高智能即语言思维智能,自然语言处理装置未成,谈何人工智能,谈何面对真实世界 ? 智能机研制的“瓶颈”是自然语言处理装置,而自然语言处理装置的 “瓶颈” 是“语义障碍” 。 以词类划分、成分分析、句型归纳为主要特征的语法研究是语形语法学。基于语义性、网络性和建构性的语义语法学。显而易见,基于“人-人会话”的语形语法学无法逾越这一“义障”。 二、计算机为何还不会说话? (一)自然语言能力模拟技术 计算机处理自然语言的技术,可分为语言文本处理技术和语言能力模拟技术。 语言文本处理技术已相当成熟,英特网web和语料库语言学是这方面的典型成果。 语言能力模拟技术包括语音合成技术、机译系统和自然语言处理装置。 面向智能机研制的自然语言处理装置,其实质就是人工语言脑,即通过算法化将自然语言的生成和理解机制输入计算机,使其具有自然语言的运算能力。 尚未配备自然语言处理装置的计算机,即使说上几句话,也是采取语音合成技术预设的“顺读”,并非已经具有使用自然语言的能力
您可能关注的文档
- 主要参考标准-lifan.doc
- 二、专项预期目标-浙江省科技人才教育中心.doc
- 二、大气环境影响分析-界首市信息公开-界首市政府.doc
- 九院招标文件定稿_20161128152257.doc-宁波市江北区公共资源交易.doc
- 为无向图建邻接矩阵.ppt
- 二、影响煤炭经济运行的主要因素-中煤第三建设集团有限责任公司.ppt
- 二、投标人须知-大连市政府采购网.doc
- 二、机床坐标系、机床零点与机床参考点.ppt
- 二、招标文件-重庆市机电设备招投标交易中心.doc
- 二、数控铣床常用编程指令.ppt
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
文档评论(0)