- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第x章HNC语言模型.doc
第x章 HNC语言模型
HNC说略本文由【中文word文档库】 搜集整理。中文word文档库免费提供海量教学资料、行业资料、范文模板、应用文书、考试学习和金融理财等word文档
HNC Hierarchical Network of Concepts (概念层次网络)
一个关于自然语言理解处理的新理论;一种表述和处理自然语言的新模式
基于概念和语义的语言理论
中国科学院声学研究所黄曾阳先生创立
发展历程
1989~1993 创立
1994~1996 实验
1997~2000 技术实现
2001~ 走向应用
学术影响和地位
业界关注
三大流派之一
应该带来语言学的一场革命
黄曾阳先生与HNC
我与HNC
HNC的目标
以概念联想脉络为主线,建立一种模拟大脑语言感知过程的自然语言表述模式和计算机理解处理模式,使计算机获得消解模糊的能力。
自然语言的五重模糊
对NLU当前阶段的定位:消解模糊
如何获得消解模糊的能力?消解模糊靠什么?
NLU的必由之路:模拟大脑语言感知过程,建立概念联想脉络
大脑感知或理解语言的实质,是概念联想脉络激活、扩展、浓缩、转换与存储的全过程运作
概念空间和语言空间
HNC预定建立自然语言的五个理论模式:
自然语言概念体系的理论模式
自然语言语义块和语句的理论模式
句群、段落和全文要点的表述模式
短期记忆和长期记忆的形成及其相互转换模式
基于文字文本的计算机自学习模式
HNC的进展和基本内容
五大进展
设计了体现概念联想脉络的语义网络
建立了自然语言概念体系的表述模式
建立了自然语言语句的表述模式
形成了提纲挈领式的知识表示体系
形成了称为句类分析的自然语言理解处理技术
基本内容
语义网络——概念体系
概念表述模式——对词汇语义的描述
对词义之间的概念关联给出形式化的表示,以关联性代替任意性
概念基元及其复合
语句表述模式——对句子语义的描述
句子的语义类型和表示式
基本句类,句子语义的基元类型
知识库建设——知识表示体系和语言工程
句类分析——语言理解技术
HNC的语义网络
概览(参见附录二)
抽象概念和具体概念
抽象概念的三大语义网络:基元概念,基本概念,逻辑概念
语义网络的特点
概念化、基元化、层次化、网络化
不是词义分类系统
语义网络的思想来源
汉语“字义基元化,词义组合化”现象
Quillian语义网络,Fillmore格语法,Schank概念从属理论
HNC局部联想脉络—词汇层面的表述模式
HNC的概念表述模式建立了自然语言概念的符号化表述体系,这个体系是对自然语言局部联想脉络(即词汇层面联想脉络)的形式化表述。
概念的一般表达式
HNC对自然语言概念的符号化表述可以一般化为:
∑{类别符号串}{层次符号串} {组合结构符号} {类别符号串}{层次符号串}
上式表示:概念的表达式由类别符号、层次符号和组合结构符号三类符号构成,类别符号串和层次符号串构成一个概念基元的表达式,两个或多个概念基元通过组合结构符号的组合而构成新的概念。由单个概念基元构成的概念称为简单概念,由两个或多个概念基元组成的概念称为复合概念。
类别符号如“j、l、p、w、x、v、g、u、z、r”等,层次符号是数字0到13,其中10到13用小写字母abcd表示(十六进制),组合结构符号如“#、$、、|、/”等。类别符号都是字母,而层次符号都是数字,因此,类别符号串也叫字母串,层次符号串也叫数字串。字母串代表概念的类别特征,数字串代表概念的层次性内涵,组合结构符号代表复合概念的组合结构。
字母串代表概念的类别特征。下面是字母串中所用符号(即类别符号)的集合:
网络类别符号 j, φ, l, s, f
五元组符号 v, g, u, z, r
“语法”结构符号 q, h
具体概念和物性符号 w, p, x
上面这15个类别符号专门用于表述概念的类别特征,它们是概念类别的基元表示,可以构成各种复合型概念类别。下面简要解释一下这些基元符号和一些常见的复合型符号。注意:类别符号中的所有字母都必须为小写。
(1)网络类别符号 第一章中介绍的语义网络就是概念的聚类,不同的网络代表着不同类别的概念,所以,代表各个语义网络的符号就是重要的类别符号。各语义网络的符号在第一章中都介绍过了,下面只把它们列出,其中“j、φ、l”代表三大类抽象概念,是最重要的网络类别符号,“jl、jw、wj、pj”就是复合型符号了。
j 基本概念
φ 基元概念
l 语言逻辑概念
文档评论(0)