- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2006年度广东优秀科技专著基金资助出版:字本位与中文信息处理的基础
PAGE
PAGE 1
第三部分 结论
通过前面一至四章的铺垫,现在笔者可提纲挈领、简明扼要地阐述读者关心的问题。
由语言的微观分析到信息的宏观掌控如此巨大跨度的融智学研究的主题究竟是什么?
简单的说,融智学的研究主题就是协同智能,如(k+1)双文双语协同智能计算系统
人脑和电脑有机结合而成的“第三脑”实际上是协同的双脑,即:常说的1+1>2在脑智问题上的体现。
如果(可融通融合的)“智(慧、力、能)意味着信息处理(的能力)” 笔者提交第七届国际本体论和知识本体学术大会(2006年10月2至6日西班牙)的科学论文题目。而“处理”的内涵或步骤 输入、存储、(涉及“分”与“合”两个基本步骤的狭义的)处理、输出、反馈、传输,共八个步骤。已清楚,那么,“什么是信息”也就成了比
笔者提交第七届国际本体论和知识本体学术大会(2006年10月2至6日西班牙)的科学论文题目。
输入、存储、(涉及“分”与“合”两个基本步骤的狭义的)处理、输出、反馈、传输,共八个步骤。
我们知道“语言形式与语义内容”或“数据与知识”等价于“信息”的形式与内容。因此“语言与知识” 它们的根本难点在于语言与知识的定性分析和定量计算或统计乃至估算。前者涉及(文化基因工程的)文本基因系统及其语言信息处理,后者涉及(文化基因工程的)知识基因系统及其基于总框架的知识管理。就成了融智学
它们的根本难点在于语言与知识的定性分析和定量计算或统计乃至估算。前者涉及(文化基因工程的)文本基因系统及其语言信息处理,后者涉及(文化基因工程的)知识基因系统及其基于总框架的知识管理。
如:英文、中文等具体的自然语言理解及其信息处理实践;计算语言学理论。
(狭义的)人工智能
融智学实际上明确了“人脑(本身的)智能”-“ 电脑(人工的)智能”-“(双脑的)协同智能”这样一个进化路径。其中,(脑)智(如协同智能计算系统)是核心、主干,“语言或数据与知识”是它的两翼。
图5-01是基于微观语言学与本体信息学的理论融智学研究主题的内部架构示意图。
(可融通融合的)
智意味着信息处理
“语言形式与语义内容(含知识)”或“数据与知识”
字/Zi
字/Zi
word
概念与关系
?(文) + ?(意) + ?(义) = ?(信息) = ?(本体)
(普遍的)信息是形式上可数字化、内容上可概念化、本质上可序位化的范畴,划分为符号(文)、概念(意)、关系(义)三个基本范畴,其特例就是各种各样(特殊的)信息。
其中蕴含?(物)的外观形象(字可表述/图可描绘)和内部构造(字可说明/图可描绘)
硬件 + 软件?(物)= ?(载体);?(信息)=
硬件 + 软件
基于人脑 (1+k)协同智能(主体)信息系统
基于电脑 (k+1)协同智能(代理)计算系统
视听(形式信息)模式(1)识别与语义(内容信息)模式(2)识别
自然语言理解(如中文信息处理)与知识工程(涉及知识获取、知识表达与知识重用)
图5-01
由图5-01两个大箭头内嵌的字词可见融智概念体系有两个可操作可计算的认知入口。
如果说?(义), ?(文), ?(意)和 ?(物)这样过于抽象的融智概念体系读者一时难以理解,那么,字(Zi)与word(词)以及处理它们的计算机软件却相对容易理解。
现在的问题是中文信息处理和基于中文的知识管理远落后于英文信息处理和基于英文的知识管理。当然后者也有其自身的问题,否则,就没有我们说汉语写中文的语言社团翻身的机会了。融智学(理论)及其文化基因工程(实践)就是在“语言与知识”两方面获得了根本性的突破,至少涉及十个知识创新点或具有原创性的贡献(和配套的重要背景知识):
知识创新点1:给出了本体信息学的信息定义(即“信息本体”)及其最基本的分类:
?(信息)= ?(义)+ ?(文)+ ?(意),其中,?(文)含 ?(物)的外观。
?(义)= 可序位化的属性或基本关系(其计量单位是对)及其所构成的结构体系,
?(文)= 可数字化的类型或基本符号(其计量单位是格)及其所构成的形式体系,
数字化的“比特(bit)”是“格(ge)”的特例,而明晰的“格(ge)”和模糊的“个(ge)”却又都是本真信息(含:量子信息)的计量单位“对(pair)”的特例。
?(意)= 可字组化的术语或基本概念(其计量单位是个)及其所构成的学问体系,
(普遍的)信息是内容上可字组化、形式上可数字化、本质上可序位化的范畴,可划分为概念、符号、关系三个基本范畴,其特例(如具体的信息)就是各种各样(特殊的)信
原创力文档


文档评论(0)