复句静态本体模型初探.pdfVIP

下载本文档

16
0
约8.07千字
约 8页
2015-08-11 发布于安徽
举报
版权申诉

复句静态本体模型初探.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第处理水平和处理量基本上代表了这个国家进入信息社会的程度，其语言文字信息的处理能力直接关系到它在网络社会和网络经济中的国际竞争能力。 “本体”这样一个起源于哲学的概念在被引入计算机领域后得到了很多学者的关注，并逐步成为包括知识工程、自然语言处理和知识表示在内的诸多人工智能研究团体的热门课题。主要原因在于本体使人与人、人与机器、机器与机器之间的交流建立在对所交流领域的共识基础上。现在，本体技术已经发展成为知识表示、知识管理、知识共享、知识复用的主流技术，正成为自然语言处理、web信息检索、数据库和知识库管理、异构数据集成、数字图书馆、GIS、语义网等研究领域共同关心的一个核心。 isan 息科学领域广泛接受的本体(Ontology)的正式定义：“Anontologyexplicit ofa specificationconceptualization”，即本体是对概念化的一个显式的规格说明。目前计算机界认为本体是共享概念模型的明确的形式化规范说明。它包含4层含义：概念化、明确化、形式化和共享。“概念化”是指通过抽象出客观世界中一些现象的相关概念而得到概念模型，即概念系统所蕴含的语义结构是对某一事实结构的一组非正式的约束规则，可以理解和／或表达为一组概念、定义和关系； “明确化”是指使用的概念及使用这些概念的约束都有明确的定义；“形式化”是指本体是计算机可处理的；“共享”是指本体中体现的是共同认可的知识，反映的是相关领域中公认的概念集。本体是一种知识表示的方法，可用于数据库级别的知识共享。本体知识则更强调它是作为通信、交流的依据，本体上推理的最终目的是获取交流的语义。本体是为了统一的术语和概念的清晰表达，就是用来实现知识的共享和莺用①。总之，本体的目标是获取、描述和表示相关领域的知识，提供对该领域知识的共同理解，确定该领域内共同认可的词汇，并从不同层次的形式化模式上给出这些词汇和词汇间相互关系的明确定义。在Tim URI， XML，RDF(S)等语言标准之上的本体层(ontology vocabulary)起着关键性的作用，其提供的丰富原语不仅用来描述领域的概念模型，而且还是对知识进行推理和验证的基础。本体和逻辑推理规则用以完成基于语义的知识表示和推理，从而能够为计算机所理解和处理。在语义网的研究中，知识表示、本体论、智能主体等都是其重要的研究内容，它们都是不可分割的②。人们在交流时需要使用词语或者符号，这些词语或者符号都是有所指的(指向 ①李善平，尹奇，胡玉杰，郭鸣，付相君：《本体论研究综述》，载《计算机研究与发展》， 2004(7)，41 ② Berners-Lee，T．，J．Hendler，andQLassila，TheSemanticWeb．TheScientificAmerican， 2001 事物)，但“词语”到“事物”的映射不是直接的，两者之间以“概念”作为桥梁，所以，“词语”“事物”和“概念”这3者之间的微妙关系可以用“语义三角”表示出来，与邢福义先生提出的语表、语里和语值小三角类似①。从汉语语法学的角度看，汉语语法重句法，句法机制的研究是汉语语法研究的重要突破口；尽管近年来汉语学界已经注意到了句法语义的研究之重要。但做得并不理想，实际上停留在“泛论”阶段，解释规律的精密程度并不深，离可以“教会”计算机自动认知和解释规律的要求有很大的差距。从计算机信息处理的角度看，近年来我国学者已经基本上解决了汉字输入、汉语自动分词、词性自动标注等困难，然而，跟国外情况相比较，无论在理论上抑或应用系统的开发上，差距还比较大，缺乏重要的创新；特别是，由于应用领域的信息提取、信息过滤、网络检索、机器翻译等方面的需求，中文信息处理所面临的应该是句法、语义、语用、篇章等的深层次问题。由于复句在篇章中占有的比例相当大，因此我们可以通过分析研究小句和复句的静态结构，并通过扩展UML元模型以及结合本体建模的方法来研究小句元模型以及