- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
WORDNET简介 主要内容 WordNet概述 WordNet中的词汇组织关系 WordNet词库与查询软件的设计与实施 WordNet的应用与发展 WordNet与其他理论 一 WordNet概述 什么是WordNet? WordNet发展概况 WordNet的心理语言学假设 WordNet词汇来源 WordNet的对象和关系 WordNet的核心概念 什么是WordNet? WordNet is a large lexical database of English, developed under the direction of George A. Miller. Nouns, verbs, adjectives and adverbs are grouped into sets of cognitive synonyms (synsets), each expressing a distinct concept. Synsets are interlinked by means of conceptual-semantic and lexical relations. The resulting network of meaningfully related words and concepts can be navigated with the browser.WordNet is also freely and publicly available for download. WordNet’s structure makes it a useful tool for computational linguistics and natural language processing. WordNet是一个词汇数据库;是一个在线电子词典,它按照语义将众多单词组成一个“词网 ;是传统的词典信息与现代计算机技术以及心理语言学的研究成果有效结合的产物。 WordNet发展概况 1978年,Miller描述了一种“自动化词典”(automated dictionary)的想法。 1985年,WordNet真正成为普林斯顿新成立的认知科学实验室几项研究计划中的一个,并开始实际运作。 1986年,Bienkowski用LISP语言写了Grinder的第一个版本。 20世纪70—90年代添加词表并对词进行分类。 1989年年初 WordNet从一个简单的“词典浏览器”(dictionary browser)发展成一个自足的词汇数据库(self-contained lexical database)。 1991年7月 WordNet 1.0正式公布,之后WordNet一系列版本发布,迄今最新版本为WordNet2.1版本。 WordNet的心理语言学假设 可分离性假设(Separability hypothesis):语言的词汇成分可以被离析出来并专门针对它加以研究。?? 可模式化假设(patterning hypothesis):一个人不可能掌握他运用一种语言所需的所有词汇,除非他能够利用词义之间存在的系统的模式和关系。 广泛性假设(comprehensiveness hypothesis):计算语言学如果希望能像人那样处理自然语言,就需要像人那样储存尽可能多的词汇知识。 WordNet词汇来源 语料库??Brown语料库;?? 已有的一些词表??Laurence Urdang (1978)的《同义反义小词典》;??Urdang(1978)修订的《Rodale同义词词典》;??Robert Chapmand(1977)的第4版《罗杰斯同义词词林》;??美国海军研究与发展中心的Fred Chang的词表,与WordNet原有词表只有15%的重合词语(1986)??Ralph Grishman和他在纽约大学的同事的一个词表,包含39143个词,这个词表实际上包含在著名的COMLEX词典中。WordNet当时词表与该词表重合率为74%(1993年)。 WordNet的对象和关系 WordNet描述的对象 compound(复合词)、phrasal verb(短语动词)、collocation(搭配词)、idiomatic phrase(成语)、word(单词),其中word是最基本的单位。 对象之间的语义关系 同义反义关系(synonymy,antonymy) 上下位关系(hyponymy,hypernym,troponymy) 部分整体关系(entailment,meronymy) 部分句法信息 简单的动词基本句式信息(Verb Sentence Frames)
文档评论(0)