- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络信息分类系统的词汇控制_计算机网络论文
网络信息分类系统的词汇控制_计算机网络论文
所谓词汇控制,是指根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。自然语言作为一种人际交流和思维的工具,其词汇具有使用灵活、表达性强等特点,但相对检索要求来说,含义不够精确,缺乏明确的结构,词汇量也过大。因此,必须根据检索系统要求,对词汇进行选择和处理。适度的词汇控制对于建立一个高效的信息组织和检索系统是十分必要的。
分类系统对词汇的控制主要包括:同义控制、词义控制和词间关系控制三个方面[1],本文主要围绕这三个方面进行讨论研究。
1 传统分类法词汇控制
传统分类法的构成原理中,词汇控制是一个重要的方面。
1.1 同义控制
即对字面形式不同、涵义相同的词进行控制,使一个概念只用一个语词表达,目的是克服自然语言中的一义多词现象。
分类法对词汇的同义控制主要体现在类名的选择上。类名即类目的名称,规定着类目的含义和内容范围。当遇到一义多词情况时,传统分类法的选词原则一般是:采用能准确反映其含义且比较通行的科学名词,而不选择其俗称、旧称、不能准确表达全称原义的简称、不通行的译名或近义词等[2]。如有必要,也可将这些落选的同义词、近义词用括号加注于类名后,或设置交替类目、用代参照。
1.2 词义控制
即对同形异义词和语义含糊的词进行控制,使得词义明确,一个词语只表示一个概念,克服自然语言中的一词多义现象。
传统分类法主要通过类目注释来对词义进行控制。类目注释有多种类型,包括内容注释、关系注释、编列方法注释、分类方法注释、沿革注释等。一般在类目内容注释中作词义控制,对类目的涵义加以说明,或对类目的内容范围加以区分,指示某类包含与不包含的内容。如中图法第四版类目“TB47工业设计”的注释:“工业设计是工程技术与美学艺术相结合的新学科”。
1.3 词间关系控制
指揭示词汇之间的各种联系使其成为一个语义相关的系统,目的是用以满足扩检、缩检、改变检索方向等的需要。词汇之间的联系,主要包括等同、等级、相关三种基本类型。
由于传统分类法以分类标记作为概念标识,将系统展开的类目体系作为主要检索途径,因此,词间关系控制成为其词汇控制的中心。分类系统主要采用系统方式展开,通过层层划分,构成其具有隶属、并列关系的秩序井然的概念等级体系。将主题之间从属、并列、相关等联系加以系统展示,同时将类目之间的参照作为揭示类目之间横向联系的一种补充手段。类目参照一般用于内容联系具有揭示价值、但在分类体系中被分散了的类目之间,通常采用互逆的方式在相关门类下注明。
2 网络分类系统词汇控制现状
以下从同义控制、词义控制及词间关系控制三个方面来对网络分类系统词汇控制的现状与传统分类法进行对比分析。
2.1 同义控制
在类目名称上,传统分类法的类名力求科学、准确、规范,而网络分类法在类名选择上更注意面向各类网络用户,力求通俗易懂、时新,类名也更为简练。因此,导致类名不规范的现象在各网络分类系统尤其是在其三级及以下类目中普遍存在,成为词汇控制中一个突出的问题[3]。如雅虎中国的一个三级类目名“亲子”,搜狐的一个三级类目名“拓展”。
至于落选的同义词,一般不建立用代参照或设置交替类目,但可作为入口词。如在提供类目索引的雅虎中国中,在检索框中输入“脚踏车”,检索结果会将你指引向“自行车”[4]。
2.2 词义控制
网络分类系统中,也普遍存在类名用语模糊导致难以判断其外延的现象。传统分类法中的词义控制手段如含义注释和范围注释也很少采用,一般只在一级大类下有选择地列举重点或热点下位类来帮助明确其类名含义。如Yahoo!中,在一级大类“Business amp Economy”下列出部分一级类“B2B,Finance,Shopping,Jobs”[5];在Open Directory中,一级大类“Business”下列出部分二级类“Jobs,Real Estate,Investinn”[6]。
2.3 词间关系控制
与传统分类法一样,等级式类目体系也是网络分类法进行词间关系控制的主要手段。传统分类法基本上是采用线性形式揭示类目之间联系的,这是文献组织的需要和传统检索环境的特点所决定的。计算机的使用,特别是超文本技术的使用改变了这一状况。超文本技术的特点是,可以通过节点之间的链接,以非线性的方式充分揭示和表达信息之间的联系。这一特点极大地改进了网络分类法中类目之间各种关系的揭示,尤其是多维关系的揭示。这是超文本技术的强项,也是传统分类法中的一个薄弱环节。目前,网络分类体系中对多维关系的揭示比较充分,一般均通过链接的方式,在相应类下重复反映。但如在处理过程中缺乏一致性及对应用范围的适度控制,也会造成类目关系的混乱。此外,单一
您可能关注的文档
- 空间数据仓库的概念框架和认知过程_计算机论文.doc
- 立体花坛在城市绿化中的应用研究_工程建筑论文.doc
- 立式陈列柜风幕数值模拟的双流体模型_工程建筑论文.doc
- 竖直U型埋管换热器支管间热量回流分析_工程建筑论文.doc
- 竹子在章丘市园林绿化中的应用_工程建筑论文.doc
- 第三代移动通信主流技术标准及其演进_通信学论文.doc
- 第三代移动通信系统的研究现状和发展趋势_通信学论文.doc
- 第四代移动通信系统概述_计算机论文.doc
- 等截面水泥烟道沿程阻力研究_工程建筑论文.doc
- 筑路机械冷却装置液压驱动系统的总体设计_工程建筑论文.doc
- 部编版小学语文六年级上册 书戴嵩画牛 名师教学PPT课件.ppt
- 人教版小学数学五年级上册 可能性 名师教学PPT课件.ppt
- 第三节人类活动对区域地理环境的影响.ppt
- 部编版小学语文六年级上册 狼牙山五壮士 名师教学PPT课件(3).ppt
- 人教精通版六年级英语下册 名师教学课件 I went to Sanya for my holiday.ppt
- 部编版小学语文六年级上册 狼牙山五壮士 名师教学PPT课件(2).ppt
- 第一章无线局域网概述.ppt
- 部编版道德与法治三年级上册 爸爸妈妈在我心中 名师教学PPT课件.ppt
- 人教版小学数学五年级上册 两端都栽的植树问题 名师教学PPT课件.ppt
- 法律法规课件下载.ppt
文档评论(0)