- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于DDC《英文超级科技词表》范畴体系构建研究
基于DDC《英文超级科技词表》范畴体系构建研究
摘要:《英文超级科技词表》是一个包含4层结构的知识组织系统,范畴体系为其顶层结构,起到类聚概念和表达词表宏观知识结构的作用。工程技术为例,研究基于DDC构建《英文超级科技词表》范畴体系的方法。首先分析DDC类目体系的结构特征,针对DDC类目层级过深、重要学科类目得不到突出显示的问题提出重构类目导航体系的方法。然后对工程技术相关类目进行深入分析,参考《中国图书馆分类法》、E1分类表进行学科类目重组,提取工程技术基本学科24个,并确定各学科的基本构成类目。最后提出对各学科细分类目进行梳理的原则。
关键词:范畴体系构建 DDC《中国图书馆分类法》 E1分类表 类目映射
分类号:G254.12
1、项目背景及《英文超级科技词表》逻辑结构
《英文超级科技词表》(以下简称《英表》)是“十二五”国家科技支撑计划项目“面向外文科技文献信息的知识组织体系建设与应用示范”的主要研制内容之一。目标是建设覆盖理、工、农、医四大领域的、面向英文科技文献信息组织与检索的一部大型综合词表。该项目由国家科技图书文献中心(NSTL)牵头,多家情报机构分工协作,计划三年内完成。
《英表》并非传统意义上的叙词表,从逻辑结构上看,它是一个包含4层结构的知识组织系统,自下而上依次为:词汇素材、基础词库、概念网络、范畴体系,如图1所示:
词汇素材层是按照素材采集标准筛选出的各类词汇集,包括相关专业的叙词表、专业词典、术语集、文献关键词等,叙词表是其核心构成部分。基础词库是将不同来源异构的词汇集按一定规范进行描述,并采用统一格式进行存储而形成的词汇元数据仓储。对基础词库中的词汇进行同义词归并,形成以概念为单位的同义词群,概念继承各同义词原有关系,由此形成相互关联的概念网络。《英表》对概念间关系不做梳理,因此形成的概念网络实际上是一个无序网络,没有清晰的等级结构。
为了能在一定程度上表现《英表》知识体系的等级结构,《英表》在概念网络层上设置了范畴体系。范畴体系为概念提供了分类框架,概念在统一???分类框架下归属到相关类目,按学科特征得以聚集,并借助范畴体系的等级结构由一般到具体层层展开。范畴体系是对《英表》主题概念进行组织的工具,可在一定程度上弥补概念网络在宏观知识结构表达上的不足。
2、《英表》范畴体系的功能定位及构建原则
范畴表是叙词表的基本构成部分之一,范畴体系的构建在叙词表编制工作中意义重大。在叙词表构建之初,范畴体系可起到控制词汇采集的学科范围和各学科词量基本均衡的作用;在叙词表构建过程中,范畴体系可将相关同汇聚集到一起,方便词间关系的发现和构建;叙词表构建完成后,范畴体系起到组织词表概念的作用,能反映叙词表知识体系的宏观结构,是词汇的主要索引方式之一。
一般情况下,构建范畴体系不是从零开始,可以根据拟构建叙词表的学科特征选择已有的分类体系,根据拟构建叙词表的功能定位以及词汇学科分布情况对分类体系进行调整。
《英表》范畴体系的构建需要考虑英语语言地区的政治、经济、文化背景,构建的分类体系要能匹配英语语言地区人们对学科知识结构的理解。同时NSTL的主要服务对象是国内用户,《英表》构建不可能完全脱离国内用户的文化背景和知识结构,因此也需要考虑国内用户对学科体系的理解,尽可能靠近国内用户熟悉的分类体系。
基于上述考虑,《英表》范畴体系的构建思路是:选择一部英语地区主流的分类表作为主干范畴表,主干范畴表要能覆盖理、工、农、医几大部类。以此为基础,根据《英表》学科规划和词汇分类的具体需求,参考其他分类体系对主干范畴表进行局部调整,形成指导《英表》词汇采集、类分与导航的范畴体系。由于《中国图书馆分类法》(以下简称《中图法》)是我国应用最广泛的综合分类法,而E1分类表是工程技术领域影响最大的词汇分类体系,因此在研究中将以这两部分类法作为主要的参考分类体系。
3、主干表选择及其结构特征
3.1 主干表选择
《杜威十进分类法》(Dewey Decimal Classification,以下简称DDC)、《美国国会图书馆分类法》(以下简称LCC)是英语地区影响很大的综合分类法,这两部分类法都有专设的维护机构持续进行维护和修订,是选择主干范畴表的主要考虑对象。
DDC和LCC在类目体系和类号体制上有着较大区别:①DDC是一部通用分类法,系统性较强。而LCC是为满足美国国会图书馆图书分类的要求而编撰的,并非通用分类法。LCC各分册由各学科专家分别进行编制和修订,没有统一的编制规则,缺乏明确的分类理论指导,系统性较差。②DDC是十进制分类体系,各级类目基本按层累制方式编号,类目体系等级分明,易于理解和使用。LCC是列举式分类体系,类
文档评论(0)