- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图书馆与信息社会的和谐发展论文集 华北地区
构建开放、共享的汉语科技词系统
朱礼军…乔晓东… 齐建东Ⅲ王文荣“王建新Ⅲ张运良“薛春香川崔林剐“
(1.中国科学技术信息研究所北京100038;2.北京林业大学北京100083)
摘要汉语科技词系统是在传统汉语主题词表内容建设的基础上,通过更深层次的科技词汇关系组织和有关词汇发现、管理、维护工具以及
服务平台接口开发所形成的汉语科技词汇知识与工具的集成体系.本文介绍了汉语科技词系统的产生背景、内涵.整体设计、部分工具成
果,并展望了下一步的研发和应用方向.
关键词词系统词汇发现协同工作词汇服务
1背景 .
随着科技信息资源数量上的剧增,面向机器的科技信息内容自动分类、标引、分析以及语义交换等信息智能处理需求越来越突出。科
技词汇知识是科技信息智能处理的基石“1.在信息科学领域.科技词汇知识主要体现为术语表、主题词表以及各种分类体系.长期以来,以
科技类主题词表为代表的科技词汇知识体系存在着编制过程中知识丢失、维护机制落后、词更新周期长、开放程度不够、难以获取,难以
满足信息加工和软件开发需求等突出问题.究其原因.是因为我国目前还缺乏一个科技词汇知识的构建、管理、维护工具的基础架掏和服
务平台。一些信息服务机构和高校虽然展开了相关的研究,但是缺乏整体性和系统性.国外却长期坚持开展了相关研究旷“’.针对这种情况,
07年在国家“十一五”科技支撑计划课题资助下.中国科学技术信息研究所(以下简称中信所)针对这一问题组织展开了汉语科技词系统
的研究和开发工作“”.本文在下面的章节中。将分别阐述汉语科技词系统的内涵、词系统的整体架构设计、项目研究进展、问题及解决思
‘
路,最后,对我国词系统发展趋势进行了展望.
2汉语科技词系统的内涵
与传统的汉语主题词表相比.汉语科技词系统从设计目标,应用场景、词汇知识内容、技术体系和应用服务方式上均有重大的变化.
汉语科技词系统的设计目标是构建一个汉语科技词汇内容的创建、管理、维护和应用的技术框架体系,实现科技词汇知识的开放加工
和共享使用,为中文科技信息资源的内容处理提供词汇层面的语义支撑。
从应用场景方面分析.汉语科技词系统主要面向计算机应用程序,提供有关汉语科技词汇的各类信息。
从词汇知识内容层面来看.汉语主题词表主要提供汉语主题词的用、代、属、分、参五种主要关系。汉语科技词系统除了上述关系外,
还根据具体领域,提供更为复杂的关系。例如:在用、代关系上,将细化出时变关系、不同域之间的同义关系等:在属分关系上。将细化
结构上的部分与整体、学科上的包容关系等;在参关系上,将细化出逻辑上的因果关系、实证关系等。
从技术体系上来看,汉语科技词系统一方面通过自动构建和管理维护工具保持词汇内容的动态、及时更新。另外一方面,通过规范的
程序访问接口和独立于计算平台的词汇输出格式来实现词汇构建过程和应用过程的封装,使得汉语科技词系统更容易被其它研究机构和软
’
件开发方重用。
汉语科技词系统的潜在应用几乎渗透到信息资源管理中的各个方面,具体包括:概念检索、相关性揭示、分类主题转换、自动分类和
聚类系统构建等。在应用服务方式上,汉语科技词系统通过三种方式向各类用户提供服务.首先是通过规范接口。可以根据不同语言的具
体实现.通过访问接口调用来访问汉语科技词系统的内容。其次.可以通过下载或者授权使用汉语科技词系统的内容数据.汉语科技词系
统的内容数据设计为支持多种电子存储格式.包括开源的数据库实现(mysql)、x虬或者sKOS格式.最后,汉语科技词系统还可以通过_eb
service的方式,来实现基于网络的调用. 、
3词系统的整体架构设计
“汉语科技词系统”作为汉语科技词汇知识与工具集成体系,由词汇内容资源与相应的建设、管理、维护、使用接口、工具和平台组
成.如图l所示.
面向资源的构建和维护方面.设计了多模块的API。汉
您可能关注的文档
最近下载
- 黑龙江农业工程职业学院单招数学模拟试题(附答案).docx VIP
- 2025读书心得:屏幕时代如何重塑孩子的自控力.docx VIP
- 中国艰难梭菌感染诊断、治疗与预防指南(2024)详细解读PPT课件.pptx VIP
- 第14课《我们都是中国人》第2课时 这是我国的标志 教案设计 2025道德与法治二年级上册.docx
- 湘少版四年级上册、下册的英语单词默写表.pdf VIP
- GBT 危险货物运输应急救援指南 第1部分:一般指南.pdf VIP
- 煤炭掺配合同范本.docx VIP
- 汽车整体认识(汽车发展史)-精.ppt VIP
- 生产安全事故现场处置方案.docx VIP
- 小学数学二年级下册应用题练习.docx VIP
文档评论(0)