- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文自动标引应用性探讨
中文自动标引应用性研究
摘 要
随着中国经济的迅猛发展 中文信息越来越多的被国内外关注和利用 中
文自动标引作为中文信息处理的重要组成部分 已经成为学界的研究热点之
一 本文在回顾了中文自动标引研究的历史和现状的基础上 从主题标引和分
类标引的角度对中文自动标引的理论实现进行了归纳和研究 同时对中文自动
标引系统应用情况进行了总结和对比分析 针对中文自动标引应用方面存在的
问题提出了自己的看法和建议 最后对在万方实施自动标引提出自己的初步方
案
关键词 自动标引 自动分类 数据库 情报学
The Study on Application of Chinese Automatic Indexing
Abstract
With the rapid development of Chinese economy, Chinese information becomes
more and more important. As a significant proportion of Chinese information
processing, Chinese automatic indexing has been one of hot topics in the field .
Through having systematically reviewed its history and actuality, this paper in-depth
studied the theory of Chinese automatic indexing from two aspect of subject
indexing and classification indexing, and put forward some viewpoints to the
problem s in its application. In the last, author brought forward the primary
blueprint of bringing automatic indexing into effect in Wanfang Data
Key words : Automatic Indexing, Automatic Classification, Database , Information
Sciencep
引 言
研究背景
信息作为当代社会的三大支柱 包括能源和材料 之一 正日益受到人们
的重视 上世纪以来 人类创生的信息量高速增长 据估计 70年代以来全世
界每年出版图书50万种以上 期刊10万种以上 专利约50万件 科技报告约
90万件 会议文献10多万篇 产品样本50多万种 每年发表的科技论文总数
近500万篇 并呈指数式增长 真可谓信息浩如烟海 九十年代以来 Internet
以惊人的速度发展起来 它容纳了海量的各种类型的原始信息 包括文本信息
声音信息 图像信息等等 如何在众多的文本中掌握最有效的信息始终是信息
处理和信息检索的一大目标 随着经济不断发展和国际地位的日益提高 中文
信息的产生和需求量急速上升 中文信息处理和中文信息检索技术已经得到情
报界和计算机界的重视
中文信息处理和信息检索的关键一环是中文文献的标引 标引就是根据文
献内容及相关特征 赋予具有检索意义的相应标识的过程 标引工作是情报检
索系统的中心环节 它产生的标引词既是情报存储的标识 也是情报检索的依
据 标引质量的好坏和速度直接关系到信息检索的质量和信息服务的时效性
所以标引的质量直接影响检索效率 同时也反映了文献数据库的质量 衡量标
引质量的指标有 标引的全面性即标引深度 标引的准确性 标引的一致性
根据标引手段 标引方法分为人工标引和自动标引 其中自动标引包括全
自动标引和计算机辅助标引 根据标引的内容分为主题标引 分类标引 其中
主题标引可以分为主题词标引和关键词标引 由关键词是否受控又分为自由词
标引和受控标引 根据标引词的获取方式上可分为 抽词标引和赋词标引
您可能关注的文档
最近下载
- 人教版化学必修第一册第一章 物质及其变化单元综合练习(解析版答案).doc VIP
- -比亚迪与长安汽车财务报表对比分析.docx VIP
- 安防监控系统测试方案.docx VIP
- 2024版良信低压产品选型手册(2024).pdf VIP
- 第10课 往事依依 课件(共24张ppt) 2025-2026学年统编版(2024)初中语文七年级上册.pptx VIP
- 2023年辅警招聘考试公安基础知识刑法及相关知识模拟试卷 .pdf VIP
- 软件开发和测试环境维护管理制度.docx VIP
- 生态主义景观设计.pptx VIP
- 一种低膨胀系数石英玻璃锭的生产方法及生产装置.pdf VIP
- 期末备考策略+专项训练 十三 课外阅读(三)写人记事类文章阅读-2023-2024学年五年级语文上册 统编版.docx VIP
文档评论(0)