信息资源组织基础方式.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
搜索引擎 搜索引擎(Search Engines)是对互联网上的信息资源(主要是网页)进行搜集整理,然后提供查询服务的系统,通常包括信息搜集、信息整理和用户查询三部分,但提供给用户的往往只是一个查询界面。 两类搜索服务 Google Yahoo 网络信息资源的挑战 数量巨大 没有一个搜索引擎能够覆盖万维网的16% 网站; 所有搜索引擎加起来覆盖了万维网的42% 极端异质 信息值不同 长度不同 语法或输入错误 内容错误、过时或不可靠 多种格式 多语种 速度问题 每分钟需要接受15,000 ~ 20,000次查询请求 数字化信息量举例 音乐作品(莫扎特):约100MB 报纸(华尔街杂志):100MB/年(文本) 卡片目录(美国国会图书馆):17GB 广播(WABC) :270GB/年(未经压缩) 网络论坛(Netnews):300GB/年 地区图书馆(加州大学图书馆):1.4TB(图书扫描版) Internet出版(WWW):1997年约4TB 电视(CNN新闻):1GB/1小时, 6TB/年(经压缩) 录像带出租(Blockbuster Video):9TB 科研图书馆(美国会图书馆):全部图书馆数字化20TB 来源:美国伯克利加州大学教授Peter Lyman和Alex Internet公司总裁Brewster Kahle所著《文化制品数字化存档行动纲要》。 信息检索的问题 查找非结构信息有困难 多数数据库在结构化字段上工作 多数商业信息是非结构化的. 报告、电子邮件、来往公函 ... 美国商业每年产生4500亿份文件 波音747文件比飞机重量还重 索引是主观的 索引者之间不一致, 经验统计表明索引者之间仅20% 相同. 作者与索引者之间、检索者与用户之间不一致. 信息超载 信息太多, 需要过滤 检索结果垃圾太多, 有害信息太多 拖曳网 搜索引擎仅在信息海洋表面上拖曳 来源:曾民族先生的有关报告 深海网 来源:曾民族先生的有关报告 深海网 深海网比浅海网大500 倍 95% 深海网是公开的和可免费获取的 深海网内容质量高1000+ 倍 7,500 TB信息量 目前有45,000 浅海网搜索引擎 信息资源组织成为全球性难题 信息发布具有自由性和任意性, 难于控制和管理 分布、分散、无序、无政府、经常变动、无限数量、包罗万象、 真伪并存, 资源信息和非资源信息难于驾御 非规范、非结构 检索查全和查准提出新的挑战 多媒体、多语种、多类型信息的整合提出新的挑战 跨国界数据传递和流动, 带来政治、外交、文化新问题 集成多种(正式和非正式等)交流方式 目前对付挑战的能力有限 以文本信息、显性知识为主 以非结构信息为主 以系统为中心 以信息提供为目的 以相对简单的信息技术开发 以正面效益为衡量标准 第三章 课程的内容框架结构: 信息资源组织模型 信息资源组织系统抽象模型(课程框架) 知识单元 特征提取 特征建库(索引) 资源库 提问单元 提问处理 语义特征:分类/主题/自由词/元数据 语用特征 载体类型 学科内容 应用领域 狭义/传统知识组织(内容管理) 广义/现代知识组织 利用方法 读者 图书馆员 结果处理 读者特征 数字化 数字图书馆 课程内容 信息资源组织的方法 分类法 主题法 元数据方法 知识本体方法 信息资源组织的应用 情报检索 数字图书馆(内容管理) (企业)知识管理 * 符号/数据/信息/文献/知识/智慧/精神 文献一词,在我国最早见于《论语·八佾(音yì,古代乐舞的队列)》,那时对文献的认识是包括历代的历史文件和当时的贤 者。事隔数千年,我们现在的理解与古代不一样,根据我国国家标准《文献著录总则》下的定义是:“记录有知识的一切载体(供记录信息符号的物质材料,称之为 载体材料)”。这就是说,所谓文献,是指文字、图像、符号、声频、视频等作为记录手段,将信息记录或描述在一定的物质载体上,并能起到存贮和传播信息情报 和知识作用的一切载体。这种载体,除了常见的纸张外,还包括甲骨、金石、竹帛以及胶片、磁带、光盘等。 智慧是一种超发散的,非确定性的,非或然的过程。它需要全部的已有的意识层次,并且是特殊类型的人的规划。它能使以前非懂的东西重新理解,是哲学探通术的本质。 * * * * 目录又称书目(似乎含义就狭窄了很多),“它是著录一批相关文献,按照一定次序编排组织而成的一种揭示和报道文献信息的工具。”(彭斐章主编 《目录学教程》 p.1)。这个定义使我很兴奋,我推论出目录是知识(或信息)组织的一种形式和结果。 目编纂就是运用各种手段,对分散的一次文献(原始文献)所含的知识、信息,进行筛选、压缩、整序,揭示其内容,著录其外形特征,进行科学的编排组织,使之转化为有序的、可以传递的二次文献。“

文档评论(0)

duoduoyun + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档