- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
搜索引擎 搜索引擎(Search Engines)是对互联网上的信息资源(主要是网页)进行搜集整理,然后提供查询服务的系统,通常包括信息搜集、信息整理和用户查询三部分,但提供给用户的往往只是一个查询界面。 两类搜索服务 Google Yahoo 网络信息资源的挑战 数量巨大 没有一个搜索引擎能够覆盖万维网的16% 网站; 所有搜索引擎加起来覆盖了万维网的42% 极端异质 信息值不同 长度不同 语法或输入错误 内容错误、过时或不可靠 多种格式 多语种 速度问题 每分钟需要接受15,000 ~ 20,000次查询请求 数字化信息量举例 音乐作品(莫扎特):约100MB 报纸(华尔街杂志):100MB/年(文本) 卡片目录(美国国会图书馆):17GB 广播(WABC) :270GB/年(未经压缩) 网络论坛(Netnews):300GB/年 地区图书馆(加州大学图书馆):1.4TB(图书扫描版) Internet出版(WWW):1997年约4TB 电视(CNN新闻):1GB/1小时, 6TB/年(经压缩) 录像带出租(Blockbuster Video):9TB 科研图书馆(美国会图书馆):全部图书馆数字化20TB 来源:美国伯克利加州大学教授Peter Lyman和Alex Internet公司总裁Brewster Kahle所著《文化制品数字化存档行动纲要》。 信息检索的问题 查找非结构信息有困难 多数数据库在结构化字段上工作 多数商业信息是非结构化的. 报告、电子邮件、来往公函 ... 美国商业每年产生4500亿份文件 波音747文件比飞机重量还重 索引是主观的 索引者之间不一致, 经验统计表明索引者之间仅20% 相同. 作者与索引者之间、检索者与用户之间不一致. 信息超载 信息太多, 需要过滤 检索结果垃圾太多, 有害信息太多 拖曳网 搜索引擎仅在信息海洋表面上拖曳 来源:曾民族先生的有关报告 深海网 来源:曾民族先生的有关报告 深海网 深海网比浅海网大500 倍 95% 深海网是公开的和可免费获取的 深海网内容质量高1000+ 倍 7,500 TB信息量 目前有45,000 浅海网搜索引擎 信息资源组织成为全球性难题 信息发布具有自由性和任意性, 难于控制和管理 分布、分散、无序、无政府、经常变动、无限数量、包罗万象、 真伪并存, 资源信息和非资源信息难于驾御 非规范、非结构 检索查全和查准提出新的挑战 多媒体、多语种、多类型信息的整合提出新的挑战 跨国界数据传递和流动, 带来政治、外交、文化新问题 集成多种(正式和非正式等)交流方式 目前对付挑战的能力有限 以文本信息、显性知识为主 以非结构信息为主 以系统为中心 以信息提供为目的 以相对简单的信息技术开发 以正面效益为衡量标准 第三章课程的内容框架结构:信息资源组织模型 信息资源组织系统抽象模型(课程框架) 知识单元 特征提取 特征建库(索引) 资源库 提问单元 提问处理 语义特征:分类/主题/自由词/元数据 语用特征 载体类型 学科内容 应用领域 狭义/传统知识组织(内容管理) 广义/现代知识组织 利用方法 读者 图书馆员 结果处理 读者特征 数字化 数字图书馆 课程内容 信息资源组织的方法 分类法 主题法 元数据方法 知识本体方法 信息资源组织的应用 情报检索 数字图书馆(内容管理) (企业)知识管理 * 符号/数据/信息/文献/知识/智慧/精神 文献一词,在我国最早见于《论语·八佾(音yì,古代乐舞的队列)》,那时对文献的认识是包括历代的历史文件和当时的贤 者。事隔数千年,我们现在的理解与古代不一样,根据我国国家标准《文献著录总则》下的定义是:“记录有知识的一切载体(供记录信息符号的物质材料,称之为 载体材料)”。这就是说,所谓文献,是指文字、图像、符号、声频、视频等作为记录手段,将信息记录或描述在一定的物质载体上,并能起到存贮和传播信息情报 和知识作用的一切载体。这种载体,除了常见的纸张外,还包括甲骨、金石、竹帛以及胶片、磁带、光盘等。 智慧是一种超发散的,非确定性的,非或然的过程。它需要全部的已有的意识层次,并且是特殊类型的人的规划。它能使以前非懂的东西重新理解,是哲学探通术的本质。 * * * * 目录又称书目(似乎含义就狭窄了很多),“它是著录一批相关文献,按照一定次序编排组织而成的一种揭示和报道文献信息的工具。”(彭斐章主编 《目录学教程》 p.1)。这个定义使我很兴奋,我推论出目录是知识(或信息)组织的一种形式和结果。 目编纂就是运用各种手段,对分散的一次文献(原始文献)所含的知识、信息,进行筛选、压缩、整序,揭示其内容,著录其外形特征,进行科学的编排组织,使之转化为有序的、可以传递的二次文献。“
您可能关注的文档
最近下载
- 2024年10月自考13005软件工程试题及答案.docx VIP
- 三角形内角和教学设计优质课一等奖.pdf VIP
- 英语四六级常见短语及词组固定搭配汇总.pdf VIP
- 2025年自考税收筹划真题答案.docx VIP
- 2024_2025学年广东省广州市黄埔区高一上学期(10月)月考数学试卷【有解析】.pdf VIP
- 2025年中国静脉注射用人免疫球蛋白数据监测研究报告.docx
- 自考树社会学概论真题及答案分析.docx VIP
- 2025-2026学年江苏省无锡市高一上学期10月月考物理模拟试卷含详解.docx VIP
- (高清版)B 3100-1993 国际单位制及其应用.pdf VIP
- 6SE70系列变频器讲解及Drive Monitor调试(内部员工培训).ppt
文档评论(0)