基于Internet信息资源开发利用.docVIP

下载本文档

2
0
约4.24千字
约 10页
2018-05-25 发布于福建
举报
版权申诉

基于Internet信息资源开发利用.doc

1、本文档共10页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Internet信息资源开发利用

基于Internet信息资源开发利用　　 [摘要]本文从Internet上信息资源的重要作用出发,对其开发利用的必要性、技术、方法进行较为深入的论述,并提出相应对策。　　[关键词]Internet 信息资源开发利用　　　　一、网上信息资源开发利用的必要性　　网上信息资源又名网络信息资源,内容和信息都十分丰富,是集文字、图像、声音、视频为一体的多媒体信息。其包括超文本信息和超媒体信息。它们按非线性文本组织模式,将信息单元储存于节点,通过含URLdizhi地址的链接体现各节点之间的概念逻辑关系,从而形成网状结构。既可按线性顺序查阅,又可跳跃式浏览,与实体文献资源相比,具有如下的特点。　　1.多样性　　网上信息资源包括馆藏目录、电子书刊、各种类型的数据库、资源导航及搜索引擎、电子公告等。并以超级链接的方式将文字、图像、语音和视频信息链接起来,形成一个丰富多彩的网络资源。　　2.无序性　　网上信息以超文本方式而构成立体网状的形式,缺乏统一的控制,呈分散无序状态,可以根据节点任意跳动,而实体文献信息资源则自成体系,呈线性方式。　　3.开放性　　网上信息是开放、相关联的,可以通过链接任意检索信息。我们知道,通过internet,任意信息都可以传播到世界各个地方,只要将计算机连接在网络上,用户就可以快速得到这些信息。　　4.动态性　　网上信息资源跨地区分布,高速度传输,更新淘汰周期短,变化快、不稳定,呈高度动态性。由于网上信息资源从本质上改变了信息的创造交流和获取的方式,完全抛弃了传统的出版概念,实现了无纸化的出版,信息呈现很强的时效性。　　5.互动性　　网上信息资源具有很强的互动功能,可以形成广泛的论坛氛围,有关专家可以就某一专题开设电子论坛,网上直接反馈用户信息,参与交流讨论。　　6.增值性　　网上信息资源开发与建设的最终目的是服务。用户在网上利用各种手段查找所需的信息内容,在这一过程中信息被反复利用,不但不会导致网上信息资源损耗,反而可使信息增值。　　由此可见,网络信息资源使实体文献信息资源在内容上和形式上有了很大的变化,这个巨大的信息资源库涵盖了不同学科、不同领域、不同地域、不同语言的信息资源,具有较大的灵活性。图书馆作为科研服务机构之一,不懂得如何有效地开发利用网络信息资源,就会失去对网络信息的“拥有”与“服务”。因此,网上信息资源的开发利用是实现信息价值转换一种典型的社会化智能活动。　　二、网上信息资源的开发技术　　1. push技术　　传统的信息获取方式是基于Client/server模式,主要采用拉取(pull)的技术挖掘采集信息。但随着网上信息资源的丰富和多元化,这种方式已不能满足用户快速准确地获取信息的要求,引入了push技术,作为internet的一种新技术,提出了新的服务模式,即核心点放在服务方,不需要用户的请求,主动将信息送到用户方,在信息发布获取应用中它表现为push服务器自动搜集用户感兴趣的信息,并将其定期地传送给用户。其表现形式为:web服务器扩展;客户代理方式;Push服务器方式。　　2.WWW信息挖掘技术　　WWW的数据信息挖掘,指从大型数据库的数据中提取出用户感兴趣的文本型知识,这些知识是隐含的、事先未知的、潜在的有用的信息。而网上文本信息挖掘是在已知的数据样本基础上,得到数据对象词的内在特性.并以此为依据在网络上进行有目的的信息提取。这种信息挖掘能自动地提取相关文献之间的有价值的关系知识,并将这些知识以可视的、动态改变的方式反馈给用户。可视方式为用户提供了以直观的易于快速理解的知识掌握途径,而动态改变的方式则满足了用户的及时性要求。它由特征提取、源信息采集、特征匹配三部分组成。特征提取负责根据一定的算法和策略,从现有的样本文档中提取出其内在的特征,即进行挖掘目标的特征提取;源信息采集负责从WWW上选择下载原始文档,这部分工作一般由多个具有一定启发策略的Robot (Robot是一个能沿着Web页面中的超链接进行自动漫游,并通过HTTP等标准协议读取漫游到页面的程序)完成;特征匹配是利用挖掘目标特征判断源信息的相似度,即进行相关信息的提取。　　3.联机分析处理技术　　首先,联机分析处理 (OLAP)与数据挖掘 (DM)是基于数据仓库 (数据库)技术而发展起来的信息分析与挖掘工具,在实际应用中各有侧重。前者是验证型的,后者是挖掘型的。OLAP建立在多维视图的基础上,重在根据已有的模式将直接源自数据仓库中的不同信息源的大量相关信息联系起来,以给分析人员一个清晰、一致的视图。DM建立在各种信息源的基础上,重在发现隐藏在大量原始数据深层中的对用户有用的模式。被抽取的即知识,具备可靠、新颖、有效、易于理解的特点