- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
因特网信息服务新模式
[作者] 丁蔚,倪波
[单位] 南京大学信息管理系
[摘要] 本文介绍了因特网信息服务新模式,包括因特网信息系统的特点以及 SE 的缺陷,ASK 理论与领域
分析理论的影响,建立面向用户、面向领域的新型检索模式3 个方面的内容。
[关键词] 因特网,信息服务
网络信息服务以网络信息查询为基础。网络信息查询的特异性在于网络环境下引起的资
源分布化和数字技术带来的信息资源多媒体化[1]。信息检索技术从总体来看向两方面发展:
一是传统信息检索向全文本、多媒体、多载体、多原理等新型信息检索发展,从深度上提高
组织和管理信息资源的能力;二是信息资源的网络化和分布化,从广度上提高组织和管理信
息资源的能力[1]。
针对因特网信息纷繁芜杂的内容形式和组织方式,为了准确、高效地发掘信息资源,人
们对网络信息查询技术进行了深入的研究,开发出性能优越的查询工具,并力求以合理的模
式提供信息服务。在计算机和信息管理人员的共同努力下, 出现了一大批诸如 Archie 、
WAIS 、Veronica 等查询工具。虽然它们使因特网信息服务的友好性、易用性得以加强,但
因仍属于基于文本信息的查询系统,提供信息资源范围有限。万维网搜索引擎(Search
Engine,SE)的出现为网络信息查询带来了生机和活力,Yahool、Infoseek、Lycos 横空出
世, 使网络信息获取方式产生根本变化。SE 以超级文本方式提供世界范围内的多媒体信息
服务,既包括文本,又包括图像、影视和声音信息,彻底改变了过去只靠浏览挖掘信息的情
况,用户可以进行目标明确的检索。
可以说,SE 已经成为目前网络信息系统建设的核心和关键。但是由于其基于传统信息
系统检索的模式,不能完全适应因特网广域信息查询的特点,有不可避免的缺陷。
1 因特网信息系统的特点以及SE 的缺陷
1.1 因特网信息系统的特点
因特网信息系统与传统信息系统不同,具有以下特点。
1)因特网本身的动态性。因特网是一个扁平结构的系统, 没有权威的中央管理机构,
任何人都可以提供信息和服务,其范围、数量都是不可知的。信息的获取由提供驱动向需求
驱动转移。而相对而言,传统信息系统则完全处于管理员的管辖之下,信息的数量、范围、
格式都是明确的。
2)因特网信息的动态性。因特网信息是无管理的,今天可以从某个站点获得的信息,
明天就可能被更改或删除,信息也可能转移于多个站点之间。用户无法判断网上有多少信息
与自己的需求相关,查全率、查准率等评价标准也要重新定义。
3)因特网信息以不同的格式和类型存贮, 导致对信息的处理也不能使用相同的方法。
网络拥有大量的多类型、非规范、跨时空、跨语种的多媒体资源,存贮格式各异,信息内容
特征抽取复杂化,信息查询更加复杂。
e 线图情()2003-12-17
为了提供全方位的信息服务,必须对传统的以集中和规范为特征的数据库资源检索作根
本变革,采取崭新的信息处理方式。为了标示这种区别,国外称传统信息检索为“信息检索”
(Information Retrieval),而称网络信息检索为“信息查询”(Information Searching)。
1.2 基于传统检索方式的SE 的缺陷
目前流行的SE 都是用以下方式工作的:
1)利用Robot 漫游因特网,尽可能多地获得元数据(Meta- information)。
2)对获得的信息利用大量关键词或附加信息进行标引, 存入数据库,向用户提供基于
分类的范畴层次查询引擎(list-based SE )和基于关键字的主题词查询引擎(words-based
SE)。
3)查询者利用分类思想,由总类到子类查询所需信息,或输入一个或多个提问词从数
据库中定位信息,利用返回的 Web 页面反映检索结果,通过点击超链到达信息所在的服务
器。
SE 的缺陷体现在以下几方面:
1)网络信息是大量的、动态的。Robot 只能在由系统管理员确定的一定时间间隔内跟
踪特定信息,不能保证信息的及时更新,产生 “错”链接和 “死”链接。随着网络信息数量
的指数级增长,引擎数据库急剧膨胀,检索速度将会更加不可忍受,如果不能保证创造出更
高效的检索算法,SE 将被人们所遗弃。
2)SE 将信息的收集和查询截然分开。 系统在收集信息时不知道用户究竟需要什么样
的信息;当用户向系统查询时,系统也并不知道哪
您可能关注的文档
最近下载
- DB3205_T1078-2023_人才公寓运营管理与服务规范_苏州市 .docx VIP
- ProjectProposal项目建议书英文模板.docx VIP
- 新媒体写作与运营PPT完整全套教学课件.pptx VIP
- ProjectProposal项目建议书英文模板.pdf VIP
- 城镇燃气工程分部、分项工程划分[1].docx VIP
- 网络教学效果调查与数据分析.docx VIP
- 工程量清单及招标控制价编制服务采购服务质量承诺及保障措施.docx VIP
- 游戏攻略:哥伦布传.doc VIP
- 福建省三明市第二中学2024-2025学年高一上学期期中考试数学试题(A)卷.docx VIP
- 短视频策划与制作(微课版)全套PPT课件.pptx
原创力文档


文档评论(0)