- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第9章
网络信息检索与发布
教学目标
通过学习本章内容,读者可以了解网络信息资源的基本概念及种类,掌握网络信息的基本检索方法和信息发布技术,熟悉常用的搜索引擎,培养敏锐的信息意识,增强自学能力和独立研究能力。初步掌握网页设计的编辑技术和网页布局技术。
教学重点和难点
检索词的构造和搜索引擎的使用
网页设计流程
创建站点和网页编辑
网页表格布局和CSS+Div布局
本章小节
4.1
信息概述
4.2
网络信息检索
4.3
4.4
Dreamweaver入门
网页设计基础
信息通常指经过加工的、有一定意义和价值,且具有特定形式的数据。这些数据能反映出客观世界事物的表面现象或内在联系及本质,从而影响信息获取者的行为或决策。从计算机系统的角度来看,数据是信息的载体,而信息则是数据加工的结果。
9.1.1 信息的概念
9.1.1 信息的特性
信息的特性
时效性
多样性
可转换性
可存储性
可处理性
可共享传递性
9.1.2 信息的获取
类 型
举 例
特 点
文献性信息源
报刊、百科书、词典及各类出版物等
以文字形式存储于各种不同的载体上,是目前内容最丰富、使用频率最高的信息源
数据型信息源
统计图、数表、测量数据等
以数值形式存储于各种不同的载体上
声像型信息源
光盘、电话、电影、电视等
以声音或图像形式出现的信息源,它比文字直观,易于理解
多媒体信息源
因特网、数码相机、光盘等
集声音、文字、图像、数据等多种媒介为一体
9.1.3 信息的发布
1.网络信息发布的常见方式
(1)发布网站
(2)博客、微博、播客等
(3)论坛和新闻组
(4)即时通信
(5)电子邮件
2.发布信息须遵守的道德规范
① 不能不经授权随意转载别人的文章或资料,侵犯别人的知识产权。
② 不得发布攻击、谩骂别人的言论;不得发布黄、赌、毒方面的信息。
③ 不得向别人发送垃圾邮件、带病毒的邮件或者诈骗信息。
④ 不得发布有损国家形象的信息,不得泄露国家机密。
近些年,网络上的数据信息呈现几何级数增长。海量信息给人们带来便利的同时,信息的真假问题也不断困扰着用户,垃圾信息和冗余信息不但浪费资源而且也消耗用户的精力和时间。
网络上的数据信息具有重要的价值并蕴含大量的知识,但是各种各样杂乱无章的数据信息集中在一起没有进行相关分类、整理,对现实中的实际应用并没有任何帮助甚至造成负担。
因此,在信息检索领域,从海量数据中检索用户需求信息成为一个研究热点。
9.2 网络信息检索
9.2.1 网络信息资源的特点
9.2.2 网络信息资源的获取途径
(1)用搜索引擎查找网络资源
(2)寻找网络免费学术资源
① 虚拟图书馆
② 开放获取资源OA
中国科技论文在线( )
国家科技图书文献中心(/)
科学数据共享工程(/gxgc.aspx)
百度文库(/pro/index)
豆丁(/)
③ 免费专利资源
9.2.3 搜索引擎的分类
(1)全文搜索引擎(Full Text Search Engine)
全文搜索引擎是指程序从互联网提取各个网站的信息,建立网页数据库。用户搜索时检索与用户查询条件尽量匹配的相关数据库记录,然后根据关联度高低等原则将结果返回给用户。国外全文搜索引擎的代表是谷歌,国内全文搜索引擎的代表是百度。
(2)目录搜索引擎(Search Index/Directory)
相比于全文搜索引擎,目录搜索引擎采用半自动方式或者是人工方式收集网站,将网站以主题目录形式置于事先确定的分类框架中。严格意义上看,目录搜索引擎不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。在中国目录搜索引擎中最具有代表性的就是hao123。
(3)元搜索引擎(Meta Search Engine)
元搜索引擎又称多搜索引擎,其工作机制是在用户输入相关关键词之后,相关搜索引擎程序在多个搜索引擎中进行相关搜索,并将结果呈现给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。
(4)其他搜索引擎
除了上述搜索引擎外,还有垂直搜索引擎、集合式搜索引擎、门户搜索引擎等,不同搜索引擎对同一搜索关键词会返回不同的结果,各有各的特点。
9.2.3 搜索引擎的关键技术
(1)机器人(Robot)技术
所谓网络机器人就是一个在网络上检索文件且自动跟踪该文件的超文本结构并循环检索被参照的所有文件的程序。网络机器人工作步骤如下:
① 机器人程序在URL列表中提取一个URL并对相关网页进行分析;
② 将网页分析得到的相关信息存储到数据库中;
③ 从得到的相关信息中提取指向其他页面的URL并添加到URL列表中。
重复以上3个步骤,直到没有新的URL指向其他页面。最终将得到的索引发送给客户。
(2)索引技术
索引技术是
文档评论(0)