- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 四 讲 网络信息资源检索及利用学术论文写作 1、网络信息资源 定义 见p227 类型 文件、数据库、主题目录、超媒体 相关概念 网页、浏览器、协议 2、网络信息资源检索 网络资源获取途径之一:网络地址 一个城市如果没有街道、门牌号,要找到一个地方很难,网络也如此。 在国际互联网上有成千百万台主机,为了区分它们,给每台主机都分配了一个专门的“地址”作为标识,称为IP地址。每个IP地址的长度为32位(bit),每段数字范围为1~254Bit,段与段之间用小数点分隔。如 由于IP地址是数字型的,使用起来不方便,于是人们又发明了另一套字符型的地址方案,即域名地址。入网的每台主机都具有类似于下列结构的域名:如, 检索到某一信息资源,往往有许多相关链接、推荐连接、热点连接等,顺链而下,可以查找到许多相关有价值信息 网络资源获取途径之二:网络导航 网络导航就是通过一定的技术手段,为网站的访问者提供一定的途径,使其可以方便地访问到所需的内容。 相当于传统图书馆信息部门的目录索引。 网络导航有许多类,重点学科导航是其中一类。如各高校重点学科导航,北大、清华。 网络资源获取途径: ——途径之三:搜索引擎 搜索引擎(Search Engine) 是一个对互联网上的信息资源进行搜集整理,然后供用户查询的系统。 搜索引擎的工作原理 工作原理: 抓取网页 每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。 处理网页 搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。 提供检索服务 用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。 。 。 优点 :信息量大;信息更新速度快;方便普通用户使用。 缺陷:信息噪音较大。 检索功能 1、词语检索 1)简单检索(Simple Search):指输入一个单词(关键词) 2)词组检索(Phrase Search):指输入两个单词以上的词组(短语)现有的搜索引擎一半都约定把词组或短语放在引号“”内表示 。 3)语句检索(Sentence Search):指输入一个多词的任意语句。 2、目录检索 3、高级检索 搜索引擎的类型 按照工作方式的不同 主题引擎 适用于专指度较高,内容要求比较新的课题。 目录引擎 适用于学科调研的场合 多元引擎 。 主题引擎又称基于Robot的搜索引擎。这种引擎的信息主要为网页,通过程序自动地收集处理和提供信息是主题引擎的特点 。 百度、Google 目录引擎又称目录指南型搜索引擎。目录引擎的信息大多面向网站,是依靠专职编辑或志愿人员人工建立起来的。 Yahoo、搜狐 、新浪 多元引擎又称元搜索引擎 国外多元搜索引擎的代表 Dogpile () Search() 国内的代表是万纬搜索引擎() 搜索引擎使用技巧 搜索引擎的选择 使用搜索引擎的关键技术 细化检索、合适的检索词、提问具体化、 避免使用禁用词 注意阅读搜索引擎的帮助信息 检索策略的调整 搜索引擎选介 Google的检索文本框中可以任意输入中、英文检索词。检索对象类型选择设置在检索文本框的上方,分为所有网页、图片、视频和音乐等。系统默认为网页搜索。 逻辑与(AND)限制关系的,应直接使用空格。 逻辑或(OR)扩展关系的需使用大写英语字母“OR” 逻辑非(NOT)剔除关系的使用减号“-”。 Google不支持截词符,只能做精确查询。如果在检索词后紧跟有“*”或者“?”,系统会将其忽略掉。另外,Google不区分英文字符大小写。如果需要检索词组,需要对词组使用双引号。 查找非HTML文件:可以支持13种非HTML文件的搜索,如PDF, DOC, PPT, XLS, SWF。 例如 查找doc文本文件,只需搜索“关键词 filetype:doc”即可。 搜索的关键字包含在url链接中 inurl:语法表示返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。 示例:查找midi曲“沧海一声笑”。 搜索:“inurl:midi “沧海一声笑” 搜索的关键字包含在网页标题中 示例:查找日本明星藤原纪香的照片集。 搜索:“intitle:藤原纪
您可能关注的文档
最近下载
- 自动控制原理(第七版)课后习题答案解析.pdf
- 事件与概率(古典概率、条件概率、全概率公式、贝叶斯公式)小题综合解析- 十年(2015-2024)高考真题数学分项汇编(全国).pdf VIP
- (2025)小学生诗词大会竞赛试题及标准答案.docx VIP
- 临建工程施工组织设计.docx VIP
- 儿童吉兰-巴雷综合征谱系疾病与抗糖脂抗体相关性研究进展 .pdf VIP
- 2025年钛铁项目建设总纲及方案.docx
- AB-罗克韦尔PowerFlex755变频器操作说明.pdf
- 幼儿园小班科学活动《颜色变变变》含课件.pptx VIP
- 2025诗词大会精选100题题库(含答案).docx VIP
- 小学诗词大会精选100题题库(含答案).docx VIP
文档评论(0)