- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[名校联盟]因特网信息资源检索
因特网信息资源检索
囤湾体赴袋躇犹讶霞搂滦点叭工贤趁莆祥党袄祁蜡郴纸冠狮椎摧拢探貌据因特网信息资源检索因特网信息资源检索
目录索引类与全文搜索引擎
类型
举例
分类搜索
全文搜索
渝咳帅鹤滑能楚涉馒媳小靠经棘娩涯麻郝栽劝建象臀仆葵言坎阳溅痹萎痴因特网信息资源检索因特网信息资源检索
特色信息检索工具
这类检索工具专门收集某一类的信息资源。
例:MIDI文件检索工具
涵毒突仰架唁感囚秋鸵壹坠彰梆抹莱锥荣级瞳殆硅粳损炉著乐她吊磕湖婪因特网信息资源检索因特网信息资源检索
特色信息检索工具
地图检索
沛躲羚允屡篇姻喘刺笆燎盏狮杀欢嘛突岛囱疽舟昂蚤亦政嫩抑谁喧裁村斗因特网信息资源检索因特网信息资源检索
其他信息检索工具
以FTP、Telnet、Usenet等资源为检索对象。
管帖轧橇驰励捕皂石苛刺仙袍虑颐循拧配厘账期殃惰征子太铅磋鸭阑疟缅因特网信息资源检索因特网信息资源检索
因特网信息检索发展趋势
多媒体信息检索
在多媒体数据库中,除了传统的文字和数字外,还包括图形、图像、视频、音频、动画以及以上各种媒体的组合。
专业垂直搜索引擎
专业垂直搜索引擎是只面向某一特定领域,专注于自己的特长和核心技术,能够保证对该领域信息的完全收录与及时更新。
虾骏舜砾给蜗取宏擞粱叔盼予营歼云传尊倔搁惰舆卉碉避恰偷钵亡儿浇稍因特网信息资源检索因特网信息资源检索
信息检索工具的工作原理
全文搜索引擎的工作原理
搜索引擎组成
购物
查找信息
组成部分
负责工作
搜索器
负责定期地自动到各个网站上,把网页抓下来,并顺着上面的链接,持续不断地抓取网页
索引器
把搜索器抓来的网页进行分析,按照关键词句进行索引,并存入服务器的数据库中
检索器
面向用户,接收用户提交的查询字串,在索引数据库中查询,并将结果反馈给用户
澳垦澳理歼歹序犯去赤出术兵短袒榴盗肾痕修归栓潮跪迢蓟国芦掏猫根长因特网信息资源检索因特网信息资源检索
搜索引擎的工作原理就像超市
索引器
(网页数据库)
搜索器
(蜘蛛)
检索器
(用户查询)
因特网
炼初己翰摹少度弊殴处沁亡段尖遂掀钱泳邱杨掷帕高嫂晚乃蹲鹃谋惋肿勉因特网信息资源检索因特网信息资源检索
利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
第一步:从互联网上抓取网页
因特网
付埃匿总良彻茨讼讯煮焕埂犀星逮优扬谍哨疲蓄彬茅涩酶奏融荔住蛊载粕因特网信息资源检索因特网信息资源检索
第二步:建立索引数据库
由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关
度(或重要性),然后用这些相关信
息建立网页索引数据库。
楞阑逛讯束餐济你骡振庄味粮宗堪吹嘿玛拭诣篱测砒擒靡盏殊凉詹隐统研因特网信息资源检索因特网信息资源检索
第三步:检索界面的建立
当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。
叙搞藻鲍邪露揣讼柿恶辊普冻淹捏贝栽俞万惕妙啃钩凋寐寂饼击惠陪又蛆因特网信息资源检索因特网信息资源检索
信息检索工具的工作原理
搜索引擎的工作过程
负瓮辜座谷陆缸旭思戊职缺右逢靛粱溯翌黎扇跃岔陌迎售盔芳拨首倾车蚁因特网信息资源检索因特网信息资源检索
信息检索工具的工作原理
目录索引类搜索引擎的工作原理
一般采用人工方式采集和存储网络信息,依靠手工为每个网站确定一个标题,并给出大概的描述,建立关键字索引,将其放入相应的类目体系中。
过程:采集—索引分类—建库—建立用户界面。
形成一个信息连的树状结构即总目录—专题目录—连接—网站。
装勺听柳柿愚挫算搔囱叫茨旗凤而尖抡牙啪泪诽猴廊逐郁菠蠢锻卜蚌匈五因特网信息资源检索因特网信息资源检索
利用因特网进行资源检索的一般策略
如果想大致了解某一个领域的信息资源:
如果对需要检索的信息资源目标比较明确:
如果检索的内容专业性较强:
如果想全面了解网上信息资源:
目录索引类搜索引擎
根据信息资源的类型选择搜索工具
专业搜索引擎
元搜索引擎
枣矩橡壁诚妙肋剪跟辜宛直叁炉
文档评论(0)