电脑常识Homework向阳小站.DOCVIP

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电脑常识Homework向阳小站

搜索引擎其實就是一個資料庫系統 搜索引擎的工作原理大致可以分為: 1.搜集資訊:搜索引擎的資訊搜集基本都是自動的。搜索引擎利用稱為網路蜘蛛(spider) 的自動搜索機器人程式來連上每一個網頁上的超連結。機器人程式根據網頁鏈到其他中的超連結,就象日常生活中所說的「一傳十,十傳百……」一樣,從少數幾個網頁開始,連到數據庫上所有到其他網頁的連結。理論上,若網頁上有適當的超連結,機器人便可以遍歷絕大部分網頁。 2.整理資訊:搜索引擎整理資訊的過程稱為「建立索引」。搜索引擎不僅要保存搜集起來的資訊,還要將它們按照一定的規則進行編排。這樣,搜索引擎根本不用重新翻查它所有保存的資訊而迅速找到所要的資料。想象一下,如果資訊是不按任何規則地隨意堆放在搜索引擎的資料庫中,那麼它每次找資料都得把整個資料庫完全翻查一遍,如此一來再快的電腦系統也沒有用。 3.接受查詢:用戶向搜索引擎發出查詢,搜索引擎接受查詢並向用戶返回資料。搜索引擎每時每刻都要接到來自大量用戶的幾乎是同時發出的查詢,它按照每個用戶的要求檢查自己的索引,在極短時間內找到用戶需要的資料,並返回給用戶。目前,搜索引擎返回主要是以網頁連結的形式提供的,這些通過這些連結,用戶便能到達含有自己所需資料的網頁。通常搜索引擎會在這些連結下提供一小段來自這些網頁的摘要資訊以幫助用戶判斷此網頁是否含有自己需要的內容。 搜尋引擎的種類 搜尋引擎依據其運作方式主要分為三種,包括全文搜尋(Full Text Search)、目錄搜尋(Search Index / Directory)及Meta搜尋(Meta Search Engine)。 全文搜尋(Full Text Search) 主要透過網際網路擷取每個網站的網頁資訊透過蜘蛛(Spider)或網路機器人(Robot)等程式建立資料庫,使用者只要進行查詢或檢索,將按照一定的規則進行排序,同時將搜尋結果呈現給使用者,這類網站國外以Google、Altavista及Teoma等為代表,中國地區則以百度(Baidu)、台灣地區以Openfind為代表。 全文搜尋 在分類部分提到全文搜尋從網站擷取資訊建立網頁資料庫的概念,其擷取的方式主要分為兩種,一種是定期搜索,即每隔一段時間(例如Google),搜尋引擎自動執行『蜘蛛』程式,對一定IP位址範圍內的網站進行擷取,一旦發現新的網站(網頁),它會自動擷取網站的資訊和網址納入資料庫。 另一種是網站主動向搜索引擎提交網址及相關資訊,搜尋引擎在一定時間內(幾天到數月不等)向你的網站派出『蜘蛛』程式,掃描你的網站(網頁)並將有關資訊存入資料庫。但近年來搜尋引擎的規則不段演變,主動提交網址無法保證提交的網站可以進入搜索引擎的資料庫,因此最有效率的方式就是儘量多獲得一些外部連結,藉由定期搜索和主動提交兩種方式交叉掃描,提高被搜尋引擎找到的機會。 當使用者以關鍵字查詢資料時,搜尋引擎將在資料庫中搜尋符合使用者查詢要求的資訊,並透過一套複雜的運演算法則(主要依據關鍵字匹配度、被點選頻率、連結成功率等)計算出每個網頁相關度及排名順序。 目錄搜尋(Search Index / Directory) 目錄搜尋嚴格來說並不算是真正的搜尋引擎,主要提供依照目錄進行的分類網站連結列表。使用者可以不用關鍵字(Keywords)查詢,僅靠分類目錄也可找到需要的資訊。這類網站以Yahoo奇摩為代表,中國地區的蒐狐、網易等均屬於這一類。 目錄搜尋 全文搜尋屬於自動檢索(使用程式自動執行),而目錄搜尋則完全依賴人工作業。使用者提交網站後,目錄編輯人員會親自瀏覽你的網站,然後根據一套判斷標準甚至依據編輯人員的主觀印象,決定是否接納你的網站。 其次,全文搜尋的搜索引擎在收錄網站時,只要網站本身沒有違反相關的規定,一般都能夠成功登錄。而目錄搜尋對網站的要求則高得多,有時即使登錄多次也不一定成功。 此外,在登錄全文搜尋的搜索引擎時,我們通常不用去設定分類,而登錄目錄搜尋時則必須將網站放在一個最合適的分類或稱為目錄(Directory)之下,而這些分類通常又有許多更細的子分類,因此使用者在選擇分類時,需要更為謹慎。 目錄搜尋的搜尋引擎要求登錄用戶必須自行填寫網站相關資訊,而且還有各種各樣的限制。更過分的是如果編輯人員認為你提交網站的分類或網站資訊不合適,編輯人員可隨時對進行調整,並且事先不會知會用戶。 目前,全文搜尋的搜索引擎與目錄搜尋有相互融合的趨勢。原來一些純粹的全文搜尋引擎現在也提供目錄搜索,如Google。而像 Yahoo 這些原本使用目錄搜尋的搜尋引擎則透過與Google等全文搜尋的搜索引擎合作,解益擴大搜索範圍。 Meag搜尋(META Search Engine) 這類搜尋主要可以同時在多個搜尋引擎上進行搜尋動作,同時將搜尋

文档评论(0)

wumanduo11 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档