網際網路的迅速發展和廣泛普及導致網上資訊爆炸性增長,資源內容幾乎涉及所有領域,已經成為知識、資訊的集合體,是人們獲取資訊的基本工具。
在網際網路上進行瀏覽和檢索就好比進入世界上最大的圖書館,這個圖書館裡的書刊、雜誌、廣告、新聞及各種形式的文獻資訊應有盡有,如果這些資訊能被有效地利用,那麼網際網路將是一個巨大的資訊寶庫。但是這些資訊沒有規律地排放著,沒有一個中心目錄將這些資訊組織起來。
正是因為網際網路資源既豐富又分散且處於無序狀態,使得人們在網上查詢自己所需的資訊並非易事。這時為滿足眾人資訊檢索的需求,搜尋引擎便應運而生。
搜尋引擎是什麼?
搜尋引擎(Search Engine)是指在一定的策略、規則指導下,運用特定的計算機程式蒐集網際網路上的資訊,在對資訊進行組織及處理之後,為使用者提供檢索服務,並將使用者檢索相關的資訊展現給使用者的系統。
搜尋引擎由搜尋器、索引器、檢索器及使用者介面 4 部分組成:
-
搜尋器的作用是在網際網路海洋中漫遊,負責發現和蒐集資訊;
-
索引器的作用是分析理解搜尋器搜尋到的資訊,並從中提取出索引項,用於表示文件及生成文件庫的索引表;
-
檢索器的作用是根據使用者所查詢的關鍵字資訊在索引庫中快速檢索出文件,並對文件與查詢關鍵字的相關度進行評價,然後按照一定的規則排序反饋給使用者;
-
使用者介面的作用是輸入和顯示使用者的查詢結果。
通常我們所使用的就是使用者介面,也就是搜尋引擎的功能介面及結果介面。如圖1所示為百度搜尋引擎的功能介面。
圖1:百度搜尋引擎的功能介面