Solr搜尋引擎基礎


搜尋引擎是指一個龐大的網際網路資源資料庫,如網頁,新聞組,程式,影象等。它有助於在全球資訊網上定位資訊。

使用者可以通過以關鍵字或短語的形式將查詢傳遞到搜尋引擎中來搜尋資訊。 搜尋引擎然後搜尋其資料庫並向使用者返回相關連結。

比如下面常用到兩個搜尋引擎 -

  1. 百度

  2. 谷歌

搜尋引擎元件

一般來說,搜尋引擎有三個基本元件,如下所列 -

  • Web爬蟲 - Web爬蟲也稱為蜘蛛或機器人。 它是一個收集網路資訊的軟體元件。
  • 資料庫 - Web上的所有資訊都儲存在資料庫中。它們包含大量的Web資源。
  • 搜尋介面 - 此元件是使用者和資料庫之間的介面。它幫助使用者搜尋資料庫。

搜尋引擎是如何工作的?

任何搜尋應用程式都需要執行以下一些或全部操作。

步驟 標題或名稱 描述
1 獲取原始內容 任何搜尋應用程式的第一步是收集要進行搜尋的目標內容。
2 構建文件 從原始內容構建文件,讓搜尋應用程式可以很容易地理解和解釋。
3 分析文件 在索引開始之前,將對文件進行分析。
4 索引文件 當文件被構建和分析後,下一步是對它們建立索引,以便可以基於特定鍵而不是文件的全部內容來檢索該文件。索引類似於在書開始頁或末尾處的目錄索引,其中常見單詞以其頁碼顯示,使得這些單詞可以快速跟蹤,而不是搜尋整本書。
5 用於搜尋的使用者介面 當索引資料庫就緒,應用程式可以執行搜尋操作。 為了幫助使用者進行搜尋,應用必須提供使用者介面,使用者可以在其中輸入文字並啟動搜尋過程
6 構建查詢 當使用者做出搜尋文字的請求,應用程式應該使用該文字來準備查詢物件,然後可以使用該查詢物件來查詢索引資料庫以獲得相關的細節。
7 搜尋查詢 使用查詢物件,檢查索引資料庫以獲取相關詳細資訊和內容文件。
8 渲染結果 當收到所需的結果,應用程式應決定如何使用其使用者介面向使用者顯示結果。

看看下面的插圖。 它顯示了搜尋引擎功能的總體檢視。

除了這些基本操作之外,搜尋應用還可以提供管理 - 使用者介面以幫助管理員基於使用者簡檔控制搜尋的級別。搜尋結果分析是任何搜尋應用程式的另一個重要和高階方面。