Solr搜索引擎基礎
搜索引擎是指一個龐大的互聯網資源數據庫,如網頁,新聞組,程序,圖像等。它有助於在萬維網上定位信息。
用戶可以通過以關鍵字或短語的形式將查詢傳遞到搜索引擎中來搜索信息。 搜索引擎然後搜索其數據庫並向用戶返回相關鏈接。
比如下面常用到兩個搜索引擎 -
百度
谷歌
搜索引擎組件
一般來說,搜索引擎有三個基本組件,如下所列 -
- Web爬蟲 - Web爬蟲也稱爲蜘蛛或機器人。 它是一個收集網絡信息的軟件組件。
- 數據庫 - Web上的所有信息都存儲在數據庫中。它們包含大量的Web資源。
- 搜索接口 - 此組件是用戶和數據庫之間的接口。它幫助用戶搜索數據庫。
搜索引擎是如何工作的?
任何搜索應用程序都需要執行以下一些或全部操作。
步驟
標題或名稱
描述
1
獲取原始內容
任何搜索應用程序的第一步是收集要進行搜索的目標內容。
2
構建文檔
從原始內容構建文檔,讓搜索應用程序可以很容易地理解和解釋。
3
分析文檔
在索引開始之前,將對文檔進行分析。
4
索引文檔
當文檔被構建和分析後,下一步是對它們建立索引,以便可以基於特定鍵而不是文檔的全部內容來檢索該文檔。索引類似於在書開始頁或末尾處的目錄索引,其中常見單詞以其頁碼顯示,使得這些單詞可以快速跟蹤,而不是搜索整本書。
5
用於搜索的用戶接口
當索引數據庫就緒,應用程序可以執行搜索操作。 爲了幫助用戶進行搜索,應用必須提供用戶接口,用戶可以在其中輸入文本並啓動搜索過程
6
構建查詢
當用戶做出搜索文本的請求,應用程序應該使用該文本來準備查詢對象,然後可以使用該查詢對象來查詢索引數據庫以獲得相關的細節。
7
搜索查詢
使用查詢對象,檢查索引數據庫以獲取相關詳細信息和內容文檔。
8
渲染結果
當收到所需的結果,應用程序應決定如何使用其用戶界面向用戶顯示結果。
看看下面的插圖。 它顯示了搜索引擎功能的總體視圖。
除了這些基本操作之外,搜索應用還可以提供管理 - 用戶界面以幫助管理員基於用戶簡檔控制搜索的級別。搜索結果分析是任何搜索應用程序的另一個重要和高級方面。