前面搜尋引擎完成了對頁面的分析,將頁面以唯一關鍵詞的形式進行了重新組合,接下來進入頁面排序的環節。
頁面排序的環節實際上是由使用者配合來完成的。當使用者在搜尋引擎中輸入關鍵詞進行查詢時,搜尋引擎便開始了頁面排序的工作。我們知道,任意輸入一個關鍵詞就可以在搜尋引擎中找到很多網頁,這些網頁的先後順序是怎樣產生的呢?影響頁面排序的因素有哪些?
實際上,決定頁面排序的因素很多,如頁面相關性、連結權重及使用者行為。
1. 頁面相關性
頁面相關性主要和關鍵詞有關,包含以下幾個方面。
關鍵詞匹配度
我們注意到在全文搜尋引擎中,一般情況下搜尋引擎列表中都會包含我們所輸入的關鍵詞。當我們輸入關鍵詞進行查詢時,搜尋引擎會首先檢查網頁中是否有該關鍵詞,這是基礎條件。
關鍵詞詞頻(密度計算)
搜尋引擎為了能夠有效地防止網站所有者惡意操控搜尋結果,會去比對頁面中關鍵詞出現的頻率與該網頁詞彙量的比例,以此來衡量頁面中的關鍵字詞頻是否合理。
過高或者過低都不好,最恰當的頻率一般認為是
2%~8%,這是業界公認最優關鍵詞密度區間值。
關鍵詞密度是指該關鍵字出現的次數所占字元數與該網頁總詞彙量所占字元數的比例。
關鍵詞分布
關鍵字在頁面中出現的位置會影響頁面的排序。一般認為頁面權重的遞減順序是
左上>右上>左>右>左下>右下
。
關鍵詞的權重標籤
權重可以理解為重要性。權重標籤如<b>、<i>、<em>、<h1>至<h6>等,這些標籤使得標籤內的文字不同於其他文字,搜尋引擎會給予相應權重提升。
2. 連結權重
連結主要分為內部連結和外部連結兩種形式,是在製作網站頁面時用來關聯相關資訊的,主要用來告知使用者所連結頁面的重要程度。
對於搜尋引擎而言,連結是用來證明頁面與頁面之間的關聯性、相關性或重要性。比如,某一個頁面得到的連結越多,在某種程度上就反映了該頁面的重要性,搜尋引擎給予的重視程度就會越高。
內部連結
網站內部頁面與頁面之間的相互連結關係,一般首頁的權重最高。在同等情況下,如果有兩個網站的首頁和內頁進行比較,一般首頁會排在內頁前面。
外部連結
網站與站外頁面之間的連結關係,通俗的說法叫作“外連”。外連的數量、品質、相關性都會影響頁面排序。
在頁面相關性上,谷歌比百度更為嚴格,比如你的網站是做 IT 的,結果你去連結了很多機械化工類的網站,這時搜尋引擎會很不喜歡,甚至會認為你惡意新增外部連結。
如圖1所示,網頁1與網頁2之間的連結關係可以稱為“內部連結”或“友情連結”,而網頁3與網頁2之間的連結關係則是“外部連結”(網頁3是網頁2的外部連結)。
圖1:頁面連結關係