關於關鍵字密度在《搜尋引擎如何對網頁進行排名》中已經提到過,指的是在一個頁面中,關鍵字(keyword)或關鍵欄位(keyphrase)占該頁面中總的文字的比例。
關鍵詞密度對搜尋引擎的優化起到關鍵的作用。
關鍵字詞頻
關鍵字詞頻指的是某個關鍵字在網站頁面中出現的頻率(關鍵字在頁面中出現的次數),關鍵字詞頻從一定程度上反映了該關鍵字與頁面之間的相關性。
在搜尋引擎發展初期,搜尋結果中頁面的排序基本是由關鍵字詞頻所決定的。也就是說,頁面中出現某個關鍵字的次數越多,說明該關鍵字與頁面之間的相關性就越高,因此這個關鍵字在搜尋結果中的排名就越靠前。
這種單純以詞頻決定排序的方式極容易被惡意操縱,從而影響搜尋引擎的使用者體驗。因此,搜尋引擎為了能夠有效地防止網站所有者惡意操控搜尋結果,會去比對頁面中關鍵字出現的頻率與該網頁詞彙量的比例,以此來衡量頁面中的關鍵字詞頻是否合理。
與此同時,搜尋引擎還逐漸引進了諸如關鍵字密度、關鍵字分布及外部連結等相關因素對頁面排序進行制約。
關鍵字密度範圍
為了讓大家能夠更輕鬆地理解關鍵字密度,下面舉一個簡單的例子進行說明。
例如,網站中某個頁面的內容為“搜尋引擎優化”,基於現有的詞典資料,搜尋引擎會將其拆分(搜尋引擎分詞技術,如百度分詞技術)為“搜尋”“引擎”“索引”“優化”“搜尋引擎”,則關鍵字“搜尋引擎”在這個網頁中的密度值為 1/5,即 20%。
通過上述內容,我們基本知道了搜尋引擎對頁面的分詞方法,以及如何計算網站頁面中的關鍵字密度。然而,網站頁面中關鍵字的密度在什麼範圍內才會被認為是與某個關鍵字高度相關的呢?
這個我們通常無從得知,但是搜尋引擎會對若干樣本資料進行綜合分析,最終確定關鍵字密度在哪個範圍內頁面相關性更高,再以此作為衡量網頁中的關鍵字密度是否合理的標準。
需要注意的是,不同的搜尋引擎對於關鍵字密度的判斷方法有所差別,業界公認的合理關鍵字密度一般在 2%~8%。但也不可一概而論,多數網站(尤其是網站首頁)的關鍵字密度都超過這個數值,但並未受到搜尋引擎的處罰,還能獲取很好的排名,如圖1所示。
圖1:C語言中文網首頁的關鍵詞密度