關鍵詞是網站優化的核心概念之一。在網站優化實踐中,圍繞關鍵詞進行了大量的工作。本文試圖從搜索技術原理與網站優化實踐相結合的角度,總結SEO內容頁關鍵詞布局的具體登陸方法
1.網站優化內容頁的關鍵詞應該如何布局。介紹搜索引擎的技術原理
搜索引擎的核心底層技術是將用戶的查詢詞切割成自然語言中有意義的短語,然后從索引數據庫中找到包含全部或部分短語的內容并返回結果
正常的搜索思維是提取關鍵字并找出內容是否包含關鍵字。假設您要從序列號為1-10的10個頁面中搜索包含“關鍵字布局”的頁面。在10頁全文中搜索“關鍵字布局”一詞,并返回包含該詞的頁面序列號。但是,如果你必須搜索數百萬頁,速度會非常慢,所以我們發明了反向索引的想法。(下圖中的數據不是實際數據,僅供說明)
僅此一點不足以對搜索結果進行排序。不,關鍵字出現在網頁上的次數越多,它就越能代表網頁的特征。前提是過濾掉停止詞(停止詞幾乎是每個網頁上的詞,但不能表達任何特定的含義,如“de”、“yes”、“Le”等)。如果我們可以將網頁中出現的關鍵字的頻率信息添加到反向索引表(縮寫:wordfrequencytf),我們就可以對網頁進行排序。如下圖所示:當我們的查詢詞分為“關鍵字1”和“關鍵字2”時,相關頁面可以按照(3,5,1,2)進行排序;假設我有兩個頁面1和2。倒排指標信息如下:
我們搜索“如何布局關鍵字”,搜索關鍵字為“關鍵字”、“如何”和“布局”。其中,“關鍵字”、“方式”和“布局”出現兩次,分別在頁面上出現兩次和兩次,共6次;在第二頁上,“如何”和“布局”出現了七次。根據上述邏輯,搜索結果的最終排名為(2,1),這顯然不是一個理想的排名結果。第2頁的主題顯然是關于“如何布局”。此時,有必要引入反向文檔頻率索引(IDF)來解決這個問題
關鍵字位置信息也是一個關鍵點。一般認為,標題中的關鍵詞比文本中的相同關鍵詞更能反映網頁的主題特征。這就是為什么H標簽如此重要。搜索引擎還可以根據代碼布局和噪聲比(如停止詞的頻率)確定導航、文本、側欄等的位置。將位置信息標記在倒排索引列表中,參與排序決策
此外,還有其他常用的技術方法,如:兩詞索引/短語索引,“如何布局關鍵詞”不需要分為三個短詞,但也可以分為“關鍵詞布局”、“如何布局”、“如何布局”等;結合查找相關單詞,如“關鍵字”的“關鍵字”和“如何”以及“關鍵字”的“如何”;當然,在實踐中,大型現代搜索引擎的反向索引模型要復雜得多,還有許多其他因素(關鍵因素之一是超鏈接分析)涉及排序算法。這些算法在空間和作者級別受到限制,因此無法縮放
如何放置關鍵字
標題中必須有關鍵字,但不可能有完整的問題
由于搜索引擎會將查詢詞分為n個以上的單詞、雙單詞和短語,并添加相關單詞將查詢合并到查詢中,標題中的關鍵字不一定是完整的問題,通常是“哪個公司更適合做XXX”。標題不一定需要完整的單詞。即使標題包含完整的句子,也與任何其他完整的句子不匹配。一個高質量的網頁通常可以匹配數百個長尾關鍵字。顯然,標題不能包含所有這些內容。標題的另一個重要作用是吸引點擊率,這也是排名的一個因素。但核心詞“XXX”、“good”和“company”必須出現。