作為一個SEO愛好者,分析網站蜘蛛日志是非常必要的。通過網站日志中的數據記錄,站長可以很好地診斷我們的網站是否處于健康狀態。例如,該博客作者的網站最近遭到了許多黑鏈攻擊,這給網站權重和流量帶來了巨大損失。因此,有必要對網站蜘蛛日志進行分析,通過網站調整正確引導搜索引擎蜘蛛的捕獲
什么是網站日志
通過百科全書,我們也可以知道,所謂的網站日志是指以日志結尾的文件,它記錄了各種原始信息,例如web服務器接收和處理請求以及運行時錯誤。在這里,網站管理員應該注意,文件的后綴是log。只需下載并使用工具進行分析
如何獲取網站日志
不同服務器和虛擬主機上存儲的日志文件的位置存在一些差異,但一般的獲取方法相對簡單。例如,blogger服務器安裝了Pagotapanel,網站日志文件存儲在file-wwlogs文件夾中。找到相應網站的日志文件,然后下載
網站日志分析工具
有很多網站日志分析工具,如在線網站日志工具lager(http://www.loghao.com/)此外,博客作者經常使用光年網站日志分析工具。這些工具幾乎是一樣的。有文件和工具。讓我們來探索如何分析這些網站數據
常見的網站蜘蛛是什么
百度蜘蛛:它代表百度搜索引擎蜘蛛。從上圖可以看出,尹華峰seo博客的搜索引擎爬蟲來自百度,占52%
搜狗蜘蛛:它代表搜狗搜索引擎蜘蛛。雖然訪問量很小,但爬行的總量非常大,這讓博客作者感到可疑。原因是我們網站的一個專欄遭到了攻擊,并為搜狗搜索引擎蜘蛛掛上了大量黑鏈
谷歌蜘蛛:這意味著谷歌搜索引擎蜘蛛需要更多的關注才能成為谷歌SEO的站長
Alexaspider:一個代表網站全球排名的搜索引擎蜘蛛。該爬蟲主要分析網站的流量,統計網站的全球排名。目前,該網站在全球排名610481位
此外,實際上還有其他搜索引擎爬蟲,如雅虎蜘蛛、360蜘蛛等。以上只是對該網站搜索引擎蜘蛛的總結分析。由于服務器剛剛更換,爬行器捕獲和爬網的數據量相對較小,僅供參考。通過日志工具與搜索引擎蜘蛛積極溝通,我們可以進一步分析網站捕獲和狀態碼分析
網站蜘蛛日志分析和解讀
目錄爬行:可以分析網站目錄爬行的數量,了解搜索引擎蜘蛛的愛好。從上圖可以看出,sogouspider主要抓取我的/kjzx/目錄。與其他目錄相比,抓取的數量相對較大,也有例外。所以我去了網站的根目錄查看,發現了帶有黑鏈的腳本文件,這也證實了博主之前的判斷
頁面爬行:頁面爬行量相對穩定。無頁面爬行量大且異常。在這里,博主將不再截圖,但博主發現爬行量最大的頁面是robotsTxt文件,所以站長設置機器人規則也很重要
狀態碼返回的分析和解釋
200代表搜索引擎蜘蛛的成功訪問
04代表頁面無法訪問
01代表頁面跳轉
304代表客戶端已經執行get,但文件沒有更改
500狀態代碼表示服務器遇到錯誤,無法完成請求
403狀態代碼表示服務器拒絕請求
以上是本網站遇到的一些蜘蛛狀態代碼(有關更多狀態代碼,請參閱網站日志中常見HTTP狀態代碼的分析)。網站管理員可以通過查看非200值的狀態代碼并分析這些異常URL路徑,輕松找到網站的癥結所在
網站日志的作用
網站日志分析應該是SEO網站管理員的必要技能。網站日志分析在新舊網站中都扮演著重要角色。通過日志分析,了解網站蜘蛛抓捕頻率、是否被鎖在沙箱中、網站是否被k、發現異常抓捕等
結論:通過對網站蜘蛛日志的分析,SEO站長可以很好地自我檢查和診斷網站是否存在問題。他不僅可以了解網站的健康狀況,還可以通過爬行量進一步了解搜索引擎蜘蛛的愛好,了解網站內容操作的重點,這也可以起到很好的指導作用。