對于那些從事搜索引擎優(yōu)化的人來說,他們都知道網(wǎng)站日志文件的分析在整個搜索引擎優(yōu)化工作中非常重要。一些SEO用戶可能會說“無用”??梢钥闯?,技術(shù)水平參差不齊。許多優(yōu)化器充其量只是外部鏈發(fā)布者或編輯。他們遠離整個SEO帖子,甚至沒有入門級,但他們認為自己屬于SEO,更不用說博客分析是SEO工作的基礎,尤其是在大中型網(wǎng)站。阿里巴巴前搜索引擎優(yōu)化主管郭平曾表示,沒有博客分析的搜索引擎優(yōu)化是一個“局外人”,這很諷刺
日志分析和流量軟件分析的區(qū)別:
從SEO的角度來看,他們的觀點是一樣的:日志分析和流量軟件分析可以分析各種流量、訪問頁面、關(guān)鍵字數(shù)據(jù),等等
區(qū)別:
通用流量分析軟件不能分析搜索引擎爬蟲數(shù)據(jù)
通用流量分析軟件不能分析錯誤的鏈接和其他數(shù)據(jù)
以下網(wǎng)站日志分析能給SEO帶來什么
分析網(wǎng)站日志可以解決網(wǎng)站渠道收集不平衡的問題
作者在企業(yè)做SEO工作時,企業(yè)運營總監(jiān)(主要負責網(wǎng)站seo)將向作者咨詢網(wǎng)站未升級的原因,因此他將對網(wǎng)站進行初步瀏覽和檢查。我不認為我在運營的各個方面都有和我的同事一樣的理由。我會要求他公布搜索引擎最近幾天捕獲的網(wǎng)絡日志記錄
通過對網(wǎng)站日志數(shù)據(jù)的分析,幾分鐘內(nèi)就能找到網(wǎng)站收集問題的根本原因。事實證明,百度蜘蛛每天80%的抓取量分布在兩個渠道下,但這兩個渠道的數(shù)據(jù)很少。與其他渠道相比,每天抓取數(shù)據(jù)量大、內(nèi)容更新頻繁的重要渠道不到10%,有的甚至抓取幾次。經(jīng)過分析,原來的百度蜘蛛在兩個渠道中都有一個“黑洞”,抓取得太多,也就是說,這是一個死循環(huán),消耗了大量資源,導致網(wǎng)站渠道之間的網(wǎng)頁收集不均勻,內(nèi)容大的網(wǎng)頁少之又少,由于百度蜘蛛很少抓取
定期分析網(wǎng)站日志將對網(wǎng)站優(yōu)化和排名起到突飛猛進的作用
無論是百度還是谷歌,他們都通過編程技術(shù)模式下載網(wǎng)頁,并通過多線程技術(shù)處理數(shù)億個網(wǎng)頁爬行問題。因為程序會有漏洞,沒有完美的技術(shù),網(wǎng)頁端的HTML代碼也沒有標準化,幾乎沒有一個網(wǎng)頁完全符合W3C標準。此外,網(wǎng)頁加載速度導致的字節(jié)下載截斷會導致搜索引擎過度重復抓取單個網(wǎng)頁或某些特征網(wǎng)頁,從而影響網(wǎng)站的整體收集
然后,通過日志文件過濾掉前幾個URL或爬網(wǎng)次數(shù)過多的頻道的URL,并通過與實際網(wǎng)頁爬行量的比較來分析問題
當搜索引擎訪問網(wǎng)頁時,正常狀態(tài)代碼是200,而不是200,這是有問題的。通過日志文件,我們可以使用網(wǎng)站日志分析工具(互聯(lián)網(wǎng)上有許多相關(guān)工具)。如果技術(shù)可用,我們可以使用它來處理日志文件,并過濾非200狀態(tài)代碼頁面的原因
還有許多其他因素,例如網(wǎng)站是否包含在內(nèi),此處未列出。通過日志分析,更重要的是解決網(wǎng)站收藏問題,尤其是占整個SEO工作80%的大中型網(wǎng)站。網(wǎng)站收集是提高流量的基礎。