1、不包括:
首先看網站的質量,也是蜘蛛對你網站的友好程度,其次是高重復率(判斷:隨機復制一段文章,百度搜索,然后再看紅色率),如果是比較好的原創。比較直接的方式是查看百度蜘蛛IP部分的網站日志,下面是企億推小編整理的供大家參考:
二、分層目錄優化
url層次結構是網站的鏈接地址結構。一條代表一層。層次太深,無法優化,蜘蛛抓不住。通常,建議url層次結構不應超過第三級結構。例如,www,home page.com/column/details.html。
三、如何使主頁在搜索時抓取圖片(在新站點抓取徽標的提示)
建議:
1、抓取首頁圖片具有查看原始網頁的功能,主要是查看首頁3:2比例圖片是否具有alt屬性,有助于蜘蛛識別圖片。
2、一般情況下,網站頭部左側會有網站標志。對于想直接抓取logo的新網站,盡量不要把網站頭部左側的logo和頭部中間或右側的logo連接成一張完整的圖片。在建立一個新的網站時,我會要求程序員將左邊的標志從中間和右邊分開(即三個平行的布局,有些網站左邊有lo)。右邊是聯系信息(兩列中間為空),大小比為3:2或1:1。在這種情況下,蜘蛛在入口處遇到的比較好的一張圖片是網站徽標,可以直接抓取到徽標(蜘蛛抓取頁面的順序是左上右下循環的順序),因為這是蜘蛛進入網站(體驗它))。本站的logo、首頁快照在接下來的幾個月內經過n次更新抓拍到首頁上的其他圖片,)這樣做的目的是讓新站上線后很快就可以依靠人為因素和標簽屬性來抓取網站logo,當然,在后期R做好網站內容的時候,標志權自然會來的。
為了避免快照更新后期更換站點徽標的問題,我們可以在徽標外部添加一個h1標記,這樣更方便直接用新站點抓取站點徽標搜索顯示,不會因為快照更新而被其他圖片替換。
四、談網站不包括的問題
1、雖然有些網站耗時較長,但頁面內容的質量卻很差,也就是說,它們是被別人復制粘貼的。百度蜘蛛判斷他們是垃圾。(建議:不要在別人的網站上復制過多的頁面,多可以復制兩句話,然后重復幾句話形成一篇文章,可以嘗試用偽原創的工具來彌補,然后稍微修改開頭和結尾)
2、不收錄在內,如果網站沒有其他問題,主要原因是網站的內容都是收藏的,即使是偽原創也沒有。怎么可能包括你,要復制粘貼的原始版本可以排名。別人主次寫原創作品對別人有多不公平?所以不要想什么都不付,因為如果你不前進,你就會倒退。
3、網站的服務器在海外使用,這也是禁忌。一般建議使用國產服務器。
五、圖片優化
一般3:2就可以了,比如:600*400,還有alt屬性描述。因為搜索引擎不知道圖片。alt是蜘蛛對圖片名稱的判斷和識別,盡量讓蜘蛛在你的文章中識別圖片,這樣你的圖片在百度圖片中就能更好的顯示和識別,有利于圖片優化,對于一些喜歡直接看圖片的用戶來說可以也可以直接點擊圖片輸入原始圖片。