一個網(wǎng)站需要的文章頁面數(shù)量通常不是幾萬,而是數(shù)百萬。如何在短時間內(nèi)將網(wǎng)站中的文章數(shù)量翻倍或倍增?一種方法是增加內(nèi)容,第二種方法是提高網(wǎng)站在搜索引擎中的“收錄率”。
添加內(nèi)容
常用的方法有三種:關(guān)鍵字詞庫構(gòu)建、標簽頁生成、UGC頁生成。
關(guān)鍵詞詞庫的構(gòu)建
通常,在規(guī)劃網(wǎng)站時,頁面是根據(jù)產(chǎn)品的SKU生成的。關(guān)鍵詞詞庫的方法是挖掘行業(yè)中所有的常用詞、產(chǎn)品詞、競爭詞和品牌詞,然后根據(jù)這些詞生成網(wǎng)頁。以58城市為例,在網(wǎng)絡建設之初,將區(qū)域細化到縣,按照乘法原理:縣單位×常用詞×小字段分類×大字段分類生成頁面;公眾點評將區(qū)域細化到某一條路或某個pol,所以按照乘法原理,過億的路可以產(chǎn)生上百億的頁面。
淘寶上有上億個關(guān)鍵詞詞庫,而返利平臺項目上卻有上億個關(guān)鍵詞詞庫。
“資深SEO分析師”挖字并不難。難點在于如何對生成的聚合頁面進行“標記”,使其不被搜索引擎視為“垃圾頁面”,保證頁面的原創(chuàng)性和用戶體驗。
標記頁生成
關(guān)鍵詞詞庫建設就是以關(guān)鍵詞為核心,快速生成數(shù)以億計的網(wǎng)頁。標簽聚合頁面是以關(guān)鍵字索引為核心,快速生成上千萬個標簽頁面。
標簽頁可以理解為主題頁和列表頁,但對于標簽頁的權(quán)重,從投票原則來看,標簽頁有多個內(nèi)頁進行投票,權(quán)重應該高于文章頁,這幾乎是所有門戶都做過的。從用戶體驗的角度來看,標簽頁有時遠不如文章頁有價值。不久前,百度嚴厲打擊垃圾網(wǎng)頁,其中標簽網(wǎng)頁是主打。
很多門戶網(wǎng)站,首先是批量收錄垃圾頁面,甚至不復制。它們直接堆積在網(wǎng)站數(shù)據(jù)庫中,然后根據(jù)關(guān)鍵字生成標簽頁。盡管文章對于搜索引擎來說是垃圾,但是由文章標題或meta生成的標簽頁對于搜索引擎來說是原始的。雖然搜索引擎對標簽頁的權(quán)重越來越低,但具有高相關(guān)性和良好用戶體驗的標簽頁仍然具有較高的投票能力。
標簽頁生成的一步是單詞擴展,這與關(guān)鍵字詞庫的構(gòu)建是一樣的。區(qū)別在于你需要制作不同的主題模板,而主頁必須給你一個入口。
以某保險網(wǎng)站為例,首先做一個標簽,即進入頁面。
(1)支持關(guān)鍵字重復數(shù)據(jù)消除功能。將關(guān)鍵字導入后臺關(guān)鍵字庫時,再次導入該關(guān)鍵字是無效的,即新導入的重復關(guān)鍵字不生成ID或新頁。
(2)每次可以批量導入1-5000個關(guān)鍵字,并為導入的每個新的非重復關(guān)鍵字生成一個單獨的ID
(3)后臺會提示哪些導入的關(guān)鍵字重復,并支持刪除重復關(guān)鍵字的功能。
(4)后臺導入關(guān)鍵字后,點擊〖生成頁面〗按鈕,可以在后臺預覽網(wǎng)站數(shù)據(jù)庫中生成的頁面信息。
(5)背景可以檢測不同關(guān)鍵字生成結(jié)果頁時的內(nèi)容重復性。如果多個關(guān)鍵字之間有70%以上的內(nèi)容重復,后臺會有相應的提示,ID重復的關(guān)鍵字不會生成頁面和URL。
新站為什么要先做收錄?seo公司做新站優(yōu)化有講究
(6)后臺需要設置超級管理員和普通用戶的用戶權(quán)限級別。普通用戶可以上傳關(guān)鍵字并預覽生成的頁面,查詢關(guān)鍵字ID信息功能,但他們沒有權(quán)限發(fā)布在線關(guān)鍵字頁面;超級管理員擁有普通用戶的所有權(quán)限,也有權(quán)限點擊發(fā)布在線搜索關(guān)鍵字。
(7)導入的關(guān)鍵字必須包含兩個中文字符或兩個英文字符才能生成搜索聚合頁。單個漢字或英文字母不支持導入關(guān)鍵字庫和生成頁面的限定。
(8)支持自動或手動向關(guān)鍵字生成的聚合頁面添加標簽。這些標記用于以后使用相同的標記調(diào)用信息文章、評論、主題和其他聚合頁面。
(9)支持關(guān)鍵字聚合頁面的單次、批量“添加、刪除、修改”功能。
(10)支持在搜索聚合頁的關(guān)鍵字庫中,將關(guān)鍵字全部或部分前導的功能。
注:如果你的網(wǎng)站CMS沒有這些功能,這是可以的。你可以根據(jù)這個想法調(diào)整和優(yōu)化自己。您也可以查看我們錦繡大地SEO培訓基地的VIP課程,了解如何使用它。
(1)每頁最多可生成40篇文章,最少可生成10篇文章;不足10篇不生成URL和頁面
(2)每個生成的關(guān)鍵字聚合頁面之間的內(nèi)容重復性不能大于70%,如果大于70%,則后面導入的關(guān)鍵字不會生成URL和頁面。
(3)每個關(guān)鍵字生成的文章標題必須包含多個相同的詞根(詞根字符數(shù)大于或等于2,如果數(shù)據(jù)庫中有中英文分詞詞根)。此時,程序員還需要檢查導入關(guān)鍵字后生成的文章結(jié)果的質(zhì)量。
(4)預生成的關(guān)鍵字聚合頁面必須有專人預覽和檢查文章結(jié)果的匹配程度;如果生成的結(jié)果不夠準確,用戶體驗不好,很容易造成垃圾頁面,導致搜索引擎的功耗降低。
(5)搜索關(guān)鍵詞聚合頁面要求代碼最精煉、最簡化,沒有其他渠道或活動的廣告、JS控件、交互控件和框架內(nèi)容,轉(zhuǎn)換和監(jiān)控代碼不超過兩個,追求的打開速度和用戶體驗。
接下來,它必須遵循關(guān)鍵詞聚合頁面的規(guī)則,如頁面聚合規(guī)則、標簽規(guī)則、頁面內(nèi)容板塊對應的邏輯規(guī)則、頭部導航、面包屑、信息頁面規(guī)則、相關(guān)主題規(guī)則、URL規(guī)則、標題規(guī)則、元規(guī)則等。關(guān)于內(nèi)容規(guī)則,錦繡大地SEO培訓基地有詳細的介紹視頻介紹。
URL優(yōu)化
URL優(yōu)化收錄很多方面,其中有10個重要方面。根據(jù)重要性,順序如下。
死循環(huán):反映在列表頁a點擊到B,然后從B點擊到a,結(jié)果a第二次點擊返回的URL與***次點擊返回的URL完全不同。這是收錄忌諱,因為一旦蜘蛛進入死循環(huán),它總會落入其中,爬不出來。
死鏈接:想象一個蜘蛛從網(wǎng)頁a爬到網(wǎng)頁B,然后爬到網(wǎng)頁C。結(jié)果,B不能被打開,所以C不能被收錄在內(nèi)。另一種情況是,主體已被刪除,但URL仍然存在。這種頁面可以稱為“活鏈接和死鏈接”。用戶體驗很差,建議批量301。
重復頁面:就像兩個豌豆,網(wǎng)址是不同的。
(1)層次:在建立網(wǎng)站時,你喜歡遵循嚴格的邏輯:“首頁-大類首頁-頻道首頁-產(chǎn)品詞首頁-主題頁-文章頁”。一般來說,你可以做6級以上。搜索引擎會根據(jù)每個網(wǎng)站的權(quán)重和更新情況給蜘蛛爬行的時間和次數(shù),如果級別太多,蜘蛛爬到第五級時很可能無法爬到第六級,而第六級往往有大量的“干貨”頁面。
因此,許多網(wǎng)站在設置URL時只有兩層結(jié)構(gòu):主頁和其他頁面(所有頁面都放在二級目錄下)和URL規(guī)則
(2)翻頁規(guī)則:主要用于列表頁。當翻頁超過10000頁時,建議以50>100或更大的間隔來制定底部翻頁規(guī)則。例如,可以將底部規(guī)則設置為“1、2、3、4、5、10、20、30、40、50”,依此類推。當蜘蛛爬到第五頁時,底部顯示變?yōu)椤?,7,8,9,15,25,35,45,55”,這樣蜘蛛可以快速完成所有的翻頁。
蜘蛛陷阱:302跳轉(zhuǎn)>flash跳轉(zhuǎn)、flash頁面>sessionid、強制使用cookie、需要登錄才能填寫驗證碼等。
不允許/
網(wǎng)站地圖:XML網(wǎng)站地圖,向百度提交的網(wǎng)站地圖
蜘蛛入口
有些網(wǎng)站可以每天更新一定數(shù)量的原創(chuàng)文章。XML網(wǎng)站地圖或服務器日志顯示spider每天出現(xiàn)的時間非常短,或者新的主題頁/文章頁可以在搜索引擎中獲得很好的排名。因此,在主頁上添加條目是不錯的方法。
雖然XML網(wǎng)站地圖會使網(wǎng)頁被收錄,但是收錄和可以在搜索引擎中用站點命令檢索是兩件事,檢索到有排名是另一件事。一個網(wǎng)站,因為所有的頁面都投票給首頁,所以首頁的權(quán)重很高,而首頁給出入口,這意味著網(wǎng)站權(quán)重的頁面投票給“入口頁面”,入口頁面的權(quán)重瞬間增加;
另外,蜘蛛一般會從主頁爬到其他級別的頁面,把主頁爬到入口,這意味著只要蜘蛛訪問網(wǎng)站,入口頁面就會被收錄。
代碼優(yōu)化
蜘蛛到每個網(wǎng)站,在一段時間內(nèi),蜘蛛的數(shù)量大致是固定的。
同時,爬一個10000行的網(wǎng)頁相當于爬10個1000行的網(wǎng)頁。所以,從理論上講,如果你有10000行的網(wǎng)頁代碼,你可以把它減少到1000行以下,那么,在同樣的權(quán)重下,蜘蛛爬行的網(wǎng)站應該高出10倍。
在上萬個頁面內(nèi),代碼優(yōu)化的效果非常慢。對于千千萬萬的網(wǎng)站來說,代碼優(yōu)化的效果,無論是搜索引擎的數(shù)量還是新UV,都會起到難以置信的效果。
蜘蛛訪問網(wǎng)站的時間是有限的。如果蜘蛛需要三到五倍甚至十倍于正常速度的速度來抓取一個頁面,那么它們可以抓取的頁面數(shù)量肯定是有限的。web服務器的問題之一是用戶體驗非常差。對于如今“用戶體驗優(yōu)先”的搜索引擎來說,不僅會受到影響,其排名也會直線下降。