新手SEO網站管理員可能對robotsTxt文件知之甚少,因為這個文件通常在編寫后不會被修改。當然,除非有一天你不想讓蜘蛛抓到你的網站,或者網站有不允許發布的私人文件,你可以修改robotsTxt文件的語法,具體的語法在這里沒有描述
雖然robotsTxt在日常SEO工作中很少被提及,但其意義非常重大。機器人的作用不再局限于網頁的隱私,還包括清理網頁上的某些路徑,例如刪除死鏈,這是非常有效的。現在關注尹華峰的SEO技術博客,全面了解真正的機器人Txt文件
什么是機器人Txt文件
機器人。Txt是一個文本文件,存儲在網站的根目錄中。它通常告訴搜索引擎的爬蟲(也稱為網絡爬蟲或蜘蛛)搜索引擎的爬蟲不應該獲取網站中的哪些內容,以及爬蟲
機器人可以獲取哪些內容。機器人必須是小寫的。這是與網絡蜘蛛簽訂的協議。當蜘蛛來到你的網站時,首先看到的是你網站Txt協議文件根目錄中的機器人,它會按照你的規則爬行,但一些驕傲的蜘蛛不遵守規則。一般來說,網絡蜘蛛也會跟著來。如果你的網站根目錄中沒有這個文件,網絡蜘蛛會沿著我們網站上的鏈接一個接一個地爬行
機器人TXT的功能是什么
(1)它可以引導搜索引擎的蜘蛛抓取指定的列或內容。就像你去了一個陌生的城市,有人給你指路
(2)當我們的網站被修改或URL被重寫和優化時,壞鏈接被屏蔽。不要在萬不得已的情況下修改網站。這將對網站造成極大的危害,這將導致權力的減少或排名的損失
(3)你可以阻止死鏈接和404錯誤頁面。隨著網站的發展,死鏈接和404錯誤頁面不可避免
(4)阻止沒有內容和沒有價值的頁面
(5)阻止重復頁面,如評論頁面和搜索結果頁面
(6)阻止任何你不想被包含的頁面
(7)引導蜘蛛抓取網站地圖。讓蜘蛛更快地爬上我們網站的鏈接
結論:因為robotsTxt文件是網站和蜘蛛之間的協議。當蜘蛛來抓取網站時,它必須首先(理論上)遵守協議。這么多網站都有Txt文件,就是把網站地圖放進去。例如,峰峰的博客也不例外。當然,這是為了吸引蜘蛛快速抓取網站鏈接,方便收集。還有其他網站機器人Txt文件的查詢,可以直接添加機器人后的域名Txt一目了然。