什么是搜索引擎優(yōu)化?SEO是搜索引擎優(yōu)化。在學(xué)習(xí)SEO之前,我們必須首先了解搜索引擎的原理。畢竟,SEO是根據(jù)搜索引擎的原理進(jìn)行操作的,所以要了解搜索引擎的工作原理。當(dāng)你遇到一些問題時(shí),你可以了解原因
2017年主要搜索引擎工作原理分析:無論是哪個(gè)搜索引擎,主要流程都由以下模塊組成:
具體來說是:捕獲、過濾、包含、索引和排序
I:Grab
1.如何抓取
通過鏈路抓取的,應(yīng)抓取站內(nèi)外鏈路。站外:外鏈和廣告
自上而下,找到這個(gè)位置的鏈接,主頁
2.如何讓蜘蛛抓取我們的網(wǎng)站
優(yōu)質(zhì)相關(guān)網(wǎng)站發(fā)布外鏈
你可以通過百度站長平臺(tái)提交
百度自動(dòng)抓取,無需提交鏈接,百度論文會(huì)自動(dòng)來到你的網(wǎng)站
3.你如何知道百度蜘蛛是否已經(jīng)來到你的網(wǎng)站
百度站長平臺(tái):索引量和捕獲頻率如下圖所示:
您還可以使用IIS日志和服務(wù)器日志記錄網(wǎng)站的運(yùn)行情況,并檢查百度蜘蛛是否訪問過您的網(wǎng)站
4.不利于蜘蛛抓取的路徑:
中文路徑:www.xxxx。comXXXX/xxxxx/123/我愛你
路徑太長了www.xxxxxxxxxx/xxxxx/123/images/12465
http://xxxxx.xxxxx.com/disk/home#list/path=%2F%E6%AF%8F%E5%A4%A9%E8%AF%BE%E7%A8%8B%E5%8F%8A%E7%AC%94%E8%AE%B0
拒絕蜘蛛抓取:機(jī)器人屏蔽
服務(wù)器問題:空間問題,提示503
路徑最多通過5層,最佳網(wǎng)站路徑不超過3層
捕獲的部分信息放入臨時(shí)數(shù)據(jù)庫
II。過濾
1.為什么篩選:
信息太多了。你需要過濾垃圾信息和低質(zhì)量的頁面
2.影響過濾的因素:
可以識(shí)別文本和鏈接,但無法識(shí)別圖片和視頻。圖片應(yīng)添加AIT屬性。視頻中應(yīng)添加文字說明
3.慢速網(wǎng)站:Ping測試
測速網(wǎng)站:站長工具
如下圖所示:
4.國內(nèi)100ms,國外200ms
5.加速網(wǎng)站以確保正常訪問,網(wǎng)站權(quán)重:新網(wǎng)站非常正常,權(quán)重太低,網(wǎng)站頁面權(quán)重通過
什么是正常的
網(wǎng)站上線一個(gè)月后可以訪問、收錄和索引是正常的
6.頁面質(zhì)量:
這與我們網(wǎng)站的收藏有關(guān)。一個(gè)網(wǎng)站產(chǎn)品只有一張圖片,所以你需要自己做
網(wǎng)站的頁面是空的。打開時(shí)沒有內(nèi)容。每欄只有一兩篇內(nèi)容
-5,5-10篇
7.頁面相似度
頁面相似度查詢網(wǎng)站:http://tools.aizhan.com/sl/
如下圖所示:
打開頁面相似度網(wǎng)站,輸入兩個(gè)網(wǎng)站的文章鏈接,如上圖所示操作,查看頁面相似度
超過80%將被過濾掉,可控制在30%-40%
三、記錄系統(tǒng)模塊
1過濾上述內(nèi)容時(shí),您將被排名。將網(wǎng)站文章的網(wǎng)址復(fù)制到百度搜索框進(jìn)行查詢和收集。網(wǎng)站+域名,整個(gè)網(wǎng)站的查詢和收集,以及站長平臺(tái)將看到收集
包含和索引相同
索引;http://zhanzhang.baidu.com/college/articleinfo?id=806
1.分別包含和索引的內(nèi)容
包含:該頁面由Baiduspider發(fā)現(xiàn)并分析
索引:經(jīng)過初步分析,Baiduspider認(rèn)為它有意義,并進(jìn)行了數(shù)據(jù)庫建設(shè)
集合與索引的關(guān)系
只有在包含包含關(guān)系之后,才能建立索引。包含的金額大于索引金額。百度站長平臺(tái)鏈接提交工具是收藏之門
收藏和索引的意義
[收藏的意義1]收藏是索引的前提。網(wǎng)站需要保持服務(wù)器穩(wěn)定(參考抓取診斷工具和抓取異常工具)和機(jī)器人正確(對應(yīng)的機(jī)器人書寫方法和需求使用表),以便為百度pider抓取
[收集的意義2]鋪平道路百度Piper只能處理已分析的頁面。面對新舊頁面301和移動(dòng)適配,它可以完成包含頁面的權(quán)重評分和流量切換
很難通過不同頁面獲得流量索引(盡管很難通過不同頁面獲得流量索引)
[索引含義2]新聞源網(wǎng)站(新聞源目錄)中的鏈接必須通過網(wǎng)頁數(shù)據(jù)庫進(jìn)行索引,才能出現(xiàn)在新聞檢索中
如何查詢收錄量和索引量
真正的索引量只能通過百度站長平臺(tái)的索引量工具查詢
5.除非包含在內(nèi),否則沒有排名。包容是確保排名的前提
6.不一定有排名
網(wǎng)站上有很多頁面,這不能保證每個(gè)頁面都包含在內(nèi)。包含的頁面不一定有排名
7.新站前的收集速度很慢。問題是什么
低信用、重量、良好的優(yōu)化、內(nèi)容更新,至少每天更新一篇高質(zhì)量的文章。當(dāng)你的網(wǎng)站核心詞、排名穩(wěn)定、內(nèi)容可以選擇不做
當(dāng)新網(wǎng)站上線時(shí),百度蜘蛛會(huì)很快抓取并收集,這表明你的網(wǎng)站域名很好,你的信用度很低
8.為什么一個(gè)頁面已經(jīng)一個(gè)月沒有被收錄
因?yàn)榘俣?strong>蜘蛛認(rèn)為你的網(wǎng)站是垃圾網(wǎng)站,此時(shí),你應(yīng)該檢查你網(wǎng)站的內(nèi)容來源是否是收藏、偽原創(chuàng)以及如何找到它。將網(wǎng)站內(nèi)容的一小部分復(fù)制到搜索框中以供查看。如果主頁上的前十項(xiàng)很受歡迎,則表明您的網(wǎng)站內(nèi)容存在問題
9.網(wǎng)站將被放置在百度數(shù)據(jù)庫和臨時(shí)數(shù)據(jù)庫
四:排序
1.它將通過一系列算法進(jìn)行排序。它將為你的網(wǎng)站和內(nèi)容的基本優(yōu)化打分。這是評分系統(tǒng)的排序
要做好基本優(yōu)化,用戶應(yīng)該投票
用戶占很大比例。當(dāng)你的網(wǎng)站跳出率和用戶體驗(yàn)都很高時(shí),用戶投票占了很大比例
例如,當(dāng)你搜索一個(gè)詞時(shí),排名是通過點(diǎn)擊百度來計(jì)算的。它不是通過點(diǎn)擊立即計(jì)算出來的,而是已經(jīng)計(jì)算出來的
一、二屬于捕獲和過濾系統(tǒng),三、四屬于收集和排序系統(tǒng)。這就是搜索引擎的原理。關(guān)注企業(yè)一推,學(xué)習(xí)更多SEO知識(shí)
2017年各大搜索引擎的工作原理與此流程基本相同,包括爬行、過濾、包含、索引和排序