作為一個合格的SEO優化人員,想讓我們的網站更加符合搜索引擎的規范,就必須了解搜索引擎是如何工作的,這也是每一個SEO優化人員的基本功,下面我們就來詳細解釋一下搜索引擎是如何工作的。
一、抓取
這個步驟就像大海里撈魚,搜索引擎像一個大魚網通過抓取的方式不斷獲得我們網站的各個元素。
1.抓取程序(蜘蛛)
既然抓取就需要工具,搜索引擎抓取頁面的工具被我們俗稱為蜘蛛,他是一個搜索引擎開發的軟件系統,搜索引擎通過這些抓取程序每天不間斷的對我們的網站進行抓取,為了區分開來,不同的搜索引擎他的抓取程序的名字是不一樣的。
百度蜘蛛:BaiduSpider 谷歌機器人:Googlebot 360蜘蛛:360Spider
這是幾個大的搜索引擎的蜘蛛的名字,其他搜索引擎抓取程序的名字自己查詢一下即可。
2.如何讓抓取程序來抓取
我們肯定希望我們的網站都能夠被搜索引擎盡快的抓取,首先搜索引擎的抓取程序是通過鏈接對我們的網站進行抓取的,我們網站一般都是通過做外部鏈接的方式來讓蜘蛛更好的抓取我們的網站,蜘蛛通過鏈接爬取到我們的頁面的時候他還會通過該頁面上面的鏈接進行繼續爬取。
我們還可以通過提交鏈接的方式來讓蜘蛛抓取我們的頁面,各大搜索引擎都提供了提交入口,我們想讓蜘蛛抓取我們的哪個頁面我們去提交即可。當然還有的網站蜘蛛主動上門來抓取的,互聯網上的高質量的內容是非常稀缺的,當你的網站有高質量的內容的時候,蜘蛛就會主動上門并且定期的來抓取你網站的內容,以更新他自己的數據庫。
3.怎么知道蜘蛛是否抓取了我們的網站
有兩種方式能夠看到蜘蛛是否抓取了我們的網站
第一、百度站長平臺的抓取頻率
推薦大家加入百度站長平臺,里面的很多功能對SEO優化都有很大的幫助
第二、服務器日志
服務器日志更能夠直觀的反映出蜘蛛對于我們網站哪個頁面在什么時間通過什么方式抓取的,我們需要會看服務器日志,當然我們也可以通過日志分析工具進行分析。
4.影響蜘蛛抓取頁面的因素
我們知道了蜘蛛通過什么方式抓取我們的頁面也知道了怎么看蜘蛛的抓取軌跡,那么什么因素能夠影響蜘蛛的抓取呢,主要因素有兩個,路徑過長和中文路徑。
A.路徑過長
過長的路徑會影響蜘蛛對于這個鏈接所在的頁面的抓取,所以我們在設置路徑的時候盡量簡潔明了,動態路徑的話要做好偽靜態,盡量避免不必要的參數出現在路徑里。
B.中文路徑
很多網站的程序會生成一些中文的路徑,他們覺得這樣會很利于用戶對于該路徑下的內容的了解,但是中文路徑對于蜘蛛的爬取影響是非常大的,所以我們要避免中文路徑。
二、過濾
1.為什么過濾
搜素引擎通過撈魚的方式抓取來的頁面是魚龍混雜的,我們知道在互聯網上會充斥著各種無價值的頁面、死鏈接頁面、欺騙頁面等等,搜索引擎為了節省抓取程序的服務器資源同時為了節省搜索引擎的工作時間,要對所抓取的頁面進行過濾。
2.影響過濾的因素
首先搜索引擎對于JS代碼、FLASH、iframe框架都是無法識別的,所以在關鍵內容我們要盡量不用或者少用這三個因素,其次是圖片對于圖片我們要做好ALT標簽,因為他是通過ALT標簽對圖片進行識別的。
其次頁面質量對于搜索引擎的過濾也是很有影響的,我們應該盡量提高自己的頁面質量也便保證搜索引擎不把我們的頁面過濾掉。
三、收錄
在我們的網站頁面經過了前兩部的抓取和過濾之后,搜索引擎就會把我們的頁面納入到他的索引庫里面,這就是我們經常說的收錄,也就是具體呈現到我們面前的一個個頁面。
我們可以通過SITE加域名還有百度站長平臺的索引量查詢這兩個方式來查看我們的收錄量或者索引量。
四、排序
當搜索引擎對我們的頁面建立了索引并且納入他的數據庫之后,搜索引擎會根據自身的一個算法機制對于這些頁面進行一個排序,我們每一個SEO不斷研究的也正是如何能夠讓自己的網站獲得更好的排序,擁有一個好的排名是綜合因素的結果,我們需要做好每一個細節。
總結
我們詳解介紹了搜索引擎工作的四個步驟,包括抓取、過濾、收錄還有排序,這四個步驟每一步都非常的重要他們之間的聯系也是非常的緊密的,只有我們對每一步進行詳細了解并且把我們網站按照搜索引擎的規則做好,最后我們才可能獲得搜索引擎的親睞。
評論(0人參與,0條評論)
發布評論
最新評論