簡介:
對于搜索引擎優(yōu)化,很多搜索引擎沒有問題,但是很少有人能把網(wǎng)站優(yōu)化到百度首頁。經(jīng)過最近一段時間的觀察,發(fā)現(xiàn)很多網(wǎng)站排名都在中低端,排名也不理想。那么百度搜索引擎的整體工作原理是什么呢?seo自學網(wǎng)教程告訴你。
搜索引擎的工作原理可以分為抓取、過濾、記錄、排序四個部分,我覺得是這樣的。
首先,抓?。?/p>
搜索引擎爬行蜘蛛可以分為百度蜘蛛、谷歌蜘蛛、360蜘蛛、雅虎蜘蛛、搜狗蜘蛛等等。
既然知道了各大搜索引擎的蜘蛛名稱,怎么才能讓蜘蛛抓取我們的網(wǎng)站內(nèi)容?可以分為以下三點:
1.外部鏈接:外部鏈接可以分為兩種:發(fā)布外部鏈接和友情鏈接。外部鏈接也是優(yōu)化網(wǎng)站的唯一途徑。高權重的外部鏈接可以起到提升網(wǎng)站排名的催化作用。友情鏈接講究高質量,也能給網(wǎng)站帶來意想不到的排名;
2.提交鏈接:提交鏈接主要用于新站剛上線未收錄時??梢酝ㄟ^百度站長平臺提交網(wǎng)站首頁鏈接;
3.讓蜘蛛自己去做:前兩點可以起到一定的排名作用,但是光靠前兩點是不夠的。那么蜘蛛怎么能自己爬上我們的網(wǎng)站內(nèi)容呢?毫無疑問,網(wǎng)站內(nèi)容是否優(yōu)質,網(wǎng)站內(nèi)部布局是否合理,是否有網(wǎng)站地圖,服務器是否穩(wěn)定等等都有一定的因素。
當我們每天更新網(wǎng)站內(nèi)容,發(fā)布外部鏈接的時候,怎么知道有沒有蜘蛛來我們的網(wǎng)站抓取內(nèi)容?
首先,你可以使用百度平臺的抓取頻率(見上圖)。只要每天都有壓力反饋,就說明蜘蛛去過我們的網(wǎng)站,抓取了一些內(nèi)容,回收到百度數(shù)據(jù)庫;
其次,通過服務期日志,名為bit log的文件就是網(wǎng)站服務器日志。通過服務周期日志,我們可以看到哪些搜索引擎訪問過我們的網(wǎng)站,訪問者的ip,以及我們的網(wǎng)站被攻擊的事實。我們還可以通過日志文件看到攻擊者的ip地址和哪些頁面被篡改。
很多網(wǎng)站不收錄或者排名不好的原因也在于蜘蛛的爬行因子,主要分為太長路徑或者中文路徑。
如果路徑太長,說明一個網(wǎng)頁的網(wǎng)址太長,超過64字節(jié),那么后面的鏈接蜘蛛就無法抓取。如果是靜態(tài)鏈接,網(wǎng)頁的層次可能太深,所以搜索引擎會認為頁面不重要,可能影響網(wǎng)站收錄;如果是動態(tài)鏈接,層次太深不利于優(yōu)化;
影響蜘蛛爬行的另一個因素是中國路徑。如果url是中文路徑,主機空間中的文件名也用中文命名。由于許多空間不支持中文命名文件,這可能會導致網(wǎng)頁加載緩慢或網(wǎng)址加載混亂,從而導致搜索引擎無法識別它們。
二、過濾:
搜索引擎為什么要過濾抓取的內(nèi)容?
隨著互聯(lián)網(wǎng)的快速發(fā)展和網(wǎng)站數(shù)量的增加,會出現(xiàn)大量高度重復的內(nèi)容和低質量的文章,其中一些還存在大量的死鏈接。在這一步中,搜索引擎過濾掉這些低質量的網(wǎng)頁,為用戶提供有價值的內(nèi)容。
既然搜索引擎要過濾網(wǎng)站內(nèi)容,那么影響過濾的因素有哪些?
1.識別:搜索引擎捕捉到很多無法識別的網(wǎng)頁,如代碼、圖片、鏈接等。所以必須對此系列做出相應的解決方案,規(guī)范代碼,給圖片添加alt屬性,盡量使用靜態(tài)(偽靜態(tài))鏈接。不顯示url中國道路;
2.頁面質量:很多站長喜歡抄襲別人的內(nèi)容,從而豐富自己的網(wǎng)站。對于這一點,搜索引擎開始收錄,但是這些低質量的內(nèi)容會時不時被刪除,所以網(wǎng)站排名不穩(wěn)定甚至下降。
三.收錄:搜索引擎抓取我們的網(wǎng)站內(nèi)容,那么最后收錄了多少網(wǎng)站內(nèi)容?
站長工具可以用來查詢網(wǎng)站列表,但是站長工具只能作為參考。具體可以使用site:命令查看相關字段,如:site:www.chenbaowen.com(有www和沒有www的列表不一樣),與網(wǎng)站的首選域相關;還有一種方法是通過百度站長平臺工具查詢網(wǎng)站列表。
很多網(wǎng)站收錄少但是很多網(wǎng)站收錄多。原因是什么?
對于新站來說,一開始收錄少是正常的。畢竟新站在百度眼里還沒有建立起信任和權威,只要定期更新高質量的內(nèi)容和高質量的外部鏈接;
對于老站,有很多網(wǎng)站很少收錄。一般一個網(wǎng)頁超過一個半月還沒有收錄,要看網(wǎng)頁內(nèi)容質量是否低,字數(shù)是否太少等等。
百度蜘蛛將每個網(wǎng)站的內(nèi)容收集到數(shù)據(jù)庫中,并計算相應關鍵詞的權重,從而達到排名效果。
4.排名:網(wǎng)站的排名是基于搜索引擎的基本優(yōu)化。百度在百度頁面上對計算出來的關鍵詞權重進行排名,也就是說大家經(jīng)常關心排名的漲跌。