一、死鏈介紹?
什么是死鏈
幾乎所有的智能小程序或站點都會遇到內容失效、過期,頁面不需要再展現的情況,這些無法對用戶提供任何有價值信息的頁面就是死鏈接,它包括協議死鏈和內容死鏈兩種形式。
為什么要及時處理死鏈
當站點/小程序死鏈數據累積過多并且被展示到搜索結果頁時,會影響百度搜索對站點/小程序的評價,對站點/小程序的訪問體驗和用戶轉化都會起到負面影響。另一方面,百度檢查死鏈的流程也會為站點/小程序帶來額外負擔,影響對其他正常頁面的抓取和索引。?
二、百度搜索建議的死鏈類型及設置方案?
常見的死鏈包括協議死鏈(百度搜索建議的死鏈類型)和內容死鏈,還有一些對百度并不友好的“個性化死鏈”。?
協議死鏈:頁面的TCP協議狀態/HTTP協議狀態明確表示的死鏈,常見的如404、410。?
內容死鏈:服務器返回狀態是正常的,但內容已經變更為不存在、已刪除或需要權限等與原內容無關的信息頁面。?
在此,百度搜索建議的死鏈設置方案為:?
第一步,將返回碼設置為404或者410:如果站點/小程序已永久刪除相應內容,并且不打算對內容進行替換,建議開發者將返回碼設置成404或410,百度爬蟲嘗試抓取網頁時,如果返回碼為404或410,會將URL判定為死鏈,進而從搜索中刪除?
第二步,設置完返回碼后,修改頁面標題,明確表示該頁面為死鏈,頁面內容可以進行個性化設置。?
對百度搜索不友好的死鏈類型及不推薦的死鏈方案:?
1、個性化死鏈?
部分開發者追求個性化和用戶體驗,在頁面內容失效后并未做協議死鏈處理,也就是說返回狀態碼依然是200,僅僅是在頁面上做了一個有趣的個性化圖片,通過圖片告訴用戶這個頁面沒有有價值的內容,這類死鏈是百度搜索不提倡的。?
2、頁面內容為死鏈但是返回碼為200?
3、頁面重定向到首頁、錯誤頁面、登錄頁面?
例如:頁面A內容已經失效,用戶點擊頁面后,頁面跳轉到了站點首頁。?
不推薦的死鏈設置方案可能會使搜索引擎造成混淆,使得站點的無效內容在搜索結果中展現,最終影響站點的排名和評價。?
三、如何處理死鏈?
站點
第一步,篩查站點內部存在的死鏈,制作死鏈文件,并將這些死鏈頁面設置成為404頁面,即百度訪問它們時返回碼為404。?
第二步,將死鏈文件放置在網站根目錄下?
比如您的網站為example.com,您已制作了一個silian_example.xml死鏈文件,則將silian_example.xml上傳至網站根目錄即example.com/silian_example.xml。?
第三步,登錄百度搜索資源平臺-死鏈提交工具提交死鏈數據?
(1)通過搜索資源平臺-搜索服務-資源提交-死鏈提交,到達操作頁面;?
(2)填寫死鏈文件更新周期,可選“每隔xx小時/天更新一次”;?
(3)填寫死鏈文件地址,請留意提交框右側的配額提示;?
(4)管理已提交的死鏈列表,可查看死鏈文件狀態和死鏈處理狀態。?
特別提醒:?
1、在提交死鏈時,要保證所有頁面都處于404狀態,提交文件中請勿包括活鏈URL,如有活鏈會導致活鏈URL從搜索中移除。
2、索引型死鏈Sitemap文件工具將不予處理,請勿提交索引型死鏈Sitemap文件。?
小程序
整理出需要刪除的資源path路徑,通過智能小程序開發者平臺-自然搜索-資源刪除工具進行提交。?
特別提醒:?
1、死鏈文件每?一條path路徑,?件支持txt格式,每個文件最多允許1000個path路徑,且需小于10MB;
2、為避免誤刪除影響小程序已有流量,每天最多可提交一次死鏈文件。?
附錄?
常見的死鏈返回碼:?
404 Not Found,表示服務器沒有找到任何匹配請求URL的東西,沒有說明這種情況是暫時的還是永久的。
?410 Gone,表示請求的內容在服務器上不再可用,且沒有已知的轉發地址。410通常表示資源永久性的失效。?
正常頁面返回碼:?
200?OK,表示請求成功。
如果相關內容已刪除或移動,不建議返回成功狀態碼(200 OK)而是返回404、410狀態碼。
204 No?Content,表示這個請求沒有要發送的內容,但是報頭可能有用。用戶代理可以使用新的報頭來更新此資源的緩存頭。
如果頁面已經刪除,請返回404/410,返回204可能給搜索引擎造成混淆。?
其他返回碼:?
如果正常頁面長期返回非2xx、3xx的錯誤碼,可能會影響相應內容的收錄和搜索展現。常見的錯誤碼如下:
403Forbidden,表示客戶端沒有獲取內容的權限。
429 Too Many?Requests,表示用戶在給定時間內發送了太多的請求。
500 Internal Server?Error,表示服務器遇到了不知道如何處理的情況。
503 Service?Unavailable,表示服務器還沒有準備好處理請求。通常的情況是服務器超載或者正在維護。
如果由于抓取頻次過高導致429、5xx錯誤,開發者可以在百度搜索資源-抓取頻次-抓取頻次上限調整頁面對百度爬蟲的抓取頻次進行設置。?
本文為@百度搜索平臺原創,運營喵專欄作者。