2014-01-20 關(guān)鍵詞: 3344
很多人反映說網(wǎng)站一些頁面已經(jīng)被刪除了,源文件中不存在 ,可是百度快照里面卻一直顯示存在,打開頁面肯定是打不開了,很多人為此很是頭疼!
1、蜘蛛是怎么發(fā)現(xiàn)我們網(wǎng)站的鏈接的
我們都知道,蜘蛛是沿著鏈接爬來爬去的,他會(huì)自動(dòng)提取網(wǎng)站中所有的鏈接,保存入庫,然后進(jìn)行爬取,這也就是為什么我們覺得網(wǎng)站的收錄少了或者剛發(fā)布的文章沒有被收錄,我們就會(huì)說“引蜘蛛”了,其實(shí)引蜘蛛就是發(fā)外鏈了,當(dāng)這條鏈接唄蜘蛛發(fā)現(xiàn)之后,他就會(huì)進(jìn)行爬取,然后通過一系列復(fù)雜的算法之后,決定是否放出該頁面的收錄。
2、為什么會(huì)爬到不存在的頁面
一般情況下,有這么幾個(gè)問題
a、被對(duì)手惡意刷外鏈,也就是說競(jìng)爭對(duì)手惡意的給你發(fā)了很多的不存在的頁面鏈接,當(dāng)蜘蛛發(fā)現(xiàn)之后就會(huì)來爬取
b、以前做的外鏈,后來由于網(wǎng)站改版而某些鏈接沒有及時(shí)的去除,蜘蛛定期回訪的時(shí)候爬取了這條鏈接
c、此種僅限老域名,之前的網(wǎng)站結(jié)構(gòu)和我們現(xiàn)在的網(wǎng)站結(jié)構(gòu)不一致,也類似于b中的說法
d、robots文件沒有對(duì)蜘蛛進(jìn)行限制
e、程序的原因,導(dǎo)致搜索引擎蜘蛛掉入黑洞
f、url提交或者ping給百度地址有誤
蜘蛛爬取不存在的頁面,一般情況下都是由于這些問題導(dǎo)致的,其中最主要的原因就是外鏈部分,所以我們要經(jīng)常性的去檢查下我們網(wǎng)站的外鏈情況。
下面提供解決辦法:
這些方面綜合來講,一般我們只需要這么做,基本就能夠減少這種情況的發(fā)生,如果是鏈接導(dǎo)致的,那么就去百度站長平臺(tái)使用外鏈拒絕工具拒絕掉,并提交網(wǎng)站的死鏈接,同時(shí)使用robots屏蔽蜘蛛抓取這些內(nèi)容;如果是程序問題,就修復(fù)程序
180 1557 7818
基礎(chǔ)型網(wǎng)站建設(shè)營銷型網(wǎng)站設(shè)計(jì)品牌型網(wǎng)站建設(shè)高端定制網(wǎng)站設(shè)計(jì)定制系統(tǒng)開發(fā)
細(xì)致入微的前期服務(wù)
精準(zhǔn)的策劃服務(wù)
精湛的網(wǎng)頁設(shè)計(jì)
穩(wěn)定 可靠 極速的域名和服務(wù)器
任何問題,24小時(shí)回復(fù)并處理
版權(quán)所有:蘇州謝謝網(wǎng)絡(luò)傳媒有限公司 蘇ICP備11087090號(hào)