欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

什么是搜索引擎蜘蛛抓取份額?

2021-06-14    分類: 網(wǎng)站建設

一、什么是搜索引擎蜘蛛抓取份額?


顧名思義,抓取份額是搜索引擎蜘蛛花在一個網(wǎng)站上的抓取頁面的總的時間上限。對于特定網(wǎng)站,搜索引擎蜘蛛花在這個網(wǎng)站上的總時間是相對固定的,不會無限制地抓取網(wǎng)站所有頁面。


抓取份額的英文Google用的是crawl budget,直譯是爬行預算,我覺得不太能說明是什么意思,所以用抓取份額表達這個概念。


抓取份額是由什么決定的呢?這牽扯到抓取需求和抓取速度限制。


二、抓取需求


抓取需求,crawl demand,指的是搜索引擎“想”抓取特定網(wǎng)站多少頁面。


決定抓取需求的主要有兩個因素。一是頁面權重,網(wǎng)站上有多少頁面達到了基本頁面權重,搜索引擎就想抓取多少頁面。二是索引庫里頁面是否太久沒更新了。說到底還是頁面權重,權重高的頁面就不會太久不更新。


頁面權重和網(wǎng)站權重又是息息相關的,提高網(wǎng)站權重,就能使搜索引擎愿意多抓取頁面。


三、抓取速度限制


搜索引擎蜘蛛不會為了抓取更多頁面,把人家網(wǎng)站服務器拖垮,所以對某個網(wǎng)站都會設定一個抓取速度的上限,crawl rate limit,也就是服務器能承受的上限,在這個速度限制內,蜘蛛抓取不會拖慢服務器、影響用戶訪問。


服務器反應速度夠快,這個速度限制就上調一點,抓取加快,服務器反應速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取。


所以,抓取速度限制是搜索引擎“能”抓取的頁面數(shù)。


搜索引擎蜘蛛抓取配額的相關問答


四、抓取份額是由什么決定的?


抓取份額是考慮抓取需求和抓取速度限制兩者之后的結果,也就是搜索引擎“想”抓,同時又“能”抓的頁面數(shù)。


網(wǎng)站權重高,頁面內容質量高,頁面夠多,服務器速度夠快,抓取份額就大。


五、小網(wǎng)站沒必要擔心抓取份額


小網(wǎng)站頁面數(shù)少,即使網(wǎng)站權重再低,服務器再慢,每天搜索引擎蜘蛛抓取的再少,通常至少也能抓個幾百頁,十幾天怎么也全站抓取一遍了,所以幾千個頁面的網(wǎng)站根本不用擔心抓取份額的事。數(shù)萬個頁面的網(wǎng)站一般也不是什么大事。每天幾百個訪問要是能拖慢服務器,SEO就不是主要需要考慮的事了。


六、大中型網(wǎng)站可能需要考慮抓取份額


幾十萬頁以上的大中型網(wǎng)站,可能要考慮抓取份額夠不夠的問題。


抓取份額不夠,比如網(wǎng)站有1千萬頁面,搜索引擎每天只能抓幾萬個頁面,那么把網(wǎng)站抓一遍可能需要幾個月,甚至一年,也可能意味著一些重要頁面沒辦法被抓取,所以也就沒排名,或者重要頁面不能及時被更新。


要想網(wǎng)站頁面被及時、充分抓取,首先要保證服務器夠快,頁面夠小。如果網(wǎng)站有海量高質量數(shù)據(jù),抓取份額將受限于抓取速度,提高頁面速度直接提高抓取速度限制,因而提高抓取份額。


上面的是抓取頁面數(shù),中間的是抓取數(shù)據(jù)量,除非服務器出錯,這兩個應該是對應的。下面的是頁面抓取時間??梢钥吹?,頁面下載速度夠快,每天抓取上百萬頁是沒有問題的。


當然,像前面說的,能抓上百萬頁是一方面,搜索引擎想不想抓是另一方面。


大型網(wǎng)站另一個經(jīng)常需要考慮抓取份額的原因是,不要把有限的抓取份額浪費在無意義的頁面抓取上,導致應該被抓取的重要頁面卻沒有機會被抓取。


搜索引擎蜘蛛抓取配額的相關問答


七、浪費抓取份額的典型頁面有:


大量過濾篩選頁面。這一點,幾年前關于無效URL爬行索引的帖子里有詳細討論。


站內復制內容


低質、垃圾內容


日歷之類的無限個頁面


上面這些頁面被大量抓取,可能用完抓取份額,該抓的頁面卻沒抓。


八、怎樣節(jié)省抓取份額?


當然首先是降低頁面文件大小,提高服務器速度,優(yōu)化數(shù)據(jù)庫,降低抓取時間。


然后,盡量避免上面列出的浪費抓取份額的東西。有的是內容質量問題,有的是網(wǎng)站結構問題,如果是結構問題,簡單的辦法是robots文件禁止抓取,但多少會浪費些頁面權重,因為權重只進不出。


某些情況下使用鏈接nofollow屬性可以節(jié)省抓取份額。小網(wǎng)站,由于抓取份額用不完,加nofollow是沒有意義的。大網(wǎng)站,nofollow是可以在一定程度上控制權重流動和分配的,精心設計的nofollow會使無意義頁面權重降低,提升重要頁面權重。搜索引擎抓取時會使用一個URL抓取列表,里面待抓URL是按頁面權重排序的,重要頁面權重提升,會先被抓取,無意義頁面權重可能低到搜索引擎不想抓取。


幾個說明:


鏈接加nofollow不會浪費抓取份額。但在Google是會浪費權重的。


noindex標簽不能節(jié)省抓取份額。搜索引擎要知道頁面上有noindex標簽,就得先抓取這個頁面,所以并不節(jié)省抓取份額。


canonical標簽有時候能節(jié)省一點抓取份額。和noindex標簽一樣,搜索引擎要知道頁面上有canonical標簽,就得先抓取這個頁面,所以并不直接節(jié)省抓取份額。但有canonical標簽的頁面被抓取頻率經(jīng)常會降低,所以會節(jié)省一點抓取份額。

標題名稱:什么是搜索引擎蜘蛛抓取份額?
URL分享:http://www.aaarwkj.com/news45/117595.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供動態(tài)網(wǎng)站網(wǎng)站排名、搜索引擎優(yōu)化、網(wǎng)站建設、靜態(tài)網(wǎng)站、網(wǎng)站導航

廣告

聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

綿陽服務器托管
日本欧美二区在线看| 人妻中文字幕av资源| 亚洲av成人在线观看| 婷婷网色偷偷亚洲男人| 国产传媒网约在线观看| 少妇内射呻吟中文字幕视频| 久久综合激情亚洲欧美专区| 欧美亚洲综合日韩精品区| 欧美日本午夜福利在线观看| 日本亚洲欧洲一区二区| 日本av在线中文一区二区| 国产精品一区久久91| 国产一级二级三级大胆视频| 熟女自拍偷拍视频播放| 亚洲国产中文日韩欧美在线| 一区二区三区欧美日韩| 91免费在线观看高清| 国模一区二区三区视频| 欧美一区二区三区东京热| 精品国产一区二区成人| 欧美一区日韩二区在线| 国产精品久久久久久老熟女| 国产熟女一区二区精品视频| 欧美福利免费在线视频| 激情综合婷婷中文字幕| 午夜欧美激情在线视频| 欧美成人精品午夜一区二区| 亚洲不卡在线免费av| 白小白的视频在线观看| 亚洲日本中文字幕免费观看| 熟妞人妻精品一区二区视频| 2020中文字字幕在线不卡| 一个人看的视频天堂色| 久久熟妇少妇亚洲精品| 日本黄色中文字幕在线观看 | 亚洲在线免费播放视频| 午夜草草视频在线观看| 国产美女自拍视频一区| 亚洲精品一区二区毛豆| 国产精品自产拍在线网站| 视频精品一区二区在线观看|