欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

搜索引擎蜘蛛是如何對翻頁式網(wǎng)頁進(jìn)行抓取的

2021-12-07    分類: 網(wǎng)站建設(shè)

Spider系統(tǒng)的目標(biāo)就是發(fā)現(xiàn)并抓取互聯(lián)網(wǎng)中一切有價(jià)值的網(wǎng)頁,百度官方也明確表示蜘蛛只可以抓取到盡可能多的有價(jià)值資源并保持系統(tǒng)及實(shí)際環(huán)境中頁面的一致性同時(shí)不給網(wǎng)站體驗(yàn)造成壓力,也就是說蜘蛛不會抓取所有網(wǎng)站的所有頁面,對此蜘蛛有很多的抓取策略來盡量快而全的發(fā)現(xiàn)資源鏈接,提高抓取效率。只有這樣蜘蛛才能盡量滿足絕大部分網(wǎng)站,這也是為什么我們要做好網(wǎng)站的鏈接結(jié)構(gòu),接下來筆者就只針對一種蜘蛛對翻頁式網(wǎng)頁的抓住機(jī)制來發(fā)表一點(diǎn)看法。

為什么需要這個抓取機(jī)制

當(dāng)前大多數(shù)網(wǎng)站都用翻頁的形式來有序分布網(wǎng)站資源,當(dāng)有新文章增加時(shí),老資源往后推移到翻頁系列中。對蜘蛛來說,這種特定類型的索引頁是爬行的有效渠道,但是蜘蛛爬行頻率和網(wǎng)站文章更新頻率不盡相同,文章鏈接很有可能就被推到翻頁條中,這樣蜘蛛不可能每天從第1個翻頁條爬到第80個,然后一個文章一個文章的抓取,到數(shù)據(jù)庫對比,這樣太浪費(fèi)蜘蛛時(shí)間,也浪費(fèi)你網(wǎng)站的收錄時(shí)間,所以蜘蛛需要對這種特殊類型的翻頁式網(wǎng)頁來一個額外的抓取機(jī)制,從而保證收錄資源的完全。

如何判斷是否是有序翻頁式頁面

判斷文章是否按發(fā)布時(shí)間有序排布是這類頁面的一個必要條件,下面會說到。那么如何判斷資源是否按發(fā)布時(shí)間有序排布呢有些頁面中每個文章鏈接后面跟隨著對應(yīng)的發(fā)布時(shí)間,通過文章鏈接對應(yīng)的時(shí)間集合,判斷時(shí)間集合是否按大到小或小到大排序,如果是的話,則說明網(wǎng)頁中的資源是按發(fā)布時(shí)間有序排布,反之亦然。就算沒寫發(fā)布時(shí)間,蜘蛛寫可以根據(jù)文章本身的實(shí)際發(fā)布時(shí)間進(jìn)行判斷。

該抓取機(jī)制原理

針對這種翻頁式頁面,蜘蛛主要是通過記錄每次抓取網(wǎng)頁發(fā)現(xiàn)的文章鏈接,然后將此次發(fā)現(xiàn)的文章鏈接與歷史上發(fā)現(xiàn)的鏈接作比較,如果有交集,說明該次抓取發(fā)現(xiàn)了所有的新增文章,可以停止對后面翻頁條的抓取了;否則,說明該次抓取并未發(fā)現(xiàn)所有的新增文章,需要繼續(xù)抓取下一頁甚至下幾頁來發(fā)現(xiàn)所有的新增文章。聽起來可能有點(diǎn)不大懂,木木seo來舉個很簡單的例子,比如在網(wǎng)站翻頁目錄新添加了29篇文章,也就是說上次最新一篇是第30篇,而蜘蛛是一次性抓取10篇文章鏈接,這樣蜘蛛第一次進(jìn)行抓取時(shí)抓了10篇,與上次并沒有交集,繼續(xù)抓取,第二次又抓10篇,也就是一共抓20篇了,還是與上一次沒有交集,然后繼續(xù)抓取,這一次就抓到了第30篇,也就是和上次的有交集了,這就說明蜘蛛已經(jīng)抓取了從上次抓取到這次網(wǎng)站更新的全部29篇文章。

網(wǎng)頁名稱:搜索引擎蜘蛛是如何對翻頁式網(wǎng)頁進(jìn)行抓取的
網(wǎng)頁鏈接:http://www.aaarwkj.com/news/139295.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站、ChatGPT品牌網(wǎng)站制作、定制網(wǎng)站App開發(fā)、標(biāo)簽優(yōu)化

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站優(yōu)化排名
未满十八禁止免费在线观看| 亚洲天堂av在线有码| 久久久国产精品9999综合| 中文字幕国产精品综合| 欧美性做爰片免费视频网| 中文字幕一区二区三天| 男人天堂av网在线观看| 特级艳片在线观看免费| 欧美成人精品视频在线不卡| 欧美精品激情在线不卡| 中文字幕免费日本在线| 亚洲成人国产一区二区| 亚洲欧美另类重口国产| 99久久成人国产精品免费| 麻豆印象传媒在线观看| 久久国产精品一区免费观看| 激情偷拍一区二区三区视频| 日韩av有码在线播放| 国产乱肥老妇国产一区二| 熟妇一区二区三区av| 日本久久久精品福利视频| 日韩少妇黄色在线观看| 亚洲欧美一区二区三区三| 亚洲欧美二区中文字幕| 国产激情视频在线观看你懂的| 一区二区三区高清人妻日本| 亚洲国产高清国产拍精品| 精品国产91久久粉嫩| 亚洲最新一区二区在线观看| 在线免费观看国产黄色av| 亚洲女同中文字幕在线| a一级成人插少妇的逼| 91高清国产在线播放| 国产成人av中文字暮在线| 国产婷婷色三区一区二区| 亚洲视频一区二区精品| 传媒视频免费在线观看| 久久精品资源综合网| 国产免费观看久久黄av片涩av| 欧美日韩黄色在线观看| 在线免费观看成人午夜福利|