在线观看日本免费a∨下,中文字幕免费观看一区,国产午夜亚洲精品电影网,伊人精品一区二区三区四区五区

<blockquote id="g50m1"></blockquote>

<thead id="g50m1"></thead>

<nav id="kygm8"><dl id="kygm8"></dl></nav>

<button id="kygm8"><abbr id="kygm8"></abbr></button>

<samp id="kygm8"><strong id="kygm8"></strong></samp>

<center id="kygm8"></center>

<dl id="kygm8"></dl><dl id="kygm8"></dl>

<samp id="kygm8"><strong id="kygm8"></strong></samp>

<dl id="kygm8"></dl>

設為首頁

關鍵詞查詢

服務項目

聯(lián)系方式

保定市遨游計算機服務有限公司
咨詢熱線：13313028229
售后：0312-6791400
售后：0312-6791126
網址：www.cctvchelian.com
地址：保定朝陽大街國貿大廈8樓808室

【網站優(yōu)化】高手級SEO不告訴你的搜索原理

[來源：www.cctvchelian.com] [作者：網站建設] [日期：15-08-08] [瀏覽次數(shù)：]

總鏈接庫和抓取策略說完了后，我們就要對搜索引擎最重要的一部分來進行一個仔細的講解了，換個說法，互聯(lián)網上的信息都是魚，抓魚需要有漁網和魚簍，而接下來要講的爬蟲和下載系統(tǒng)就對應著漁網和魚簍了，明白了SE的爬蟲和存儲機制，在我們來說，開展SEO工作就會少走很多的彎路。

爬蟲

爬蟲是根據(jù)指定URL下載網頁內容的程序或腳本，一般搜索引擎均采用分布式爬蟲架構。分布式爬蟲由數(shù)據(jù)中心、分布式抓取服務器、分布式爬蟲程序組成，數(shù)據(jù)中心由多臺抓取服務器組成，每臺抓取服務器可承載多個爬蟲程序。

常見分布式架構有主從式分布爬蟲和對等式分布爬蟲。

主從式分布爬蟲相當于只有一個URL分配服務器，將全互聯(lián)網的URL分配給若干個抓取服務器進行下載。這種架構明顯對URL分配服務器性能要求很高，面對互聯(lián)網大數(shù)據(jù)，很容易出現(xiàn)系統(tǒng)瓶頸。

對等式分布爬蟲沒有URL分配服務器，每臺抓取服務器負責特定域名集合下URL的抓取。對互聯(lián)網域名分集可通過哈希取?；蛞恢滦怨＃?/span>

哈希取模指對于n臺抓取服務器，首先對域名進行哈希計算，得到的值對n取模，得到余數(shù)即為該域名應分配的服務器編號。

例如，假設有5臺抓取服務器，對應編號為0、1、2、3、4，對域名進行哈希計算后得到的值為16，16對5取模得到余數(shù)1，即該域名下URL應交由1號服務器抓取。

然而，這種模式存在缺陷，在某臺抓取服務器宕機或由于URL增加導致服務器平均負載增加而需要增加抓取服務器時，取模的n就需要改變。這就意味著整個系統(tǒng)要進行重新分配，將導致資源的浪費。

一致性哈希指對域名進行哈希計算，映射為一個在0~232之間的某個數(shù)，將哈希范圍首尾相接，即認為數(shù)值0和232重合，可以將其假想成一個有序的環(huán)狀序列，每臺服務器負責某個數(shù)值段。

假設本站域名經哈希后落入2號服務器執(zhí)行抓取，而2號服務器出現(xiàn)宕機，則繼續(xù)按順時針查找，將URL交由第一個碰到的服務器，即3號服務器，直至2號服務器恢復正常。

由于分布式爬蟲結構，故同一網站會出現(xiàn)很多不同IP的蜘蛛爬取記錄，這是協(xié)同抓取系統(tǒng)中很正常的事。部分SEOer認為不同IP段意味著不同權重的蜘蛛，其中某字段IP蜘蛛為降權蜘蛛。

抓取系統(tǒng)可能會對URL進行權重賦值，以便于確定抓取順序。然而，這個權重值也僅僅用于抓取系統(tǒng)，網頁檢索排序有更復雜的權重規(guī)則。故，降權蜘蛛一說不成立。

上一頁：談談網站制作時內部鏈接建立有哪些技巧?

下一頁：【網站優(yōu)化】高手級SEO不告訴你的搜索原理（2）

服務項目

400電話

網站策劃

網站建設

網站推廣

服務與技術
400電話

400電話優(yōu)勢

開通流程

業(yè)務功能

套餐資費

成功案例
用戶指南

在線留言

在線支付
新聞動態(tài)

400電話

網站建設

推薦新聞

保定網站建設
聯(lián)系我們

咨詢熱線：13313028229

售后：0312-6791400

售后：0312-6791126

網址：www.cctvchelian.com

保定朝陽南大街國貿大廈8樓808

ICP:冀ICP備14022170號-17

微信二維碼