谷歌PR新概念!以鏈接距離為基礎(chǔ)

,作者M(jìn)社營(yíng)銷
閱讀 1613

一、谷歌PR(PageRank)

Google PR是Google誕生以來(lái)**知名度的概念,一位自稱的前 Google軟件工程師在Hacker News的一個(gè)討論Google替代品的帖子中透露,Google早在2006年就不再使用Google PR了!

谷歌PR新概念!以鏈接距離為基礎(chǔ)

如上面的簡(jiǎn)單網(wǎng)絡(luò)鏈接圖所示,Google選出一部分頁(yè)面作為種子頁(yè)面,如圖中上半部分的頁(yè)面106、108、110,下半部分的都是種子頁(yè)面集之外的、需要計(jì)算新PR值的。

 

關(guān)于種子頁(yè)面的幾個(gè)要點(diǎn):

 

1、種子頁(yè)面顯然是高質(zhì)量的頁(yè)面,專利里舉的例子是Google目錄(其實(shí)就是已經(jīng)死了的開(kāi)放目錄)和紐約時(shí)報(bào)。

2、種子頁(yè)面需要與其它非種子頁(yè)面有很好的連通性,有比較多的導(dǎo)出鏈接指向其它高質(zhì)量頁(yè)面。

3、種子頁(yè)面需要穩(wěn)定可靠,有多樣性,大范圍覆蓋各類主題。

 

四、鏈接長(zhǎng)度(Link Length)

 

種子和非種子之間有的離得近,有的離得遠(yuǎn)。如種子頁(yè)面106通過(guò)鏈接132直接連向非種子頁(yè)面112,非種子頁(yè)面118則沒(méi)有種子頁(yè)面直接連向它,要通過(guò)兩層鏈接。

 

鏈接距離并不是簡(jiǎn)單地?cái)?shù)鏈接層數(shù)。每個(gè)鏈接Google會(huì)計(jì)算一個(gè)鏈接長(zhǎng)度,鏈接長(zhǎng)度取決于鏈接本身的特征和鏈接所在頁(yè)面的特征,比如頁(yè)面上有多少鏈接,鏈接的位置,鏈接文字所用字體等等。

 

所以,同樣是一個(gè)鏈接,鏈接長(zhǎng)度是不一樣的:

 

1、頁(yè)面導(dǎo)出鏈接越多,鏈接長(zhǎng)度越長(zhǎng)。這和原始PageRank思路是一樣的,導(dǎo)出鏈接越多,每個(gè)鏈接分到的權(quán)重越少。

2、鏈接所在位置越重要,比如正文中,正文靠前部分,鏈接長(zhǎng)度越短。

3、鏈接錨文字字號(hào)越大,或者在H1中,可能鏈接長(zhǎng)度越短。

 

我記得Matt Cutts很久以前在談到PageRank可能的修正時(shí)提到過(guò),正文中的鏈接和頁(yè)腳的鏈接被用戶點(diǎn)擊到的概率顯然差距很大,所以不同位置的鏈接獲得的PR和權(quán)重應(yīng)該是不一樣的。這種說(shuō)法很符合這個(gè)專利的意思。

 

五、鏈接距離(Link Distance)

鏈接距離就是頁(yè)面與種子頁(yè)面集合之間的**短鏈接長(zhǎng)度之和。種子頁(yè)面和非種子頁(yè)面之間通常不止一條鏈接通路,如示意圖中,頁(yè)面118可以通過(guò)鏈接132、136從種子頁(yè)面106到達(dá),也可以通過(guò)鏈接134、142、140到達(dá),還可以通過(guò)鏈接134、140到達(dá),還可以通過(guò)其它鏈接從其它種子頁(yè)面到達(dá),所有這些從種子集到頁(yè)面的鏈接通路中,鏈接長(zhǎng)度之和**短的那個(gè)被定義為鏈接距離。

 

如果一個(gè)頁(yè)面無(wú)法從任何種子頁(yè)面出發(fā)訪問(wèn)到,也就是種子頁(yè)面集合到這個(gè)頁(yè)面完全沒(méi)有鏈接通路,那么鏈接距離是無(wú)限大。

 

然后Google算法根據(jù)鏈接距離計(jì)算出一個(gè)頁(yè)面的排名能力分?jǐn)?shù),也就是新PR值,**后的排名算法中,這個(gè)新PR值作為排名因素之一。也就是說(shuō),鏈接距離越短,離種子越近,Google認(rèn)為頁(yè)面越重要,排名能力越高。

 

鏈接距離的計(jì)算不需要迭代,所以比原版PageRank的計(jì)算要快得多,而在代表頁(yè)面重要性上,我相信Google做過(guò)對(duì)比,準(zhǔn)確性差不多,所以就用來(lái)代替原來(lái)的PR了。

 

六、簡(jiǎn)化鏈接網(wǎng)絡(luò)圖(Reduced Link-Graph)

如果一個(gè)頁(yè)面從種子集合完全沒(méi)有鏈接通路可以到達(dá),也就是前面說(shuō)的鏈接距離為無(wú)限大,這個(gè)頁(yè)面將被排除在簡(jiǎn)化鏈接網(wǎng)絡(luò)圖之外。如果一個(gè)頁(yè)面得到的鏈接都來(lái)自簡(jiǎn)化鏈接網(wǎng)絡(luò)之外,雖然鏈接總數(shù)可能很大,但其鏈接距離依然是無(wú)限大。

 

換句話說(shuō),在簡(jiǎn)化鏈接網(wǎng)絡(luò)之外的鏈接是被忽略掉的,無(wú)論有多少鏈接。聯(lián)想到Penguin 4.0算法更新,其中一個(gè)特征就是,垃圾鏈接是被忽略掉的,不被計(jì)入鏈接的流動(dòng)中,這和基于鏈接距離的頁(yè)面級(jí)別非常相似。

http://aodeao.cn/3678.html

免責(zé)聲明:文章圖片未做標(biāo)注,均來(lái)源于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系刪除!

? ? ? ?

點(diǎn)擊下方立即獲取您的行業(yè)調(diào)查背景及免費(fèi)運(yùn)營(yíng)方案

網(wǎng)站SEO優(yōu)化相關(guān)文章