TrustRank算法最初來(lái)自于2004年斯坦福大學(xué)和雅虎的一項聯(lián)合研究,用來(lái)檢測垃圾網(wǎng)站,并且于2006年申請專(zhuān)利.TrustRank算法發(fā)明人還發(fā)表了一份專(zhuān)門(mén)的 PDF文件,說(shuō)明TrustRank算法的應用,感興趣的讀者時(shí)以在下面這個(gè)網(wǎng)址下載PDF文件:
http://www.vldb.org/conf/2004/RS15P3.PDF,

TrustRank算法并不是由Google提出的,不過(guò)由于Google所占市場(chǎng)份額最大,而且TrustRank在 Google 排名中也是一個(gè)非常重要的因素,所以有些人誤以為 TrustRank 是Google 提出的。更讓人糊涂的是,Google 曾經(jīng)把 TrustRank 申請為商標,但是 TrustRank商標中的TrustRank指的是 Google檢測含有惡意代碼網(wǎng)站的方法,而不是指排名算法中的信任指數。
TrustRank 算法基于一個(gè)基本假設: 好的網(wǎng)站很少會(huì )鏈接到壞的網(wǎng)站,反之則不成立,也就是說(shuō),壞的網(wǎng)站很少鏈接到好網(wǎng)站這句話(huà)并不成立。正相反,很多垃圾網(wǎng)站會(huì )鏈接到高權威、高信任指數的網(wǎng)站,試圖提高自己的信任指數。
基于這個(gè)假設,如果能挑選出可以百分之百信任的網(wǎng)站,這些網(wǎng)站的 TrustRank 評為最高,這些TrustRank 最高的網(wǎng)站所鏈接到的網(wǎng)站信任指數稍微降低,但也會(huì )很高。與此類(lèi)似,第二層被信任的網(wǎng)站鏈接出去的第三層網(wǎng)站,信任度繼續下降,由于種種原因,好的網(wǎng)站也不可避免地會(huì )鏈接到一些垃圾網(wǎng)站,不過(guò)離第一層網(wǎng)站點(diǎn)擊距離越近,所傳遞的信任指數越高,離第一級網(wǎng)站點(diǎn)擊距離就越遠,信任指數將依次下降。這樣,通過(guò)TrustRank算法,就能給所有網(wǎng)站計算出相應的信任指數,離第一層網(wǎng)站越遠,成為垃圾網(wǎng)站的可能性就越大。
計算 TrustRank 值首先要選擇一批種子網(wǎng)站,然后人工查看網(wǎng)站,設定一個(gè)初始TrustRank 值。挑選種子網(wǎng)站有兩種方式,一種是選擇導出鏈接最多的網(wǎng)站,因為 TrustRank算法就是計算指數隨著(zhù)導出鏈接的衰減。導出鏈接多的網(wǎng)站,在某種意義上可以理解為 "逆向 PR值” 比較高
另一種挑選種子網(wǎng)站的方法是選PR值高的網(wǎng)站,因為 PR 值越高,在搜索結果頁(yè)面出現的概率就越大。這些網(wǎng)站才正是TrustRank算法最關(guān)注的、需要調整排名的網(wǎng)站。那些PR值很低的頁(yè)面,在沒(méi)有TrustRank算法時(shí)排名也很靠后,計算TrustRank意義就不大了。
根據測算,挑選出兩百個(gè)左右網(wǎng)站作為種子,就可以比較精確地計算出所有網(wǎng)站的TrustRank值。
計算TrustRank 隨鏈接關(guān)系減少的公式有兩種方式,一種是隨鏈接次數衰減,也就是說(shuō)如果第一層頁(yè)面TrustRank指數是100,第二層頁(yè)面衰減為 90,第三層衰減為80,第三種計算方法是按導出鏈接數目分配 TrustRank 值,也就是說(shuō),如果一個(gè)頁(yè)面的 TrustRank值是 100,頁(yè)面上有 5 個(gè)導出鏈接,每個(gè)鏈接將傳遞 2090的 TrustRank 值。衰減和分配這兩種計算方法通常綜合使用,整體效果都是隨著(zhù)鏈接層次的增加,TrustRank值逐步降低。得出網(wǎng)站和頁(yè)面的 TrustRank 值后,可以通過(guò)兩種方式影響排名。一種是把傳統排名算法挑選出的多個(gè)頁(yè)面,根據 TrustRank 值比較,重新做排名調整。另一種是設定一個(gè)最低的 TrustRank 值門(mén)檻,只有超過(guò)這個(gè)門(mén)檻的頁(yè)面,才被認為有足夠的質(zhì)量進(jìn)入排名,低于門(mén)檻的頁(yè)面將被認為是垃圾頁(yè)面,從搜索結果中過(guò)濾出去。
雖然 TrustRank 算法最初是作為檢測垃圾的方法,但在現在蕪湖網(wǎng)站建設的搜索引擎排名算法中TrustRank概念使用更為廣泛,常常影響大部分網(wǎng)站的整體排名,TrustRank算法最初針對的是頁(yè)面級別,現在搜索引擎算法中,TrustRank 值也通常表現在域名級別,整個(gè)域名的信任指數越高,整體排名能力越強。
本文地址:http://havencoinwallet.com//article/2731.html