青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

posts - 297,  comments - 15,  trackbacks - 0

首先申明,本博文自原創(chuàng),部分?jǐn)?shù)據(jù)來源于網(wǎng)絡(luò)。

google的 搜索結(jié)果中,PR值越 高的網(wǎng)頁排在越前面。

網(wǎng)頁權(quán)重的算法有很多種,為何我唯獨(dú)選擇了page rank來討論,不僅因?yàn)樗?font face="Times New Roman">Google搜索引擎采用的搜索結(jié)果排名算法之核心,且它把整 個(gè)互聯(lián)網(wǎng)當(dāng)做一個(gè)整體來對待且最終依靠經(jīng)典的數(shù)學(xué)模型精準(zhǔn)地得到web上 網(wǎng)頁的權(quán)重。

雖然今天的搜索引擎的排名系統(tǒng)遠(yuǎn)遠(yuǎn)要比這個(gè)算法復(fù)雜。域名數(shù)據(jù),內(nèi)容質(zhì)量,用戶數(shù)據(jù),建站時(shí)間等都可能被考慮進(jìn)去,但是page rank算法仍然是核心的技術(shù)之一,使得Google名聲大噪。關(guān)于page rank的介紹性文章,在Google黑板報(bào)里的 Page Rank Google 的民主表決式網(wǎng)頁排名技術(shù)。關(guān)于其更詳細(xì)的論述,可以參照Google 的兩個(gè)創(chuàng)始人拉里•佩奇 Larry Page )和謝爾蓋•布林 (Sergey Brin)的論文 The PageRank Citation Ranking: Bringing Order to the Web

首先,page rank基 于以下的假設(shè):一個(gè) 網(wǎng)頁被引用 (即反向 鏈接)的次數(shù)越多,則 說明越重要; 一個(gè)網(wǎng) 頁雖然沒有被多次引用,但是被重要的網(wǎng)頁引用,則它也可能是很重要的;一個(gè)網(wǎng)頁的重要性被平均的傳遞到它所引用的網(wǎng)頁。所以,為了說明問題的方便,就引出了下面這個(gè)簡化了的Page Rank算法。簡化版一:R(u) = cR(1)/N(1) + ……+cR(v)/N(v)。(v∈Bu)。 其中R(v)是網(wǎng)頁v的PR值,N(v)是 網(wǎng)頁v的正向鏈接數(shù),B(u)是頁面u的反向鏈接的集合。c是 阻尼系數(shù)(Damping Factor),它的值在0到1之間。因 此,阻尼系數(shù)的使用,減少了其它頁面對當(dāng)前頁面A的排序貢獻(xiàn)。那么這個(gè)式子如何用數(shù)學(xué)的方法解答呢?首先可以認(rèn)為整個(gè)互聯(lián)網(wǎng)是 一個(gè)大的有向圖G=(V,E)。V是所有頁面的集合,E是有向邊的集 合,(i,j)表示頁i有指向頁j的超鏈接。由于有向圖和矩陣在本質(zhì)上 是可以互相轉(zhuǎn)換的,下面舉例是如何互轉(zhuǎn)的:

此有向連通圖模擬網(wǎng)頁間的超鏈接

鏈接源I D 鏈接目標(biāo) ID

1          2,3 ,4,5, 7

2          1

3          1,2

4          2,3,5

5          1,3,4,6

6          1,5

7          5

如果我們假設(shè)Aij=1 ,if (從頁面 i 向頁面 j 「有 」 鏈接的情況) ;Aij=0, if (從頁面 i 向頁面 j 「沒有」鏈接的情況) 。 則根據(jù)以上我們可以構(gòu)造如下矩陣

A = [

   0, 1, 1, 1, 1, 0, 1;

   1, 0, 0, 0, 0, 0, 0;

   1, 1, 0, 0, 0, 0, 0;

   0, 1, 1, 0, 1, 0, 0;

   1, 0, 1, 1, 0, 1, 0;

   1, 0, 0, 0, 1, 0, 0;

   0, 0, 0, 0, 1, 0, 0;

]

接下來再來看看公式一中的PR值求法,即

PR(1) = c[1*PR(2) + (1/2)*PR(3) + (1/4)*PR(5) +(1/2)*PR(6)];

PR(2) = c[(1/5)*PR(1) + (1/2)*PR(3) + 0.25*PR(5) + 0.5*PR(5)];

............

PR(7) = c[(1/5)*PR(1) + 0+ 0......];

則,可以得出PT = cMPT其中M的方陣如下,

M = [

    0,    1,   1/2,    0,     1/4,    1/2,    0;

    1/5,    0, 1/2,    1/3,    0,     0,     0;

    1/5,    0, 0,     1/3,    1/4,    0,     0;

    1/5,    0, 0,      0,     1/4,    0,     0;

    1/5,    0, 0,     1/3,    0,     1/2,    1;

    0,      0, 0,      0,     1/4,    0,     0;

    1/5,    0, 0,     0,     0,     0,     0;

]

所以,PT為M的特征根為c的 特征向量。只需求出最大特征根的特征向量,就是網(wǎng)頁集對應(yīng)的最終PageRank值,這可以用迭代方法計(jì)算。如何迭代呢?如果 我們給定初始向量PT1’做第一次迭代,就相當(dāng)于用初始向量乘以上面的矩陣。第二次迭代就相當(dāng)于用第一 迭代的結(jié)果再乘以上面的矩陣……實(shí)際上,在隨機(jī)過程的理論中,上述矩陣被稱為“轉(zhuǎn)移概率矩陣”。這種離散狀態(tài)按照離散時(shí)間的隨機(jī)轉(zhuǎn)移過程稱為馬爾可夫鏈(Markov chain)。設(shè)轉(zhuǎn)移概率矩陣為P,若存在正整數(shù)N,使得PN>0(每 一個(gè)元素大于0),這種鏈被稱作正則鏈,它存在唯一的極限狀態(tài)概率,并且與初始狀態(tài)無關(guān)。這篇”Google搜索與Inter網(wǎng)中的數(shù)學(xué)文章 里,描述了馬氏鏈與page rank的關(guān)系。

最后可以看到,從最開始的矩陣A到矩陣M可以 很容易轉(zhuǎn)化得到(將A倒置后將各個(gè)數(shù)值除以各自的非零要素)。

現(xiàn)在考慮有一個(gè)頁面(比如是頁面7),它不含有任何的超鏈接,即它的前向 鏈接或者說出度為0,很顯然,方陣M的最后一行為全零,這樣,特征向量PT也 為全零。我們也可以從圖論的角度來闡述這個(gè)問題。我們可以這樣定義一個(gè)有向圖:圖G的頂點(diǎn)集合為V={V1,V2,…,Vn}, 邊的集合為E={Eij}。我們把有向圖G的每個(gè)頂點(diǎn)都給定一個(gè)權(quán)值P(Vi), 即為它的PR值。有向邊AB的權(quán)值定義為A為B貢 獻(xiàn)的PageRank,也即網(wǎng)站A鏈接到網(wǎng)站B的概率。這樣,對于一個(gè) 頂點(diǎn),若它的出度大于0,則從它出去的權(quán)值和為1(這一點(diǎn)可以從上述的方陣M中 的列可以看出,滿足了全概率)。顯然,如果圖中有一個(gè)頂點(diǎn)X的出度是0,那么經(jīng)過有限次迭代后所有 頂點(diǎn)的PR值都將變?yōu)?。這是因?yàn)橛捎赬不對外貢獻(xiàn)任何PR, 所以整體的PR總和在不斷減少,最終減為0。這個(gè)被拉里•佩奇和謝爾蓋 •布林稱為rank sink。 為了克服這個(gè)問題,就有了下面這個(gè)公式:Rank算 法簡化版二:R(u) = 1-c+ cR(1)/N(1) + ……+cR(v)/N(v)。(v∈Bu)。 ……公式二

(1-c)實(shí)際上為了服從概率分布。這樣可以推導(dǎo)出P = (1-c)e + cMP,即

P = [(1-c)eeT/n + cM]P (eTP=n)。關(guān)于用矩陣方法來推導(dǎo)的更詳細(xì)的文章,可以參考這篇 "The $25,000,000,000 Eigenvector: The Linear Algebra Behind Google" .

   現(xiàn)在可以想象一下整個(gè)web中 有250億不止的網(wǎng)頁,收斂速度是至關(guān)重要的。所以為什么作者拉里•佩奇 Larry Page )和謝爾蓋•布林 (Sergey Brin)要取c0.85,在這篇文章How Google Finds Your Needle in the Web's Haystack 的最后部分討論到。

Pagerank算法除了對搜索結(jié)果進(jìn)行排序外,還可 以應(yīng)用到其它方面,如估算網(wǎng)絡(luò)流量,向后鏈接的預(yù)測器,為用戶導(dǎo)航等。這篇文章 PageRank sculptin g.講述了當(dāng)前Google的一些改進(jìn).

    后記,2001年9月,PageRank被 授予美國專利,專利被正式頒發(fā)給斯坦福大學(xué),佩奇作為發(fā)明人列于文件中。最后要說的一點(diǎn),分析PR算法,用到了離散數(shù)學(xué),線性 代數(shù),概率論,數(shù)值計(jì)算甚至隨機(jī)過程,所以看來數(shù)學(xué)確實(shí)很好很強(qiáng)大需要認(rèn)真學(xué)習(xí)啊。


from:

http://hi.baidu.com/alphahunters/blog/item/e0e8a92d1b2820321f3089a0.html

http://blog.csdn.net/boyplayee/archive/2009/09/13/4548930.aspx


posted on 2010-04-05 17:15 chatler 閱讀(720) 評論(0)  編輯 收藏 引用 所屬分類: Algorithm
<2025年12月>
30123456
78910111213
14151617181920
21222324252627
28293031123
45678910

常用鏈接

留言簿(10)

隨筆分類(307)

隨筆檔案(297)

algorithm

Books_Free_Online

C++

database

Linux

Linux shell

linux socket

misce

  • cloudward
  • 感覺這個(gè)博客還是不錯(cuò),雖然做的東西和我不大相關(guān),覺得看看還是有好處的

network

OSS

  • Google Android
  • Android is a software stack for mobile devices that includes an operating system, middleware and key applications. This early look at the Android SDK provides the tools and APIs necessary to begin developing applications on the Android platform using the Java programming language.
  • os161 file list

overall

搜索

  •  

最新評論

閱讀排行榜

評論排行榜

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            夜夜嗨av一区二区三区中文字幕| 91久久久国产精品| 亚洲一区免费网站| 久久爱www久久做| 好吊色欧美一区二区三区四区| 久久精品91| 亚洲成人资源网| 夜夜嗨一区二区三区| 国产精品高潮呻吟久久| 亚洲综合精品自拍| 蜜臀av在线播放一区二区三区| 亚洲三级免费| 国产精品久久久久久久久久免费 | 最新国产成人av网站网址麻豆| 欧美va天堂| 亚洲视频免费看| 久久aⅴ乱码一区二区三区| 国产婷婷成人久久av免费高清| 久久久不卡网国产精品一区| 亚洲国产三级网| 欧美亚洲免费电影| 亚洲欧洲久久| 国产精品综合色区在线观看| 久久尤物电影视频在线观看| 一本大道久久精品懂色aⅴ| 久久黄色影院| 亚洲素人在线| 亚洲国产aⅴ天堂久久| 欧美性猛交xxxx乱大交蜜桃| 久久久久在线| 亚洲欧美电影院| 亚洲精品美女免费| 久久男人av资源网站| 亚洲一区二区影院| 亚洲黄色免费电影| 国产一区二区三区四区五区美女| 欧美极品在线播放| 久久久另类综合| 亚洲欧美视频在线观看| 亚洲精品国产精品国自产观看浪潮| 久久激情网站| 亚洲女人av| 日韩一级免费观看| 在线欧美日韩| 国产亚洲人成a一在线v站 | 国产欧美日韩不卡| 欧美日韩精品在线观看| 久久综合伊人77777麻豆| 欧美亚洲免费电影| 亚洲午夜激情在线| 日韩视频免费观看| 亚洲国产精品成人久久综合一区| 久久偷窥视频| 久久久久国产精品一区| 亚洲欧美在线视频观看| 亚洲私人影吧| 在线视频你懂得一区| 亚洲精品视频二区| 亚洲激情电影中文字幕| 一区二区三区在线免费视频| 国产情人综合久久777777| 国产精品va| 国产精品久久久对白| 欧美三级乱码| 欧美体内she精视频| 欧美日韩另类丝袜其他| 欧美日韩国产不卡在线看| 欧美精品亚洲二区| 欧美日韩高清区| 欧美日韩一区二区欧美激情 | 亚洲大胆美女视频| 在线观看欧美黄色| 亚洲国产另类精品专区| 亚洲国产另类久久精品| 亚洲国产成人tv| 亚洲日本中文字幕| 日韩亚洲在线观看| 亚洲无吗在线| 新片速递亚洲合集欧美合集| 午夜久久资源| 久久国产精品久久精品国产| 久久精品国产精品亚洲精品| 久久久人成影片一区二区三区观看| 久久久精品一区| 嫩草影视亚洲| 亚洲欧洲一区| 一本色道久久综合| 午夜激情一区| 久久天堂国产精品| 欧美久色视频| 国产精品日韩一区二区| 国产欧美在线观看| 亚洲国产精品久久久久秋霞影院 | 欧美激情第六页| 欧美日韩精品一区二区在线播放 | 久久久免费精品| 欧美jizz19hd性欧美| 亚洲品质自拍| 亚洲视频在线一区观看| 欧美中文字幕精品| 欧美精品一区三区| 国产欧美日韩视频| 最新日韩在线视频| 亚洲欧美日韩国产一区二区三区| 久久深夜福利免费观看| 91久久精品国产91久久性色| 亚洲一区一卡| 你懂的网址国产 欧美| 欧美视频在线观看免费| 黄色日韩网站视频| 国产精品99久久久久久久vr| 久久久久久69| 日韩视频在线观看免费| 久久成人一区二区| 欧美日韩另类一区| 好看的日韩av电影| 亚洲性av在线| 女人香蕉久久**毛片精品| 一本久久a久久免费精品不卡| 欧美一级日韩一级| 欧美日韩精品在线| 在线成人h网| 欧美一区二区三区四区在线| 亚洲二区视频在线| 欧美中文字幕精品| 国产精品高潮视频| 亚洲精品黄网在线观看| 久久精品亚洲一区二区三区浴池 | 国产一区清纯| 在线亚洲+欧美+日本专区| 蜜桃av一区| 午夜久久久久久| 欧美香蕉大胸在线视频观看| 亚洲高清视频一区| 久久精品亚洲| 亚洲一区二区三区中文字幕 | 国产精品一区二区久久久久| 亚洲精品一线二线三线无人区| 久久国产视频网站| 亚洲桃色在线一区| 欧美日韩伦理在线免费| 亚洲激情网址| 美日韩精品免费| 久久福利毛片| 国产日韩欧美a| 亚洲欧美高清| 国产精品99久久不卡二区| 欧美喷水视频| aⅴ色国产欧美| 91久久久一线二线三线品牌| 久久综合一区| 91久久国产自产拍夜夜嗨| 免费在线成人av| 久久欧美肥婆一二区| 精品99视频| 老色鬼久久亚洲一区二区| 欧美伊人久久大香线蕉综合69| 国产精品一区二区三区免费观看| 亚洲欧美成人一区二区三区| 一本色道久久88精品综合| 欧美视频日韩视频在线观看| 亚洲视频观看| 亚洲网站啪啪| 国产人久久人人人人爽| 欧美中文字幕不卡| 午夜一区在线| 激情亚洲网站| 欧美成人亚洲成人日韩成人| 久久精视频免费在线久久完整在线看| 韩国一区二区三区在线观看| 久久艳片www.17c.com| 另类av一区二区| 亚洲美女在线一区| 夜夜精品视频一区二区| 国产精品夜夜夜| 久久青草久久| 女人色偷偷aa久久天堂| 一区二区三区国产精品| 亚洲午夜高清视频| 国产一区日韩欧美| 欧美国产另类| 欧美色欧美亚洲另类二区| 午夜伦欧美伦电影理论片| 久久激五月天综合精品| 亚洲电影免费观看高清完整版| 亚洲国产老妈| 国产精品系列在线播放| 欧美 日韩 国产 一区| 欧美精品一区视频| 欧美一区二区黄色| 久久免费视频网站| 一区二区三区.www| 亚洲欧美中日韩| 亚洲激情专区| 亚洲永久精品国产| 亚洲电影在线| 亚洲无吗在线| 亚洲高清久久网| 亚洲午夜激情网站| 亚洲国内在线|