• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            不會飛的鳥

            2010年12月10日 ... 不鳥他們!!! 我要用自己開發的分布式文件系統、分布式調度系統、分布式檢索系統, 做自己的搜索引擎!!!大魚有大志!!! ---楊書童

            [轉]相似圖片搜索的原理(二)

            昨天,我在isnowfy的網站看到,還有其他兩種方法也很簡單,這里做一些筆記。

            一、顏色分布法

            每張圖片都可以生成顏色分布的直方圖(color histogram)。如果兩張圖片的直方圖很接近,就可以認為它們很相似。

            任何一種顏色都是由紅綠藍三原色(RGB)構成的,所以上圖共有4張直方圖(三原色直方圖 + 最后合成的直方圖)。

            如果每種原色都可以取256個值,那么整個顏色空間共有1600萬種顏色(256的三次方)。針對這1600萬種顏色比較直方圖,計算量實在太大了,因此需要采用簡化方法。可以將0~255分成四個區:0~63為第0區,64~127為第1區,128~191為第2區,192~255為第3區。這意味著紅綠藍分別有4個區,總共可以構成64種組合(4的3次方)。

            任何一種顏色必然屬于這64種組合中的一種,這樣就可以統計每一種組合包含的像素數量。

            上圖是某張圖片的顏色分布表,將表中最后一欄提取出來,組成一個64維向量(7414, 230, 0, 0, 8, ..., 109, 0, 0, 3415, 53929)。這個向量就是這張圖片的特征值或者叫"指紋"。

            于是,尋找相似圖片就變成了找出與其最相似的向量。這可以用皮爾遜相關系數或者余弦相似度算出。

            二、內容特征法

            除了顏色構成,還可以從比較圖片內容的相似性入手。

            首先,將原圖轉成一張較小的灰度圖片,假定為50x50像素。然后,確定一個閾值,將灰度圖片轉成黑白圖片。

              

            如果兩張圖片很相似,它們的黑白輪廓應該是相近的。于是,問題就變成了,第一步如何確定一個合理的閾值,正確呈現照片中的輪廓?

            顯然,前景色與背景色反差越大,輪廓就越明顯。這意味著,如果我們找到一個值,可以使得前景色和背景色各自的"類內差異最小"(minimizing the intra-class variance),或者"類間差異最大"(maximizing the inter-class variance),那么這個值就是理想的閾值。

            1979年,日本學者大津展之證明了,"類內差異最小"與"類間差異最大"是同一件事,即對應同一個閾值。他提出一種簡單的算法,可以求出這個閾值,這被稱為"大津法"(Otsu's method)。下面就是他的計算方法。

            假定一張圖片共有n個像素,其中灰度值小于閾值的像素為 n1 個,大于等于閾值的像素為 n2 個( n1 + n2 = n )。w1 和 w2 表示這兩種像素各自的比重。

              w1 = n1 / n

              w2 = n2 / n

            再假定,所有灰度值小于閾值的像素的平均值和方差分別為 μ1 和 σ1,所有灰度值大于等于閾值的像素的平均值和方差分別為 μ2 和 σ2。于是,可以得到

              類內差異 = w1(σ1的平方) + w2(σ2的平方)

              類間差異 = w1w2(μ1-μ2)^2

            可以證明,這兩個式子是等價的:得到"類內差異"的最小值,等同于得到"類間差異"的最大值。不過,從計算難度看,后者的計算要容易一些。

            下一步用"窮舉法",將閾值從灰度的最低值到最高值,依次取一遍,分別代入上面的算式。使得"類內差異最小"或"類間差異最大"的那個值,就是最終的閾值。具體的實例和Java算法,請看這里

            有了50x50像素的黑白縮略圖,就等于有了一個50x50的0-1矩陣。矩陣的每個值對應原圖的一個像素,0表示黑色,1表示白色。這個矩陣就是一張圖片的特征矩陣。

            兩個特征矩陣的不同之處越少,就代表兩張圖片越相似。這可以用"異或運算"實現(即兩個值之中只有一個為1,則運算結果為1,否則運算結果為0)。對不同圖片的特征矩陣進行"異或運算",結果中的1越少,就是越相似的圖片。

            posted on 2014-03-06 21:42 不會飛的鳥 閱讀(346) 評論(0)  編輯 收藏 引用

            国产亚洲成人久久| 久久精品国产亚洲AV香蕉| 狠狠色婷婷综合天天久久丁香| 国产精品久久久久影视不卡| 国产精品激情综合久久| 久久久久久青草大香综合精品| 久久久久国产一区二区三区| 久久精品国产亚洲AV影院| 久久精品99久久香蕉国产色戒 | 国内精品久久久久久久久| yellow中文字幕久久网| 久久91精品国产91| 日韩精品久久久久久| 亚洲国产精品综合久久一线| 国产精品久久久久久吹潮| 亚洲国产成人精品久久久国产成人一区二区三区综 | 久久婷婷国产综合精品| 久久99精品久久久久久秒播 | 欧美亚洲国产精品久久高清| 国内精品久久久久影院免费| 久久综合亚洲鲁鲁五月天| 国产福利电影一区二区三区久久久久成人精品综合 | 伊人久久大香线蕉综合5g| 99久久综合狠狠综合久久止| 久久午夜无码鲁丝片秋霞| 久久精品免费大片国产大片| 精品久久久久久国产91| 色婷婷综合久久久久中文一区二区| 久久精品中文字幕第23页| 香蕉久久一区二区不卡无毒影院| 麻豆成人久久精品二区三区免费| 欧美久久久久久| 亚洲国产成人久久综合野外| 久久精品无码免费不卡| 久久久无码精品亚洲日韩软件| 大蕉久久伊人中文字幕| 91精品国产91久久久久久青草 | 成人午夜精品无码区久久| 精品伊人久久大线蕉色首页| 久久www免费人成看片| 久久综合给合久久狠狠狠97色69 |