總體設(shè)計(jì)方案:
??????
本文將采取基于特征的方法對圖像進(jìn)行聚類與檢索。基于特征對圖像進(jìn)行聚類與檢索的基本方法是在建立圖像庫時(shí)
,
對輸入的圖像先進(jìn)行圖像分析
,
提取圖像或目標(biāo)的特征向量并根據(jù)特征向量及匹配算法等將圖像進(jìn)行聚類。在進(jìn)行圖像檢索時(shí)
,
對每一幅給定的查詢圖
,
進(jìn)行圖像分析并提取該圖的特征向量。通過將該圖特征向量與特征庫中的特征向量進(jìn)行匹配并根據(jù)匹配結(jié)果到圖像庫中搜索就可提取出所需要的檢索圖像來。
??????
由上述工作原理可以知道基于特征的圖像聚類與檢索有四個(gè)關(guān)鍵
,
一是要從圖像中抽取分類和檢索的特征
,
二是確定建立在相應(yīng)特征基礎(chǔ)上的圖像相似性度量
,
三是要利用聚類算法對圖像庫中的圖像進(jìn)行聚類,四是要利用匹配算法在圖像庫中檢索相應(yīng)的圖像。
1 .從圖像中抽取分類和檢索的特征
??????
我們知道,一幅圖像是以矩陣的形式存儲(chǔ)在計(jì)算機(jī)中的,具體地講,矩陣上某一點(diǎn)的值代表了圖像在該點(diǎn)的顏色信息,正是許多這樣的點(diǎn)的組合、排列呈現(xiàn)在我們的眼中才使得繽紛五彩的世界得以在計(jì)算機(jī)的屏幕上顯示出來。然而對于圖像聚類和圖像檢索來說,將全部這些點(diǎn)作為數(shù)據(jù)進(jìn)行分析處理是沒有必要也是不切實(shí)際的。例如在汽車車型識別中,圖像中的道路和行人以及其他建筑物都屬于無用信息,對于識別車型來說沒有任何意義,應(yīng)該將其去除,否則在識別時(shí)會(huì)產(chǎn)生不利影響。
??????
所謂特征是從模式中得到的對分類有用的度量或?qū)傩裕瑧?yīng)該能夠反映不同類別之間的本質(zhì)差別。正如我們每個(gè)人具有高、矮、胖、瘦各不相同的特征一樣,不同的圖像之間也存在著互相得以區(qū)分的特征。在圖像聚類與檢索中,這些特征一般表示為一組數(shù)字,這些數(shù)字構(gòu)成一個(gè)矢量,稱為特征矢量。抓住關(guān)鍵特征,忽略其它信息是一種通用的、有效的方法。顏色和紋理是圖像的兩個(gè)最重要的特征,本文將對顏色和紋理的聚類與檢索進(jìn)行探討。
l????????
顏色
??????
在圖像的自動(dòng)分析檢索中,顏色是一種能夠簡化目標(biāo)提取和分類的一種重要描述符,最早在基于內(nèi)容的圖像檢索中得到應(yīng)用。顏色特征定義比較明確,抽取也相對容易,所以在圖像處理中得到廣泛的重視和應(yīng)用,并已提出了很多成熟的算法。對顏色特征的表達(dá)方式有很多種,如直方圖法,累積直方圖法,局部累加直方圖法,顏色布局法,中心矩法等。由于顏色的信息量比較大,所以各種方法的共同的一點(diǎn)就是要用較有效和緊湊的辦法來表達(dá)顏色信息。
l????????
紋理
??????
紋理是另一個(gè)用于描述圖像的常用的概念。紋理通常被看作圖像的某種局部特性,或是對局部區(qū)域中圖像間關(guān)系的一種度量。另外,紋理信息也可以用來對圖像中的空間信息進(jìn)行一定程度的定量描述。基于紋理的圖像檢索也有很多成果。
2. 確定建立在相應(yīng)特征基礎(chǔ)上的圖像相似性度量
??????
獲取了圖像的特征為我們接下來的工作奠定了良好的基礎(chǔ),我們的目標(biāo)是圖像的聚類和檢索,從根本上說就是將特征相近的圖像找出來。這里的“特征相近”只是一個(gè)直觀上的概念,何謂“相近”,不同的情況下有著不同的解釋。因此,我們很有必要定義一個(gè)具體的數(shù)學(xué)描述符定量的體現(xiàn)兩幅圖片間“相近”的程度,這就是相似性度量。顯然,我們的目標(biāo)就是找到相似度最小的圖像。
3.利用聚類算法對圖像庫中的圖像進(jìn)行聚類
??????
人類的分類識別能力不是與生俱來的,而是后天經(jīng)過不斷的實(shí)踐和學(xué)習(xí)而逐漸具有的功能,例如對語言的學(xué)習(xí),對文字的學(xué)習(xí)。
??????
在圖像檢索的過程中我們同樣面臨著分類的任務(wù),具體地講就是圖像的聚類。所謂圖像聚類就是將未知類別的一組圖像分成若干類的過程,也稱無監(jiān)督學(xué)習(xí)或無教師學(xué)習(xí)。聚類分析的思路比較直觀,根據(jù)各個(gè)待分類圖像特征的相似程度來進(jìn)行分類,將在特征空間中聚集在一起的樣本點(diǎn)劃分為一類。選擇合適的聚類算法對圖像庫中的圖像進(jìn)行聚類,是我們的核心任務(wù)之一。
4.利用匹配算法在圖像庫中檢索相應(yīng)的圖像
??????
匹配可理解為結(jié)合不同的、已經(jīng)存在的表達(dá)而建立他們的解釋之間的聯(lián)系的技術(shù)與過程。從廣義上講,匹配是要研究如何把知識模型與從圖像獲得的描述信息對應(yīng)起來,從而達(dá)到識別目標(biāo),理解圖像,認(rèn)知世界的過程。而具體到基于內(nèi)容的圖像信息檢索,就是要將從查詢要求通過分析而得到的描述與需要檢索的圖像數(shù)據(jù)庫中個(gè)體的描述進(jìn)行比較,以便提取出視覺效果或語義內(nèi)容最為接近/相似的個(gè)體。
??????
通俗地講,我們就是要根據(jù)用戶需要檢索的圖像的特征,到圖像庫中與現(xiàn)存的圖像特征進(jìn)行比較,根據(jù)一定的算法,找出相似度最小的一個(gè)或一組圖像,完成一個(gè)匹配過程,將用戶最希望得到的圖像信息檢索出來。
小結(jié):
??????
通過從圖像中抽取分類和檢索的特征
,
確定建立在相應(yīng)特征基礎(chǔ)上的圖像相似性度量
,
利用聚類算法對圖像庫中的圖像進(jìn)行聚類,利用匹配算法在圖像庫中檢索相應(yīng)的圖像這四個(gè)步驟,我們基本提出了一個(gè)可行的圖像聚類與檢索的方案,接下來探討一些具體的關(guān)鍵技術(shù)與實(shí)驗(yàn)。
posted on 2006-04-21 20:32
Arthur_QA 閱讀(1778)
評論(0) 編輯 收藏 引用