總體設計方案:
??????
本文將采取基于特征的方法對圖像進行聚類與檢索。基于特征對圖像進行聚類與檢索的基本方法是在建立圖像庫時
,
對輸入的圖像先進行圖像分析
,
提取圖像或目標的特征向量并根據特征向量及匹配算法等將圖像進行聚類。在進行圖像檢索時
,
對每一幅給定的查詢圖
,
進行圖像分析并提取該圖的特征向量。通過將該圖特征向量與特征庫中的特征向量進行匹配并根據匹配結果到圖像庫中搜索就可提取出所需要的檢索圖像來。
??????
由上述工作原理可以知道基于特征的圖像聚類與檢索有四個關鍵
,
一是要從圖像中抽取分類和檢索的特征
,
二是確定建立在相應特征基礎上的圖像相似性度量
,
三是要利用聚類算法對圖像庫中的圖像進行聚類,四是要利用匹配算法在圖像庫中檢索相應的圖像。
1 .從圖像中抽取分類和檢索的特征
??????
我們知道,一幅圖像是以矩陣的形式存儲在計算機中的,具體地講,矩陣上某一點的值代表了圖像在該點的顏色信息,正是許多這樣的點的組合、排列呈現在我們的眼中才使得繽紛五彩的世界得以在計算機的屏幕上顯示出來。然而對于圖像聚類和圖像檢索來說,將全部這些點作為數據進行分析處理是沒有必要也是不切實際的。例如在汽車車型識別中,圖像中的道路和行人以及其他建筑物都屬于無用信息,對于識別車型來說沒有任何意義,應該將其去除,否則在識別時會產生不利影響。
??????
所謂特征是從模式中得到的對分類有用的度量或屬性,應該能夠反映不同類別之間的本質差別。正如我們每個人具有高、矮、胖、瘦各不相同的特征一樣,不同的圖像之間也存在著互相得以區分的特征。在圖像聚類與檢索中,這些特征一般表示為一組數字,這些數字構成一個矢量,稱為特征矢量。抓住關鍵特征,忽略其它信息是一種通用的、有效的方法。顏色和紋理是圖像的兩個最重要的特征,本文將對顏色和紋理的聚類與檢索進行探討。
l????????
顏色
??????
在圖像的自動分析檢索中,顏色是一種能夠簡化目標提取和分類的一種重要描述符,最早在基于內容的圖像檢索中得到應用。顏色特征定義比較明確,抽取也相對容易,所以在圖像處理中得到廣泛的重視和應用,并已提出了很多成熟的算法。對顏色特征的表達方式有很多種,如直方圖法,累積直方圖法,局部累加直方圖法,顏色布局法,中心矩法等。由于顏色的信息量比較大,所以各種方法的共同的一點就是要用較有效和緊湊的辦法來表達顏色信息。
l????????
紋理
??????
紋理是另一個用于描述圖像的常用的概念。紋理通常被看作圖像的某種局部特性,或是對局部區域中圖像間關系的一種度量。另外,紋理信息也可以用來對圖像中的空間信息進行一定程度的定量描述。基于紋理的圖像檢索也有很多成果。
2. 確定建立在相應特征基礎上的圖像相似性度量
??????
獲取了圖像的特征為我們接下來的工作奠定了良好的基礎,我們的目標是圖像的聚類和檢索,從根本上說就是將特征相近的圖像找出來。這里的“特征相近”只是一個直觀上的概念,何謂“相近”,不同的情況下有著不同的解釋。因此,我們很有必要定義一個具體的數學描述符定量的體現兩幅圖片間“相近”的程度,這就是相似性度量。顯然,我們的目標就是找到相似度最小的圖像。
3.利用聚類算法對圖像庫中的圖像進行聚類
??????
人類的分類識別能力不是與生俱來的,而是后天經過不斷的實踐和學習而逐漸具有的功能,例如對語言的學習,對文字的學習。
??????
在圖像檢索的過程中我們同樣面臨著分類的任務,具體地講就是圖像的聚類。所謂圖像聚類就是將未知類別的一組圖像分成若干類的過程,也稱無監督學習或無教師學習。聚類分析的思路比較直觀,根據各個待分類圖像特征的相似程度來進行分類,將在特征空間中聚集在一起的樣本點劃分為一類。選擇合適的聚類算法對圖像庫中的圖像進行聚類,是我們的核心任務之一。
4.利用匹配算法在圖像庫中檢索相應的圖像
??????
匹配可理解為結合不同的、已經存在的表達而建立他們的解釋之間的聯系的技術與過程。從廣義上講,匹配是要研究如何把知識模型與從圖像獲得的描述信息對應起來,從而達到識別目標,理解圖像,認知世界的過程。而具體到基于內容的圖像信息檢索,就是要將從查詢要求通過分析而得到的描述與需要檢索的圖像數據庫中個體的描述進行比較,以便提取出視覺效果或語義內容最為接近/相似的個體。
??????
通俗地講,我們就是要根據用戶需要檢索的圖像的特征,到圖像庫中與現存的圖像特征進行比較,根據一定的算法,找出相似度最小的一個或一組圖像,完成一個匹配過程,將用戶最希望得到的圖像信息檢索出來。
小結:
??????
通過從圖像中抽取分類和檢索的特征
,
確定建立在相應特征基礎上的圖像相似性度量
,
利用聚類算法對圖像庫中的圖像進行聚類,利用匹配算法在圖像庫中檢索相應的圖像這四個步驟,我們基本提出了一個可行的圖像聚類與檢索的方案,接下來探討一些具體的關鍵技術與實驗。
posted @
2006-04-21 20:32 Arthur_QA 閱讀(1775) |
評論 (0) |
編輯 收藏
目的和意義
??????
隨著科學技術的進步發展和推廣應用,特別是計算機技術和網絡技術的發展,信息高速公路的建設,以及多媒體的推廣應用,現代信息處理的對象和方法都有了很大的變化。大量的各種類型的信息在全球得到了采集、傳輸、流通和應用,人們正快速的進入一個信息化的社會。
??????
多媒體是一種極其重要的信息資源,現代技術已能運用各種手段大量地采集和產生各種類型的多媒體信息數據,而多媒體信息中占有舉足輕重作用的一種就是圖像信息。近年來隨著需求的增加、工藝技術的進步,以各種方式獲取的圖像信息的數量得到了飛速的增長,進入新世紀后,有人估計世界每年產生的新圖像已達
800
億幅,信息膨脹已給人類帶來過多的信息量以致超出了人的接受能力,有鑒于此,如何快速、準確、高效的從浩如煙海的圖像信息源(比如網絡)中獲取有用的信息就變得極為重要,近年來國際上廣泛開展了基于內容的圖像檢索研究,而其中圖像聚類與檢索技術已取得相當進展,在各個領域已得到了廣泛的應用。
??????
所謂圖像聚類就是在給出的圖像集合中,根據圖像的內容,在無先驗知識的條件下,將圖像分成有意義的簇。對于圖像聚類,最引人注目的特征屬性是顏色、紋理和形狀等。目前有很多有效的聚類技術,如層次聚類算法、基于分割的算法、混合——溶解算法、模式——搜尋算法、最近相鄰聚類、模糊聚類和進化聚類方法。
??????
所謂圖像檢索是從圖像數據庫中快速的提取出一個與查詢相關的圖像或圖像序列。隨著越來越多的圖像數據庫的建立和越來越多的圖像信息在數字檔案中的應用,對圖像信息檢索的需求越來越大。
??????
只有掌握了對圖像信息進行自動查詢和選擇的技術,才能使人類只接受或快速地獲取需要的信息而不至于淹沒于圖像信息的汪洋大海中。有鑒于此,本文將對圖像聚類與檢索的方法進行研究,本文的實驗圖庫為一特定情況下的圖像庫,具體地說是一組灰度圖像,該組圖像是一系列連續拍攝的列車行進照片,因此不同的圖像之間既有相似性,又有因運動和拍攝時間的不同而形成的差異性,對于實驗結果的分析較為有利。另外,如果時間、條件允許,也可以實現對任意圖像進行聚類、檢索(包括彩色圖像)。
posted @
2006-04-21 20:31 Arthur_QA 閱讀(660) |
評論 (0) |
編輯 收藏