1)基于手工標注的檢索
對圖像的內容(如物體、背景、構成、顏色等)進行人工描述并分類,將其標注為一系列關鍵字,并對關鍵字建立索引,當用戶輸入關鍵字后,系統可以根據數據庫中的倒排文件將關鍵字映射為M站或網頁的地址。但是,由人工完整地標注所有圖像,勞動強度太大,限制處理圖像的數量。由于圖像所包含的信息量競大,不同用戶對于同一張圖像的看法不盡相同,這就導致對圖像的標注沒有一個統一標準。
2)基于圖像外部信息進行檢索
即根據圖像的文件釔或目錄名、路徑名、頁面標題、ALT標
簽以及圖像周圍的文本信息等外部信啟、進行檢索,這是目前圖
像搜索引擎采用最多的方法。
3)基于內容的圖像檢索|.
目前基于內容的圖像檢索技術主要集中在顏色、紋理、形狀等低層物理特征提取的基礎上.基于高層語義的檢索正有待研究。顏色具有大小、方向、位置不變性,可以用直方圖、顏色距、顏色集、主色調等表征,顏色是描述圖像最有效的特征之一。紋理是指圖像像素灰度集或顏色的某種規律性的變化,即圖像中局部不規則而整體有規律的特性稱之為紋理,紋理是從像素分布的方ruJ性和位置等得到的有意義的統汁數據。紋理特征主要包
括粗糙度、方向性、線性、對比度以及規則性,如人體肌膚的紋理、毛發、天空、水、織物、樹木的紋理等。形狀包括面積、連通性、環行性、偏心率、主軸方向等特征。很多情況下同一物體可能有各種不同的顏色,但其形狀總是相似的,如汽車。另外,對于圖形來說,形狀是它惟一重要的特征..圖像中某目標的邊緣稱為輪廓,而基于形狀或輪廓的檢索是圖像內容檢索的一個重要方面,它能從用戶勾勒的圖像的形狀或輪廓入手,在圖像庫中檢索出形狀相似的圖像。
4)反饋與學習技術
相關反饋是在信息檢索系統中的一種用戶指導性學習的技術,用以優化系統的檢索能力 。對于檢索的結果,系統根據用戶反饋給系統的指導信息(哪些符合用戶需求,哪些不符合),對I大J部檢索參數進行 整,從而優化檢索結果并提供給用戶新的檢索結果。
基于內容的圖像搜索引擎工作原理
基于內容的圖像搜索引擎,是建立在基于內容的圖像檢索技術之上的圖像搜索工具,可以為在Web上瀏覽過的圖像建立索引信息,能夠進行圖像分析和判別,為圖像加注釋,存儲抽取出的索引信息并建立索引庫?;趦热莸膱D像檢索技術,可謂目前最流行的檢索技術之一。它在特征匹配時,幾乎不需要用戶的參與,而主要利用圖像自身的特征(如顏色、紋理、形狀等)來完成,具有較強的客觀性和直觀性。利用這一特點,可以用來抽取各類圖像庫中所有圖像文件的特征。在檢索過程中,用戶一般只需提供一個示例圖像,系統首先抽取該示例圖像的特征,然后根據圖像特征的相似性匹配算法,與圖像庫中相應的特征進行比較,最后將與示例特征相似的圖像返回給用戶,以達到一個完整的圖像檢索過程。
基于內容的圖像檢索技術可分為以下幾種:
①基于顏色特征的檢索
在一幅圖像的各種特征中,顏色特征是其中最直觀、最明顯的特征。一般采用直方圖來描述這種特征。顏色直方圖是表示圖像中顏色分布的一種方法,它的橫軸表示顏色等級,縱軸表示在某一個顏色等級上具有該顏色的像素在整幅圖像中所占的比例,直方圖顏色空間中的每一個刻度表示了顏色空間中的一種顏色。采用直方圖計算圖像間的相似性比較簡單,但它不能反映圖像中對象的空間特征。
②基于紋理特征的檢索
圖像可以看成是不同紋理區域的組合。紋理通常定義為圖像的某種局部性質,或是對局部區域中像素之間關系的一種度量。紋理特征可用來對圖像中的空間信息進行一定程度的定量描述。根據紋理特征進行檢索,主要考慮粗糙性、方向性和對比性三種特征。由于紋理描述比較困難,一般對紋理的檢索都采用示例查詢(QueryByExample)方式。用戶給出示例的全部或部分區域特征,從而找到類似圖像。
③基于形狀特征的檢索
采用該特征進行檢索時,用戶通過勾勒圖像的形狀或輪廓,從圖像庫中搜出與該形狀類似的圖像?;诖颂卣鞯臋z索方法有兩種:
其一,分割圖像經過邊緣提取后,得到目標圖像的輪廓線,針對這種輪廓線進行形狀特征檢索。
其二,直接針對圖形,尋找適當的矢量特征檢索算法。但處理這種結構化檢索更為復雜,需要做更多的預處理。
一般說來,基于內容的種圖像搜索引擎,需要完成以下四種工作:
在網上搜集圖像信息、圖像的相似性計算、為搜集到的
圖像信息建立并維護索引庫、回答用戶的查詢。其詳細的工作
過程如圖所示
