兔子的技術博客

兔子

:: 首頁 :: 聯系 :: 聚合

:: 管理

202 Posts :: 0 Stories :: 43 Comments :: 0 Trackbacks

留言簿(10)

隨筆分類(224)

收藏夾(13)

狡兔多窟

百度
博客園
賽迪
網易

收藏博客

CodeWay(程序數學物理)
laviewpbt 的博客（圖像算法_VB）
maozefa的博客（圖像算法）
mybios(DX,圖形圖像)
MYCP
開源C++ Web應用服務器中間件（國內開源項目）
Stephen Liu
c++，web，lua，管理等
zyl910 的博客（圖像算法_C++）
λ-calculus（編譯原理）
鋒鋒 FFLIB作者
知其然，知其所以然。熱愛IT技術，分享科技生活。專注于分布式、互聯網、游戲的開發技術。無聊夢見憂郁，找到理想不太易，理想有日達成，找到心底夢想的世界。BEYOND！
羅朝輝（飄飄白云）
關注C++，3D技術，游戲開發，移動開發（iPhone/iPad，Android等）
人月神話的BLOG（軟件工程）
算法，C++技術
小豬的網絡編程
網絡編程技術，VA破解實時發布
易飛揚
ios 開發
重劍無鋒，大巧不工
游戲開發 Flash Scaleform GFx C++
周京生的博客(VS2010 ,TFS2010)
VS2010 ,TFS2010
子龍山人
iphone 開發

閱讀排行榜

評論排行榜

RGB，YUV的來歷及其相互轉換

在視頻等相關的應用中，YUV是一個經常出現的格式。本文主要以圖解的資料的形式詳細描述YUV和RGB格式的來由，相互關系以及轉換方式，并對C語言實現的YUV轉為RGB程序進行介紹。

人類眼睛的色覺，具有特殊的特性，早在上世紀初，Young（1809）和Helmholtz（1824）就提出了視覺的三原色學說，即：視網膜存在三種視錐細胞，分別含有對紅、綠、藍三種光線敏感的視色素，當一定波長的光線作用于視網膜時，以一定的比例使三種視錐細胞分別產生不同程度的興奮，這樣的信息傳至中樞，就產生某一種顏色的感覺。

70年代以來，由于實驗技術的進步，關于視網膜中有三種對不同波長光線特別敏感的視錐細胞的假說，已經被許多出色的實驗所證實。例如：①有人用不超過單個視錐直徑的細小單色光束，逐個檢查并繪制在體（最初實驗是在金魚和蠑螈等動物進行，以后是人）視錐細胞的光譜吸收曲線，發現所有繪制出來的曲線不外三種類型，分別代表了三類光譜吸收特性不同的視錐細胞，一類的吸收峰值在420nm處，一類在534nm處，一類在564nm處，差不多正好相當于藍、綠、紅三色光的波長。與上述視覺三原色學說的假設相符。②用微電極記錄單個視錐細胞感受器電位的方法，也得到了類似的結果，即不同單色光所引起的不同視錐細胞的超極化型感受器電位的大小也不同，峰值出現的情況符合于三原色學說。

于是，在彩色顯示器還沒有發明的時候，人類已經懂得使用三原色光調配出所有顏色的光。并不是說三原色混合后產生了新的頻率的光，而是給人眼睛的感覺是這樣。

在顯示器發明之后，從黑白顯示器發展到彩色顯示器，人們開始使用發出不同顏色的光的熒光粉（CRT，等離子體顯示器），或者不同顏色的濾色片（LCD），或者不同顏色的半導體發光器件（OLED和LED大型全彩顯示牌）來形成色彩，無一例外的選擇了Red,Green,Blue這3種顏色的發光體作為基本的發光單元。通過控制他們發光強度，組合出了人眼睛能夠感受到的大多數的自然色彩。

計算機顯示彩色圖像的時候也不例外，最終顯示的時候，要控制一個像素中Red,Green,Blue的值，來確定這個像素的顏色。計算機中無法模擬連續的存儲從最暗到最亮的量值，而只能以數字的方式表示。于是，結合人眼睛的敏感程度，使用3個字節（3*8位）來分別表示一個像素里面的Red,Green和Blue的發光強度數值，這就是常見的RGB格式。我們可以打開畫圖板，在自定義顏色工具框中，輸入r,g,b值，得到不同的顏色。

但是對于視頻捕獲和編解碼等應用來講，這樣的表示方式數據量太大了。需要想辦法在不太影響感覺的情況下，對原始數據的表示方法進行更改，減少數據量。

無論中間處理過程怎樣，最終都是為了展示給人觀看，這樣的更改，也是從人眼睛的特性出發，和發明RGB三原色表示方法的出發點是一樣的。

于是我們使用Y,Cb,Cr模型來表示顏色。Iain的書中寫道：The human visual system (HVS) is less sensitive to colour than to luminance (brightness).人類視覺系統（其實就是人的眼睛）對亮度的感覺比對顏色更加敏感。

在RGB色彩空間中，三個顏色的重要程度相同，所以需要使用相同的分辨率進行存儲，最多使用RGB565這樣的形式減少量化的精度，但是3個顏色需要按照相同的分辨率進行存儲，數據量還是很大的。所以，利用人眼睛對亮度比對顏色更加敏感，將圖像的亮度信息和顏色信息分離，并使用不同的分辨率進行存儲，這樣可以在對主觀感覺影響很小的前提下，更加有效的存儲圖像數據。

YCbCr色彩空間和它的變形（有時被稱為YUV）是最常用的有效的表示彩色圖像的方法。Y是圖像的亮度（luminance/luma）分量，使用以下公式計算，為R,G,B分量的加權平均值：

Y = kr R + kgG + kbB

其中k是權重因數。

上面的公式計算出了亮度信息，還有顏色信息，使用色差（color difference/chrominance或chroma）來表示，其中每個色差分量為R,G,B值和亮度Y的差值：

　　Cb = B －Y

　　Cr = R －Y

Cg = G－ Y

其中，Cb+Cr+Cg是一個常數（其實是一個關于Y的表達式），所以，只需要其中兩個數值結合Y值就能夠計算出原來的RGB值。所以，我們僅保存亮度和藍色、紅色的色差值，這就是(Y,Cb,Cr)。

相比RGB色彩空間，YCbCr色彩空間有一個顯著的優點。Y的存儲可以采用和原來畫面一樣的分辨率，但是Cb,Cr的存儲可以使用更低的分辨率。這樣可以占用更少的數據量，并且在圖像質量上沒有明顯的下降。所以，將色彩信息以低于量度信息的分辨率來保存是一個簡單有效的圖像壓縮方法。

在COLOUR SPACES .17 ITU-R recommendation BT.601 中，建議在計算Y時，權重選擇為kr=0.299,kg=0.587,kb=0.114。于是常用的轉換公式如下：

Y = 0.299R + 0.587G + 0.114B

Cb = 0.564(B － Y )

Cr = 0.713(R － Y )

R = Y + 1.402Cr

G = Y - 0.344Cb - 0.714Cr

B = Y + 1.772Cb

有了這個公式，我們就能夠將一幅RGB畫面轉換成為YUV畫面了，反過來也可以。下面將畫面數據究竟是以什么形式存儲起來的。

在RGB24格式中，對于寬度為w,高度為h的畫面，需要w*h*3個字節來存儲其每個像素的rgb信息，畫面的像素數據是連續排列的。按照r(0,0),g(0,0),b(0,0);r(0,1),g(0,1),b(0,1);…;r(w-1,0),g(w-1,0),b(w-1,0);…;r(w-1,h-1),g(w-1,h-1),b(w-1,h-1)這樣的順序存放起來。

在YUV格式中，以YUV420格式為例。寬度為w高度為h的畫面，其亮度Y數據需要w*h個字節來表示（每個像素點一個亮度）。而Cb和Cr數據則是畫面中4個像素共享一個Cb,Cr值。這樣Cb用w*h/4個字節，Cr用w*h/4個字節。

YUV文件中，把多個幀的畫面連續存放。就是YUV YUV YUV…..這樣的不斷連續的形式，而其中每個YUV，就是一幅畫面。

在這單個YUV中，前w*h個字節是Y數據，接著的w*h/4個字節是Cb數據，再接著的w*h/4個字節為Cr數據。

在由這樣降低了分辨率的數據還原出RGB數據的時候，就要依據像素的位置找到它對應的Y,Cb,Cr值，其中Y值最好找到，像素位置為x,y的話，Y數據中第y*width+x個數值就是它的Y值。Cb和Cr由于是每2x2像素的畫面塊擁有一個，這樣Cb和Cr數據相當于兩個分辨率為w/2 * h/2的畫面，那么原來畫面中的位置為x,y的像素，在這樣的低分辨率畫面中的位置是x/2,y/2，屬于它的Cb,Cr值就在這個地方：(y/2)*(width/2)+(x/2)。

為了直觀起見，再下面的圖中，分別將Y畫面(Cb,Cr=0)和Cb,Cr畫面(Y=128)顯示出來，可見Cb,Cr畫面的分辨率是Y畫面的1/4。但是合成一個畫面之后，我們的眼睛絲毫感覺不到4個像素是共用一個Cb,Cr的。

Cb,Cr畫面

將Cb,Cr畫面放大觀察，里面顏色相同的塊都是2x2大小的。

附件為Windows Mobile上使用公式進行YUV到RGB轉換的程序。其中需要注意的是Cb,Cr在計算過程中是會出現負數的，但是從-128到127這些數值都用一個字節表示，讀取的時候就映射0到255這個區間，成為了無符號的值，所以要減去128，才能參與公式計算。這樣的運算有浮點運算，效率是比較低的，所以要提高效率的話，一般在實用程序中使用整數計算或者查表法來代替。還有，運算后的r,g,b可能會超過0-255的區間，作一個判斷進行調整就可以了。

不過這里面的YUV TO RGB的算法,效率實在是低,因為里面有了浮點運算,解一幀176*144的圖像大概需要400ms左右,這是無法忍受的,如果消除浮點運算,只需要10ms左右,效率的提升真是無法想象.所以大家還是避免在手機上面進行浮點運算.

轉自：http://www.shnenglu.com/gtwdaizi/articles/32956.html

posted on 2011-07-14 14:35 會飛的兔子閱讀(774) 評論(0) 編輯收藏引用所屬分類: 非C++技術資料

只有注冊用戶登錄后才能發表評論。


相關文章: lua與c++的相互調用 http協議中get和post的區別(轉) 跑步的好處解析swf文件頭，獲取flash的原始尺寸 RGB，YUV的來歷及其相互轉換 This Setup was created with a BETA VERSION of InstallShield 批處理教程（十分經典）五個方法成為更好的程序員網上銀行安全證書工作原理 Windows批處理環境變量大全

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品