posts - 48, comments - 21, trackbacks - 0

YUV主要的采樣格式

主要的采樣格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比較常用，其含義為：每個(gè)點(diǎn)保存一個(gè) 8bit 的亮度值(也就是Y值), 每 2x2 個(gè)點(diǎn)保存一個(gè) Cr 和Cb 值, 圖像在肉眼中的感覺(jué)不會(huì)起太大的變化。所以, 原來(lái)用 RGB(R,G,B 都是 8bit unsigned) 模型, 4 個(gè)點(diǎn)需要 8x3=24 bites（如下圖第一個(gè)圖）. 而現(xiàn)在僅需要 8+(8/4)+(8/4)=12bites, 平均每個(gè)點(diǎn)占12bites(如下圖第二個(gè)圖)。這樣就把圖像的數(shù)據(jù)壓縮了一半。

上邊僅給出了理論上的示例，在實(shí)際數(shù)據(jù)存儲(chǔ)中是有可能是不同的，下面給出幾種具體的存儲(chǔ)形式：

（1） YUV 4:4:4

YUV三個(gè)信道的抽樣率相同，因此在生成的圖像里，每個(gè)象素的三個(gè)分量信息完整（每個(gè)分量通常8比特），經(jīng)過(guò)8比特量化之后，未經(jīng)壓縮的每個(gè)像素占用3個(gè)字節(jié)。

下面的四個(gè)像素為: [Y₀ U₀ V₀] [Y₁ U₁ V₁] [Y₂ U₂ V₂] [Y₃ U₃ V₃]

存放的碼流為: Y₀ U₀ V₀ Y₁ U₁ V₁ Y₂ U₂ V₂ Y₃ U₃ V₃

（2） YUV 4:2:2

每個(gè)色差信道的抽樣率是亮度信道的一半，所以水平方向的色度抽樣率只是4:4:4的一半。對(duì)非壓縮的8比特量化的圖像來(lái)說(shuō)，每個(gè)由兩個(gè)水平方向相鄰的像素組成的宏像素需要占用4字節(jié)內(nèi)存。

下面的四個(gè)像素為: [Y₀ U₀ V₀] [Y₁ U₁ V₁] [Y₂ U₂ V₂] [Y₃ U₃ V₃]

存放的碼流為: Y₀ U₀ Y₁ V₁ Y₂ U₂ Y₃ V₃

映射出像素點(diǎn)為：[Y₀ U₀ V₁] [Y₁ U₀ V₁] [Y₂ U₂ V₃] [Y₃ U₂ V₃]

（3） YUV 4:1:1

4:1:1的色度抽樣，是在水平方向上對(duì)色度進(jìn)行4:1抽樣。對(duì)于低端用戶和消費(fèi)類產(chǎn)品這仍然是可以接受的。對(duì)非壓縮的8比特量化的視頻來(lái)說(shuō)，每個(gè)由4個(gè)水平方向相鄰的像素組成的宏像素需要占用6字節(jié)內(nèi)存

下面的四個(gè)像素為: [Y₀ U₀ V₀] [Y₁ U₁ V₁] [Y₂ U₂ V₂] [Y₃ U₃ V₃]

存放的碼流為: Y₀ U₀ Y₁ Y₂ V₂ Y₃

映射出像素點(diǎn)為：[Y₀ U₀ V₂] [Y₁ U₀ V₂] [Y₂ U₀ V₂] [Y₃ U₀ V₂]

（4）YUV4:2:0

4:2:0并不意味著只有Y,Cb而沒(méi)有Cr分量。它指得是對(duì)每行掃描線來(lái)說(shuō)，只有一種色度分量以2:1的抽樣率存儲(chǔ)。進(jìn)行隔行掃描，相鄰的掃描行存儲(chǔ)不同的色度分量，也就是說(shuō)，如果一行是4:2:0的話，下一行就是4:0:2，再下一行是4:2:0...以此類推。對(duì)每個(gè)色度分量來(lái)說(shuō)，水平方向和豎直方向的抽樣率都是2:1，所以可以說(shuō)色度的抽樣率是4:1。對(duì)非壓縮的8比特量化的視頻來(lái)說(shuō)，每個(gè)由2x2個(gè)2行2列相鄰的像素組成的宏像素需要占用6字節(jié)內(nèi)存。

下面八個(gè)像素為：[Y₀ U₀ V₀] [Y₁ U₁ V₁] [Y₂ U₂ V₂] [Y₃ U₃ V₃]

[Y₅ U₅ V₅] [Y₆ U₆ V₆] [Y₇U₇ V₇] [Y₈ U₈ V₈]

存放的碼流為：Y₀ U₀ Y₁ Y₂ U₂ Y₃

Y₅V₅ Y₆ Y₇ V₇ Y₈

映射出的像素點(diǎn)為：[Y₀ U₀ V₅] [Y₁ U₀ V₅] [Y₂ U₂ V₇] [Y₃ U₂ V₇]

[Y₅ U₀ V₅] [Y₆ U₀ V₅] [Y₇U₂ V₇] [Y₈ U₂ V₇]

對(duì)應(yīng)AVPicture里面有data[4]和linesize[4]其中data是一個(gè)指向指針的指針（二級(jí)、二維指針），也就是指向視頻數(shù)據(jù)緩沖區(qū)的首地址，而data[0]~data[3]是一級(jí)指針，可以用如下的圖來(lái)表示：

data -->xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
        ^                ^              ^
        |                |              |
         data[0]      data[1]         data[2]

比如說(shuō)，當(dāng)pix_fmt=PIX_FMT_YUV420P時(shí)，data中的數(shù)據(jù)是按照YUV的格式存儲(chǔ)的，也就是：

data -->YYYYYYYYYYYYYYUUUUUUUUUUUUUVVVVVVVVVVVV
^             ^            ^
|             |            |
data[0]    data[1]      data[2]

linesize是指對(duì)應(yīng)于每一行的大小，為什么需要這個(gè)變量，是因?yàn)樵赮UV格式和RGB格式時(shí)，每行的大小不一定等于圖像的寬度，對(duì)于RGB格式輸出時(shí),只有一個(gè)通道(bgrbgrbgr......)可用，即linesize[0],和data[0],so RGB24 : data[0] = packet rgb//bgrbgrbgr......

linesize[0] = width*3

其他的如data[1][2][3]與linesize[1][2][3]無(wú)任何意義.

而對(duì)于ＹＵＶ格式輸出時(shí)，有三個(gè)通道可用，即data[0][1][2],與linesize[0][1][2]，而yuv格式對(duì)于運(yùn)動(dòng)估計(jì)時(shí)，需要填充padding(right, bottom),故：

linesize=width+padding size(16+16).
///////////////////////////////////////////////////////////////////////////////////////


   case PIX_FMT_YUV420P:
   case PIX_FMT_YUVJ420P:
   case PIX_FMT_RGB555:
    if (PIC_DIRECTION_0 == m_dwFilpPicDirection)
    {
     m_pYuvFrame->data [0] += m_pYuvFrame->linesize[0] *  m_pVCodecContext->height;
     //因?yàn)槭歉粜袙呙鑅與V只有高度的一半
     m_pYuvFrame->data [1] += m_pYuvFrame->linesize[1] *  m_pVCodecContext->height/2;
     m_pYuvFrame->data [2] += m_pYuvFrame->linesize[2] *  m_pVCodecContext->height/2;
     m_pYuvFrame->linesize[0] = -m_pYuvFrame->linesize[0];
     m_pYuvFrame->linesize[1] = -m_pYuvFrame->linesize[1];
     m_pYuvFrame->linesize[2] = -m_pYuvFrame->linesize[2];
    }
    
    break;
   case PIX_FMT_YUVJ422P:
   case PIX_FMT_YUV422P:
   case PIX_FMT_YUYVJ422:
   case PIX_FMT_YUV411P:
   case PIX_FMT_YUYV422:  
    if (PIC_DIRECTION_0 == m_dwFilpPicDirection)
    {
     m_pYuvFrame->data [0] += m_pYuvFrame->linesize[0] *  m_pVCodecContext->height;
     m_pYuvFrame->data [1] += m_pYuvFrame->linesize[1] *  m_pVCodecContext->height;
     m_pYuvFrame->data [2] += m_pYuvFrame->linesize[2] *  m_pVCodecContext->height;
     m_pYuvFrame->linesize[0] = -m_pYuvFrame->linesize[0];
     m_pYuvFrame->linesize[1] = -m_pYuvFrame->linesize[1];
     m_pYuvFrame->linesize[2] = -m_pYuvFrame->linesize[2];
    }
    break;
   }
在FFMPEG中轉(zhuǎn)換RGB時(shí)順便顛倒圖像的方向算法

posted on 2009-06-08 15:23 黑色天使閱讀(4346) 評(píng)論(1) 編輯收藏引用所屬分類: C\C++

FeedBack:

# re: YUV格式詳細(xì)解釋與FFMPEG的關(guān)系

2011-09-07 13:14 | windsome

主要的采樣格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比較常用，其含義為：每個(gè)點(diǎn)保存一個(gè) 8bit 的亮度值(也就是Y值), 每 2x2 個(gè)點(diǎn)保存一個(gè) Cr 和Cb 值, 圖像在肉眼中的感覺(jué)不會(huì)起太大的變化。所以, 原來(lái)用 RGB(R,G,B 都是 8bit unsigned) 模型, 4 個(gè)點(diǎn)需要 8x3=24 bites（如下圖第一個(gè)圖）. 而現(xiàn)在僅需要 8+(8/4)+(8/4)=12bites, 平均每個(gè)點(diǎn)占12bites(如下圖第二個(gè)圖)。這樣就把圖像的數(shù)據(jù)壓縮了一半。

兄弟，是不是算錯(cuò)了？
RGB下4個(gè)點(diǎn)：4*24=96bit
YCbCr4:1:1下4個(gè)點(diǎn)：8*4+8+8=48bit
應(yīng)該是這樣算吧？回復(fù) 更多評(píng)論

刷新評(píng)論列表

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


相關(guān)文章: lamda的簡(jiǎn)單實(shí)現(xiàn) YUV格式詳細(xì)解釋與FFMPEG的關(guān)系 CEventSocket Beta 1.0 字符串字串的查找與字符串分割兩種單件模式 memcpy的BUG 盡量使用C++風(fēng)格的類型轉(zhuǎn)換理解復(fù)雜的C++聲明

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問(wèn) Chat2DB 管理

<

2025年11月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

常用鏈接

留言簿(2)

隨筆分類

隨筆檔案

文章檔案

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜