YUV主要的采樣格式
主要的采樣格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比較常用,其含義為:每個(gè)點(diǎn)保存一個(gè) 8bit 的亮度值(也就是Y值), 每 2x2 個(gè)點(diǎn)保存一個(gè) Cr 和Cb 值, 圖像在肉眼中的感覺(jué)不會(huì)起太大的變化。所以, 原來(lái)用 RGB(R,G,B 都是 8bit unsigned) 模型, 4 個(gè)點(diǎn)需要 8x3=24 bites(如下圖第一個(gè)圖). 而現(xiàn)在僅需要 8+(8/4)+(8/4)=12bites, 平均每個(gè)點(diǎn)占12bites(如下圖第二個(gè)圖)。這樣就把圖像的數(shù)據(jù)壓縮了一半。
上邊僅給出了理論上的示例,在實(shí)際數(shù)據(jù)存儲(chǔ)中是有可能是不同的,下面給出幾種具體的存儲(chǔ)形式:
(1) YUV 4:4:4
YUV三個(gè)信道的抽樣率相同,因此在生成的圖像里,每個(gè)象素的三個(gè)分量信息完整(每個(gè)分量通常8比特),經(jīng)過(guò)8比特量化之后,未經(jīng)壓縮的每個(gè)像素占用3個(gè)字節(jié)。
下面的四個(gè)像素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的碼流為: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3 V3
(2) YUV 4:2:2
每個(gè)色差信道的抽樣率是亮度信道的一半,所以水平方向的色度抽樣率只是4:4:4的一半。對(duì)非壓縮的8比特量化的圖像來(lái)說(shuō),每個(gè)由兩個(gè)水平方向相鄰的像素組成的宏像素需要占用4字節(jié)內(nèi)存。
下面的四個(gè)像素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的碼流為: Y0 U0 Y1 V1 Y2 U2 Y3 V3
映射出像素點(diǎn)為:[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3] [Y3 U2 V3]
(3) YUV 4:1:1
4:1:1的色度抽樣,是在水平方向上對(duì)色度進(jìn)行4:1抽樣。對(duì)于低端用戶(hù)和消費(fèi)類(lèi)產(chǎn)品這仍然是可以接受的。對(duì)非壓縮的8比特量化的視頻來(lái)說(shuō),每個(gè)由4個(gè)水平方向相鄰的像素組成的宏像素需要占用6字節(jié)內(nèi)存
下面的四個(gè)像素為: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
存放的碼流為: Y0 U0 Y1 Y2 V2 Y3
映射出像素點(diǎn)為:[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2] [Y3 U0 V2]
(4)YUV4:2:0
4:2:0并不意味著只有Y,Cb而沒(méi)有Cr分量。它指得是對(duì)每行掃描線來(lái)說(shuō),只有一種色度分量以2:1的抽樣率存儲(chǔ)。進(jìn)行隔行掃描,相鄰的掃描行存儲(chǔ)不同的色度分量,也就是說(shuō),如果一行是4:2:0的話(huà),下一行就是4:0:2,再下一行是4:2:0...以此類(lèi)推。對(duì)每個(gè)色度分量來(lái)說(shuō),水平方向和豎直方向的抽樣率都是2:1,所以可以說(shuō)色度的抽樣率是4:1。對(duì)非壓縮的8比特量化的視頻來(lái)說(shuō),每個(gè)由2x2個(gè)2行2列相鄰的像素組成的宏像素需要占用6字節(jié)內(nèi)存。
下面八個(gè)像素為:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2] [Y3 U3 V3]
[Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8 U8 V8]
存放的碼流為:Y0 U0 Y1 Y2 U2 Y3
Y5 V5 Y6 Y7 V7 Y8
映射出的像素點(diǎn)為:[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7] [Y3 U2 V7]
[Y5 U0 V5] [Y6 U0 V5] [Y7U2 V7] [Y8 U2 V7]
對(duì)應(yīng)AVPicture里面有data[4]和linesize[4]其中data是一個(gè)指向指針的指針(二級(jí)、二維指針),也就是指向視頻數(shù)據(jù)緩沖區(qū)的首地址,而data[0]~data[3]是一級(jí)指針,可以用如下的圖來(lái)表示:
data -->xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
^ ^ ^
| | |
data[0] data[1] data[2]
比如說(shuō),當(dāng)pix_fmt=PIX_FMT_YUV420P時(shí),data中的數(shù)據(jù)是按照YUV的格式存儲(chǔ)的,也就是:
data -->YYYYYYYYYYYYYYUUUUUUUUUUUUUVVVVVVVVVVVV
^ ^ ^
| | |
data[0] data[1] data[2]
linesize是指對(duì)應(yīng)于每一行的大小,為什么需要這個(gè)變量,是因?yàn)樵赮UV格式和RGB格式時(shí),每行的大小不一定等于圖像的寬度,對(duì)于RGB格式輸出時(shí),只有一個(gè)通道(bgrbgrbgr......)可用,即linesize[0],和data[0],so RGB24 : data[0] = packet rgb//bgrbgrbgr......
linesize[0] = width*3
其他的如data[1][2][3]與linesize[1][2][3]無(wú)任何意義.
而對(duì)于YUV格式輸出時(shí),有三個(gè)通道可用,即data[0][1][2],與linesize[0][1][2],而yuv格式對(duì)于運(yùn)動(dòng)估計(jì)時(shí),需要填充padding(right, bottom),故:
linesize=width+padding size(16+16).
///////////////////////////////////////////////////////////////////////////////////////
case PIX_FMT_YUV420P:
case PIX_FMT_YUVJ420P:
case PIX_FMT_RGB555:
if (PIC_DIRECTION_0 == m_dwFilpPicDirection)
{
m_pYuvFrame->data [0] += m_pYuvFrame->linesize[0] * m_pVCodecContext->height;
//因?yàn)槭歉粜袙呙鑅與V只有高度的一半
m_pYuvFrame->data [1] += m_pYuvFrame->linesize[1] * m_pVCodecContext->height/2;
m_pYuvFrame->data [2] += m_pYuvFrame->linesize[2] * m_pVCodecContext->height/2;
m_pYuvFrame->linesize[0] = -m_pYuvFrame->linesize[0];
m_pYuvFrame->linesize[1] = -m_pYuvFrame->linesize[1];
m_pYuvFrame->linesize[2] = -m_pYuvFrame->linesize[2];
}
break;
case PIX_FMT_YUVJ422P:
case PIX_FMT_YUV422P:
case PIX_FMT_YUYVJ422:
case PIX_FMT_YUV411P:
case PIX_FMT_YUYV422:
if (PIC_DIRECTION_0 == m_dwFilpPicDirection)
{
m_pYuvFrame->data [0] += m_pYuvFrame->linesize[0] * m_pVCodecContext->height;
m_pYuvFrame->data [1] += m_pYuvFrame->linesize[1] * m_pVCodecContext->height;
m_pYuvFrame->data [2] += m_pYuvFrame->linesize[2] * m_pVCodecContext->height;
m_pYuvFrame->linesize[0] = -m_pYuvFrame->linesize[0];
m_pYuvFrame->linesize[1] = -m_pYuvFrame->linesize[1];
m_pYuvFrame->linesize[2] = -m_pYuvFrame->linesize[2];
}
break;
}
在FFMPEG中轉(zhuǎn)換RGB時(shí)順便顛倒圖像的方向算法
posted on 2009-06-08 15:23
黑色天使 閱讀(4309)
評(píng)論(1) 編輯 收藏 引用 所屬分類(lèi):
C\C++