轉(zhuǎn)載自:http://blog.csdn.net/bluestn/article/details/2068351
我在用FFMPEG 開發(fā)在DirectShow 環(huán)境下生成FLV的篩選器(Filter)的時候,碰到了一個比較古怪的問題。因為該篩選器的輸入格式需要支持常見的RGB,和YUV格式。但是在輸入是RGB格式的時候,最終生成的視頻圖像是翻轉(zhuǎn)的。而用YUV格式確實沒有問題的。
分析了一下程序,因為ffmpeg支持的最終存入FLV的格式是YUV420P,需要調(diào)用sws_scale進行圖像的格式轉(zhuǎn)換,應(yīng)該是調(diào)用sws_scale進行圖像格式轉(zhuǎn)換的時候發(fā)生的圖像反轉(zhuǎn)。雖然問題很顯然,但是卻一直找不到好的辦法,這個問題困擾了好久,也查看了ffmpeg的源代碼。本想也一段代碼,先把RGB格式的圖像先手工做一次反轉(zhuǎn),再通過sws_scale進行處理,那樣負負得正正好解決問題,當(dāng)然實現(xiàn)這樣的反轉(zhuǎn)代碼也比較簡單,稍微花點時間就可以搞定。但是進行編解碼處理的程序關(guān)鍵是性能,這樣處理,因為圖像反轉(zhuǎn)操作,白白損失了大量的CPU。后來發(fā)現(xiàn)其實,有一個非常巧妙的方法可以解決這個問題。或許ffmpeg在開發(fā)的時候,他們早已考慮到了這個問題,已經(jīng)預(yù)留了這個后門了。
辦法是這樣的:
先看看sws_scale的函數(shù)定義
int sws_scale(struct SwsContext *ctx, uint8_t* src[], int srcStride[],
int srcSliceY, int srcSliceH, uint8_t* dst[], int dstStride[])
其中src和srcStride定義了輸入圖像的四個平面的數(shù)據(jù)起始指針和四個平面中每一行包含的像素的個數(shù)。
dst和dstStride是輸出變量,定義的是輸出圖像的四個平面的數(shù)據(jù)起始指針和四個平面包含的數(shù)據(jù)的大小。
為什么一個圖像有四個平面,可以找一下YUV格式的一些詳細介紹就可以明白。
當(dāng)然,RGB格式是按照緊湊格式進行編碼的,因此只有一個平面,也就是說只要設(shè)置src[0]就可以,src[1],src[2],src[3]都為NULL。
我們就在設(shè)置src[0]和srcStride[0]的地方做文章。
按照一般處理src[0]和srcStride[0]分別設(shè)置為起始圖像數(shù)據(jù)的開始和圖像每一行的像素個數(shù)。
那如果把src[0] 設(shè)置為 width * ( height - 1) srcStride[0] = -height 結(jié)果會如何呢?是不是就會把圖像倒過來呢?
實際確實如此。進行圖像倒置的操作盡然如此簡單。這樣避免了人為再添加一次圖像的反轉(zhuǎn)操作,提高了編碼的性能。