為什么要?dú)w一化?
見(jiàn)《視覺(jué)機(jī)器學(xué)習(xí)》的P159,為了提高訓(xùn)練過(guò)程的收斂程度
http://www.cad.zju.edu.cn/home/dengcai/Data/FaceData.htmlWe recomend to pre-process the data using either of the following two methods:Nomalize each vector to unit
%===========================================
[nSmp,nFea] = size(fea);
for i = 1:nSmp
fea(i,:) = fea(i,:) ./ max(1e-12,norm(fea(i,:)));
end
%===========================================
Scale the features (pixel values) to [0,1]
%===========================================
maxValue = max(max(fea));
fea = fea/maxValue;
%===========================================
灰度圖的像素范圍是0到255,以后不能用除以256了,除以255
(1)就采用Deng Cai網(wǎng)上公布的數(shù)據(jù)
20Newsgroup做SRDA的實(shí)驗(yàn),
50%訓(xùn)練時(shí)的錯(cuò)誤率
沒(méi)有歸一化: 18.1270±0.5453(alpha=1), 18.1312±0.5397(alpha=0.1);
normalize each data vector to unit :11.4483±0.2372(alpha=0.1);
5%訓(xùn)練時(shí)的錯(cuò)誤率
沒(méi)有歸一化: 36.5823±0.8035(alpha=1), 36.3308±0.8237(alpha=0.1)
normalize each data vector to unit : 27.4496±0.7606(alpha=0.1)
歸一化比沒(méi)有歸一化分別好了7%,9% 歸一化成2范數(shù)為1,每個(gè)樣本都除以各自的2范數(shù),可能破壞不同樣本的同一特征的相對(duì)大小,
那么這種歸一化作用何在?假如樣本歸一化后SRDA公式(16)最優(yōu)alpha是1,則不歸一化(如果每個(gè)樣本2范數(shù)在100左右),此時(shí)最優(yōu)alpha應(yīng)該在10000 (2)我的電腦目錄:\蔡登代碼\Spectral Regression\kernel\test_USPS(toronto)\Data,,如果USPS不進(jìn)行預(yù)處理,效果非常的差
(3)
除以256和每個(gè)樣本都除以各自的2范數(shù),20121003mingming gong做實(shí)驗(yàn)時(shí)發(fā)現(xiàn)這個(gè)問(wèn)題,我利用我的程序重新做了測(cè)試,在Extended Yale B 10train分別除以256和每個(gè)樣本都除以各自的2范數(shù),準(zhǔn)確率44.45 和53.43,差異非常大,每個(gè)樣本都除以各自的2范數(shù),
這種歸一化作用何在? 在Extended Yale B 上有光照變化非常大,這種有去除光照影響的變化,但這種對(duì)左側(cè)光和右側(cè)光沒(méi)辦法處理,真正做人臉識(shí)別去除光照影響,肯定有更好的方法,都處理各自的2范數(shù),應(yīng)該太simple了。
見(jiàn)電腦目錄:\other\matlab 2007a\work\DSPP(671MB)\Extended Yale B\Baseline的TestBaseline_NormalizeToUnit和TestBaseline_NormalizeUse256
(4)histogram equilibrium,論文Maximum margin criterion with tensor representation實(shí)驗(yàn)全用了;Unsupervised Discriminant Projection (PAMI 2007)第一節(jié)沒(méi)用,其他兩節(jié)用了。Regularized Correntropy for Robust Feature Selection的3.2節(jié)用了,3.1節(jié)沒(méi)用。作用是什么?20130127 Prof. Ran He講對(duì)去除光照有好處,但對(duì)于像墨鏡和圍巾這樣的,沒(méi)作用。matlab函數(shù):
histeq。
就用下面的matlab代碼: Imag = imread('AR001-1.tif');J = histeq(Imag);J就代表經(jīng)過(guò)直方圖均衡化后的圖,然后對(duì)J進(jìn)行操作。Libing講histeq不影響人臉像素的非負(fù)性,就相當(dāng)于一個(gè)預(yù)處理步驟而已,后面可以接歸一化到二范數(shù)是1也可以不接。未必加histeq一定效果好,有時(shí)反而會(huì)起負(fù)作用。這得到Libing 和Ran He的共同確認(rèn)。
http://zhidao.baidu.com/question/37620215.html
histeq的作用是把“圖像”的直方圖均衡化。
簡(jiǎn)單的說(shuō),有些圖像有太多的亮點(diǎn)或者有太多的暗點(diǎn)。histeq通過(guò)一個(gè)算法,把亮度重新分配,讓人看得舒服自然。比如說(shuō)原來(lái)的點(diǎn)都集中在暗處,1-25之間,histeq就可以把25亮度的點(diǎn)“拉”到255處,24“拉”到240處..最后圖像的細(xì)節(jié)都回呈現(xiàn)在你面前。