為什么要歸一化?
見《視覺機器學習》的P159,為了提高訓練過程的收斂程度

http://www.cad.zju.edu.cn/home/dengcai/Data/FaceData.html

We recomend to pre-process the data using either of the following two methods:

Nomalize each vector to unit
%===========================================
[nSmp,nFea] = size(fea);
for i = 1:nSmp
     fea(i,:) = fea(i,:) ./ max(1e-12,norm(fea(i,:)));
end
%===========================================

Scale the features (pixel values) to [0,1]
%===========================================
maxValue = max(max(fea));
fea = fea/maxValue;
%===========================================

灰度圖的像素范圍是0到255,以后不能用除以256了,除以255

(1)就采用Deng Cai網上公布的數據
20Newsgroup做SRDA的實驗,

50%訓練時的錯誤率

沒有歸一化: 18.1270±0.5453(alpha=1), 18.1312±0.5397(alpha=0.1)

normalize each data vector to unit :11.4483±0.2372(alpha=0.1);

5%訓練時的錯誤率

沒有歸一化:  36.5823±0.8035(alpha=1), 36.3308±0.8237(alpha=0.1) 

normalize each data vector to unit : 27.4496±0.7606(alpha=0.1)


歸一化比沒有歸一化分別好了7%,9%
歸一化成2范數為1,每個樣本都除以各自的2范數,可能破壞不同樣本的同一特征的相對大小,那么這種歸一化作用何在?假如樣本歸一化后SRDA公式(16)最優alpha是1,則不歸一化(如果每個樣本2范數在100左右),此時最優alpha應該在10000

(2)我的電腦目錄:\蔡登代碼\Spectral Regression\kernel\test_USPS(toronto)\Data,,如果USPS不進行預處理,效果非常的差

(3)除以256和每個樣本都除以各自的2范數,20121003mingming gong做實驗時發現這個問題,我利用我的程序重新做了測試,在Extended Yale B  10train分別除以256和每個樣本都除以各自的2范數,準確率44.45 和53.43,差異非常大,每個樣本都除以各自的2范數,這種歸一化作用何在? 在Extended Yale B 上有光照變化非常大,這種有去除光照影響的變化,但這種對左側光和右側光沒辦法處理,真正做人臉識別去除光照影響,肯定有更好的方法,都處理各自的2范數,應該太simple了。 
見電腦目錄:\other\matlab 2007a\work\DSPP(671MB)\Extended Yale B\Baseline的TestBaseline_NormalizeToUnit和TestBaseline_NormalizeUse256

(4)histogram equilibrium,論文Maximum margin criterion with tensor representation實驗全用了;Unsupervised Discriminant Projection (PAMI 2007)第一節沒用,其他兩節用了。Regularized Correntropy for Robust Feature Selection的3.2節用了,3.1節沒用。作用是什么?20130127 Prof. Ran He講對去除光照有好處,但對于像墨鏡和圍巾這樣的,沒作用。matlab函數:histeq。

就用下面的matlab代碼: Imag = imread('AR001-1.tif');J = histeq(Imag);J就代表經過直方圖均衡化后的圖,然后對J進行操作。Libing講histeq不影響人臉像素的非負性,就相當于一個預處理步驟而已,后面可以接歸一化到二范數是1也可以不接。未必加histeq一定效果好,有時反而會起負作用。這得到Libing 和Ran He的共同確認。

http://zhidao.baidu.com/question/37620215.html
histeq的作用是把“圖像”的直方圖均衡化。
簡單的說,有些圖像有太多的亮點或者有太多的暗點。histeq通過一個算法,把亮度重新分配,讓人看得舒服自然。比如說原來的點都集中在暗處,1-25之間,histeq就可以把25亮度的點“拉”到255處,24“拉”到240處..最后圖像的細節都回呈現在你面前。