http://www.guokr.com/article/436974/

編輯的話:2013年“韓國小姐”選美大賽開始之后,最先曝光出的20位佳麗面容之酷似,讓人們驚嘆不已。我們在黃嘉斌的個人博客上看到了這篇有趣的 分析文章(英文)。在得到翻譯授權后,死理性派將本文編譯發布,以饗讀者。

 

(原作者/黃嘉斌 譯/小行蹤)前一陣,一張集合了20 位“韓國小姐”選美大賽大邱區選手的GIF圖(見下)廣為流傳,世人紛紛震驚于韓國整容技術的高度一致性。有網友稱“韓國整容界的混亂終于在這一張臉上體現出來了”。那么,這20位韓國小姐的臉到底有多相似?讓我們用科學的方法來揭開謎底。

首先,放出20位佳麗集合圖,并對她們進行編號(第一列從上往下依次為1-4號,第二列為5-8號,以此類推)。
通過簡單的計算攝影學方法,可以將20張圖片的特征集合到一張圖片上,得出這20位佳麗的“平均臉”。結果如下:

然后,通過一個視頻來觀察一下這20張臉的漸變情況,看看每張圖片之間的變化幅度。

 

到目前為止,只能借助上面這些可視化對象進行定性分析,通過主觀評價得出結論(結論是像呢還是像呢還是像呢?)。接下來,還需要進行定量分析。

第一步,要構建這些選手面部的“特征空間”。不過,由于選手在拍照時的姿勢差異和不同的發型干擾,我們不能用標準的“主成分分析法”(Principle Component Analysis,簡稱PCA)構建特征空間。因此,需要用一種魯棒性更強的PCA,來進行臉部圖像的低秩部分(low rank part)分解和稀疏誤差(sparse errors)分解,如下圖中的三個例子所示:

第二步,通過奇異值分解法(singular value decomposition),可以得到這 20 張臉的“特征臉”以及對應的特征值,從下面這張曲線圖中可以看到,沒有特征臉的特征值大于等于 7,因此這些圖像數據的秩為 6。

將 6 張特征臉圖像化如下,其中包含了20張臉部圖像的主要變化。

第三步,將每張臉投影到特征臉上,分析出這些臉部圖像在特征空間中是怎樣分布的。下圖是 20 張臉的特征系數曲線,可以看到,大部分特征差異都集中在前兩個特征值上。

再將每張臉對應前兩個特征值的系數繪制成圖,就可以看出這 20 位選手的外貌特征有多相似(分布越近的點代表相似程度越高)。

第四步,通過兩兩對比來比較這些參賽選手互相之間的外貌相似程度。下圖中,方塊顏色越藍表示兩者越相似,越紅表示越不相似。

通過對上圖的統計,可以得出下面這張橫向對比圖,橫軸代表選手編號,縱軸代表差異程度高低。

最后,我們可以看到,這20位“韓國小姐”參賽選手之中,與“平均臉”最接近,也就是與其他人長得最像的三位分別是7號、12號和15號選手。

而與其他人外貌相似程度最低的三位分別是 1 號、2 號和 6 號選手。恭喜她們!

5月3日,“韓國小姐”大邱賽區的大眾投票結果出爐。前五名分別是5號、 1號、 15號、20號與19號佳麗。其中位列二三名的1號與15號佳麗分別在“最相似”與“最不相似”三人組中。這似乎與那個著名的觀點“大眾臉很吸引人,但最吸引人的卻不是大眾臉”有所巧合。

當我們在前兩個特征值系數圖中找到前五名佳麗(紅點標記),可以發現,大眾在投票過程中似乎避開了選擇互相之間外貌非常近似的佳麗。

友情提醒:整容結果可能跟你的預期不一樣,進行韓式整容需謹慎哦。