AI復興相面術?人臉識別同性戀、罪犯是偽科學

 

「相面術」是一種從通過外表得知性格的偽科學,它有著悠久的歷史,其中第一批保存下來的相關文獻可以追溯到亞里士多德時代。達爾文曾經差一點因為他的鼻子而錯過了他在小獵犬號上的歷史性航行,因為船長是一個狂熱的相士,他不相信長有這樣的鼻子的人會有足夠的決心完成航行。「但我認為,」達爾文在他的自傳中冷淡地說,「後來的結果與通過我的鼻子預測出的相反,他很滿意這一點。」

我們可能會取笑那些相士的想法,但是現代關於第一印象的科學表明,我們每個人最原始的想法都是與相士類似的。我們會從別人的面部表情中形成對他們的即時印象,只用不到十分之一秒的時間去看一張臉就足以讓我們下定結論了。第一印象不僅是即時的,而且也很重要:我們更有可能投票給那些看起來有能力的政客;更傾向於投資那些看起來值得信賴的人;而對那些看起來相反的人給予更嚴厲的反對。「以貌取人」是社交生活的一個普遍特徵。

廣告-請繼續往下閱讀

關於第一印象的現代科學也總結出了許多造成這些影響的面部的刻板印象。在過去的十年裡,心理學家們已經建立了數學模型來可視化這些刻板印象。我們可以通過增加或減少模型中的可信性程度和能力水平得出相對應的面孔。更重要的是,我們可以建立和測試關於面部刻板印象起源的理論。

然而,這項研究取得進展的一個意想不到的後果是——相面術的復興。也許我們對於面部的刻板印象不只是刻板印象,而是對他人性格的真實反映。相應地,越來越多的研究表明,我們可以從一個人的面部表情中識別出他的心理健康、政治傾向和性取向等各種各樣的私人信息。

這些說法通常是基於一些猜測性取向的實驗,因為這些實驗得出的結果比隨機猜測更準確。

廣告-請繼續往下閱讀

而問題是,這些猜測並沒有比碰運氣準確多少,而且往往不如基於更一般知識的猜測準確。

此外,許多這樣的研究都是基於這樣一種謬論:所有的面部圖像對於這張臉的主人都有相同的代表性。雖然這一假設對熟悉的面孔來講可能是正確的,因為熟悉的面孔很容易從不同的圖像中辨認出來,但是對於不熟悉的面孔來說,這當然是錯誤的——而且根據定義,第一印象是關於不熟悉的面孔的印象。通常,我們不知道兩個不同的圖像是否代表了相同的(不熟悉的)人,並且,這些圖像可以造成完全不同的第一印象。因此,在評估第一印象的準確性時,如何對人類肖像進行採樣是一個關鍵問題。

考慮一下圖像採樣時的偏差會如何影響對第一印象的準確性的推斷。在許多「同性戀者」研究中,參與者被要求通過交友網站上的照片猜測照片發布者的性取向。在最早的此類研究中,猜測準確率約為58%(而隨機猜測的準確率為50%)。但由於許多人在交友網站上發布照片時會選擇更具代表性的圖片,從而去吸引他們想要吸引的人,因此這並不是一個中立的採樣方式。

廣告-請繼續往下閱讀

事實上,當這些猜測是通過這些同性戀或異性戀者的朋友在網站上發布的照片進行時,正確率只有52%。這種結果不僅在受試者猜測性取向的時候會出現。在最近的一項研究中,研究人員使用在線交友網站上的照片讓測試參與者猜測其社會階層,以財富作為評估標準。參與者猜測的準確率大約為57%。但是,當這些猜測是基於在標準化條件下拍攝的照片時,準確率就下降到了51.5%。

隨著越來越多的面部照片被發布在網路上,試圖從這些圖像中讀出我們「本質」的研究不會消失。在過去的幾年中,有一波新的人工智慧(AI)研究試圖做到這一點。一家科技初創企業已經開始向私營企業和政府提供面部識別服務。去年,兩名計算機科學家在網上發布了一篇非同行評議的論文,聲稱他們的演演算法僅僅從面部圖像中就能推測出人們的犯罪行為。最近,一份著名的期刊接受了一篇論文,這篇論文聲稱人工智慧演演算法可以從一個人的面部圖像中檢測出其性取向,其準確度令人驚訝。

廣告-請繼續往下閱讀

然而,同樣的問題在人工智慧研究中也存在。後者使用強大的演演算法,可以檢測兩組圖像之間細微但系統的差異。但是,用於訓練演演算法的圖像樣本和演演算法本身一樣重要。在關於犯罪的論文那篇中,作者提供了一些「罪犯」和「非罪犯」的圖片。除了明顯的面部表情差異外,「罪犯」穿的是T恤衫,而「非罪犯」穿的則是西裝。一個強大的演演算法很容易就能識別出這些差異,併產生一個看似準確的分類。

在人工智慧研究中,「所有的面部圖像都具有同樣的代表性」這一謬論在人工智慧研究中扮演著更為微妙的角色,尤其是當這些演演算法都在測量二維圖像的不變面部特徵時。相機到頭部的距離,相機參數,輕微的頭部傾斜,微妙的表情和許多其他明顯的細微的差別都影響著對穩定的形態特徵的測量。當這些差異沒有被控制的時候,利用人工智慧進行研究只是放大了我們人類的偏見。

廣告-請繼續往下閱讀

此外,使用人工智慧進行「面部解讀」的含義在道德上是令人厭惡的。那篇有關性取向的文章的第一作者聲稱,他的主要動機是提醒LGBT群體,這種技術有可能對他們造成傷害,尤其是在專制的國家。但是,儘管這項研究聲稱要識別同性戀者和異性戀者之間的真實形態差異,但它真正做到的是,演演算法僅能通過公開的同性戀者自己發布的照片識別出他們的性取向——就像普通的人類能夠識別出的一樣。

這種「科學」的主張,恰好能夠激勵那些專制的政府將人工智慧演演算法應用於識別公民的肖像照片中。而什麼又能阻止他們從這些圖片中「解讀」情報、政治取向和犯罪傾向呢?