情艺中心国产欧美亚洲,亚洲国产成人久久一区久久

人臉識別的膚色性別偏見背后，是人類自己的偏見

2019-11-11 09:11 全媒派

導(dǎo)讀：為何有時候，算法眼中的你處在可男可女的模糊地帶?進一步講，性別之外還有哪些偏見?為了應(yīng)對這種狀況，我們可以做些什么?

人臉識別,面部識別,數(shù)據(jù)層,AI

圖片來自“123RF”

皮尤研究中心的一項最新研究發(fā)現(xiàn)，F(xiàn)acebook 的新聞圖片中，男性出現(xiàn)的頻率是女性的兩倍，且大部分的圖片是關(guān)于男性的。

考慮到當(dāng)下有 43% 的美國成年公民主要通過 Facebook 獲取新聞資訊，皮尤研究中心使用機器視覺測試了 2018 年 4 月至 6 月期間 17 個全國性新聞媒體在 Facebook 上所發(fā)布新聞圖片的性別比例情況。測試算法最終識別出了 53067 人，其中女性占 33%，男性占 67%，差距懸殊。但在現(xiàn)實生活中，美國人口的性別比例大致是均衡的。

那么，是誰在「扭曲」兩性?

本期全媒派綜合皮尤研究中心以及 MIT 媒體實驗室科學(xué)家 Joy Buolamwini 的研究發(fā)現(xiàn)，走近人臉識別下兩性的比例失衡現(xiàn)象，一起探究：為何有時候，算法眼中的你處在可男可女的模糊地帶?進一步講，性別之外還有哪些偏見?為了應(yīng)對這種狀況，我們可以做些什么?

人臉識別下的性別失衡

皮尤的這份報告指出，在 Facebook 上不同類型的新聞報道中，女性在圖片中的「在場」情況始終低于男性。在與經(jīng)濟有關(guān)的帖子中，只有 9% 的圖片為純女性內(nèi)容，與此形成鮮明對比的是，純男性圖像占到了 69%。女性在娛樂新聞圖片中擁有更多展示機會，但總體上仍低于男性。

你也許會為女性身影的稀少而感到疑惑，這在一定程度上和更大的社會現(xiàn)實相關(guān)。比如，在關(guān)于職業(yè)足球隊的新聞報道中，識別出的圖像大多都是男性;在針對美國參眾兩院(女性占比為 25%)的報道中，識別出的女性面孔當(dāng)然要比男性少得多。

拋開這些顆粒度更小的細節(jié)不談，這份研究仍然揭示了一些值得警覺的現(xiàn)狀：在 Facebook 新聞圖像中，男性比女性更為突顯;在兩人或更多人的群像中，男性往往比女性多。同時，男性會占據(jù)更大的視覺空間。

研究人員還測量了圖像中女性面部與男性面部的大小情況(目前的技術(shù)只能捕捉人臉的大小情況，忽略了頭發(fā)、珠寶和頭飾等因素的影響)。結(jié)果顯示，男性面孔平均占到的圖像面積更大，這種差異導(dǎo)致圖像中男性平均面部尺寸比女性大出了 10%。在 Facebook 的圖像中，這表現(xiàn)為男性人物能給讀者帶來更大的視覺沖擊。

具體來看，在涉及經(jīng)濟相關(guān)的帖子中，女性面孔的平均尺寸比男性小 19%，但在娛樂相關(guān)的內(nèi)容中，女性面孔的平均尺寸比男性大 7%。

像面部識別這樣的機器視覺工具，正被越來越廣泛地應(yīng)用在執(zhí)法、廣告及其他領(lǐng)域，對性別的識別，是其基本功能之一。

機器學(xué)習(xí)的確可以極大地提高我們處理數(shù)據(jù)的效率，但與傳統(tǒng)的計算機程序不同，機器學(xué)習(xí)遵循一系列嚴格的步驟，它們的決策方式在很大程度上隱而不顯，并且高度依賴于用來訓(xùn)練自身的數(shù)據(jù)。這些特點可能導(dǎo)致，機器學(xué)習(xí)工具產(chǎn)生更難以被人理解和提前預(yù)測到的系統(tǒng)性偏差。

從這個角度看，皮尤研究中心用一個簡化的實驗，展示了用于訓(xùn)練算法的數(shù)據(jù)是如何將隱藏的偏差、意外的錯誤引入到了系統(tǒng)結(jié)果中。研究人員表示，隨著算法正在人類社會中發(fā)揮越來越重要的決策影響力，了解它們的局限、偏差具有重要意義。

「偏見」帶來了什么?

最近，包括圖靈獎獲得者 Yoshua Bengio 在內(nèi)的 26 位 AI 領(lǐng)域頂尖研究者，在一篇公開博文中要求亞馬遜立即停止向警方出售其人工智能服務(wù) Amazon Rekognition。亞馬遜云計算部門前首席科學(xué)家 Anima Anandkumar 等人也加入了這一聯(lián)合呼吁。

此前，多倫多大學(xué)的研究人員 Deborah Raji 和麻省理工學(xué)院媒體實驗室的研究人員 Joy Buolamwini 撰寫了研究報告，指出亞馬遜的 Rekognition 在檢測圖像中膚色較深的女性性別時，要比判斷膚色較淺男性性別的錯誤率高得多。該研究成果也得到了學(xué)者們的支持，但亞馬遜曾對兩人撰寫的這篇報告及研究方法提出過異議。

Joy Buolamwini 主導(dǎo)了一個名為 Gender Shades 的 AI 研究項目，在研究了各個領(lǐng)先科技公司的面部識別系統(tǒng)后發(fā)現(xiàn)，所有系統(tǒng)在識別男性臉孔上表現(xiàn)更佳，所有系統(tǒng)在識別淺色臉孔上的準確率更高。深色皮膚女性的平均識別錯誤率高達 35%，深色皮膚男性的為 12%，淺色皮膚女性為 7%，淺色皮膚男性的錯誤率不超過 1%。

面部識別系統(tǒng)的「偏見」可能帶來什么?

「不管其正確性如何，面部識別技術(shù)都可能被濫用，」Joy 說道。準確或者不準確地使用面部識別技術(shù)對他人的身份、面孔、性別進行分析，都可能侵犯到他人的自由。比如，不準確的識別可能會使得無辜者蒙冤，受到執(zhí)法人員的無理審查，這并不是假想的情況。英國非盈利組織「老大哥觀察」(Big Brother Watch UK)曾發(fā)布一份報告，強調(diào)倫敦警察廳使用的面部識別技術(shù)有超過 90% 的性別識別錯誤率。去年夏天，英國媒體報道了這樣一則新聞，一名年輕黑人男性因為面部識別技術(shù)失誤，被誤認為嫌犯而在眾目睽睽之下遭到警方搜身檢查。

一份被泄露的報告也顯示，IBM 為執(zhí)法機構(gòu)提供了技術(shù)，能夠根據(jù)頭發(fā)顏色、膚色和面部特征等搜索視頻中的人物。這一消息，引發(fā)了人們對警方將利用該技術(shù)關(guān)注特定種族的擔(dān)憂。

為了減少搜索人臉所需的時間，執(zhí)法部門正在大量使用性別分類。如果需匹配人臉的性別是已知的，通過簡單的二分法，就可以大量減少需要處理的潛在匹配數(shù)。性別分類正廣泛應(yīng)用到警務(wù)活動中。

當(dāng)這些有偏差的識別系統(tǒng)被廣泛應(yīng)用到社會生活中，就可能導(dǎo)致更糟糕的后果。

在 TED 演講中，Joy 和大家分享了一個小故事：

在同樣的光線條件下，面部識別系統(tǒng)只能檢測到淺膚色的參與者;只有戴上白色面具，才能檢測出深膚色的參與者?！冈谌斯ぶ悄芄ぞ叽_定人臉的身份或者辨別表情信息前，最基本的前提是，檢測出人臉。但是，面部識別系統(tǒng)在檢測黑皮膚個體上，屢次失敗。我只能安慰自己，算法不是種族主義者，是自己的臉太黑了。」Joy 說道。

偏差來自哪里?

如果對比開發(fā)者自己聲明的準確率和研究者們的研究結(jié)論，會發(fā)現(xiàn)一個有趣的事情：公司發(fā)布的數(shù)據(jù)和獨立第三方的外部準確率總是有所出入。那么，是什么導(dǎo)致了這一差異?

Joy 提醒我們關(guān)注基準數(shù)據(jù)集的偏差?！府?dāng)我們討論面部分析技術(shù)的準確性時，是通過一系列圖像或者視頻測試來完成的。這些圖像數(shù)據(jù)構(gòu)成了一個基準，但并不是所有的基準都是平等的?！?/p>

亞馬遜相關(guān)負責(zé)人表示，該公司使用了超過 100 萬張面孔數(shù)據(jù)作為基準來檢測產(chǎn)品的準確率。但是，不要被這個看起來很大的樣本迷惑了。「因為我們不知道基準數(shù)據(jù)的詳細人口統(tǒng)計學(xué)數(shù)據(jù)。沒有這些信息，我們就無法判斷，是否在基準選擇上，就可能埋下了種族、性別或者膚色等偏見的可能。」

Facebook 曾宣布，在名為 Labeled Faces in the Wild(簡稱 LFW，為世界上人臉識別最知名的數(shù)據(jù)集之一)的數(shù)據(jù)集測試中，自己面部識別系統(tǒng)的準確率高達 97%。但當(dāng)研究人員查看這個所謂的黃金標準數(shù)據(jù)集時，卻發(fā)現(xiàn)這個數(shù)據(jù)集中有近 77% 的男性，同時超過 80% 是白人。

為了在數(shù)據(jù)層就盡最大可能地剔除偏差，Joy 提出，應(yīng)當(dāng)構(gòu)建更具包容性的基準數(shù)據(jù)集。為了平衡基準數(shù)據(jù)，她列出了世界上婦女在議會所占比例最高的十個國家，其中盧旺達以超過 60% 的女性比例領(lǐng)先世界。考慮到北歐國家和少數(shù)非洲國家具有典型代表性，Joy 選定了 3 個非洲國家和 3 個北歐國家，通過選擇來自這些國家年輕、深膚色的個體數(shù)據(jù)來平衡數(shù)據(jù)集中的皮膚等類型。

正是基于這個更平衡的數(shù)據(jù)集，他們對亞馬遜、Kairos、IBM、Face++等公司的面部識別系統(tǒng)進行了重新評估。在 2018 年 8 月的研究中，他們發(fā)現(xiàn)，亞馬遜和 Kairos 在白人男性識別工作上表現(xiàn)優(yōu)秀，但亞馬遜對有色人種的女性面孔識別的準確率很低，僅為 68.6%。

Joy 表示，現(xiàn)實世界中的臉部識別要比實驗檢測更為復(fù)雜和困難，他們建立的基準數(shù)據(jù)集也并非完全經(jīng)受得住考驗，「但這就好比跑步比賽，在基準測試中的出色表現(xiàn)，起碼能保證你不會剛起步就摔倒?！?/p>

即便在同樣的基準下，面部識別系統(tǒng)的準確度數(shù)字可能也會發(fā)生變化。人工智能并不完美。在這種情況下，通過提供置信度給用戶更具體的判斷信息是一個有用的做法。

面部識別技術(shù)已經(jīng)被廣泛地應(yīng)用在大規(guī)模監(jiān)視、人工智能武器化和更多的執(zhí)法環(huán)境中。但是，這項強大的技術(shù)是在沒有得到充分監(jiān)督的情況下，快速發(fā)展著。

為了減少對面部識別技術(shù)的濫用，算法正義聯(lián)盟 (Algorithmic Justice League) 和隱私與技術(shù)中心 (Center on Privacy & Technology) 發(fā)起了「安全面孔承諾」(Safe Face Pledge) 活動。在目前，包括亞馬遜在內(nèi)的很多科技公司尚未加入這一承諾?！父鶕?jù)我們的研究，貿(mào)然向執(zhí)法部門或者政府機構(gòu)出售面部識別系統(tǒng)將是不負責(zé)任的。」作為算法正義聯(lián)盟創(chuàng)始人之一的 Joy 希望，在未來，更多的機構(gòu)能加入到「安全面孔承諾」，能夠負責(zé)任地、符合道義地為面部分析技術(shù)的發(fā)展付出行動。

畢竟，算法偏見的背后，其實是我們?nèi)祟愖约旱钠姟?/p>

人臉識別的膚色性別偏見背后，是人類自己的偏見

相關(guān)閱讀

人臉識別的膚色性別偏見背后，是人類自己的偏見