AI算法為什麼會存在性別歧視?谷歌做出了解釋
鉅亨網新聞中心 2017-08-30 18:01
一直以來,通過研究表明,人類研發的機器也能學習到人類看待這個世界的視角,無論其是否有意。對於閱讀文本的人工智能來說,它可能會將「醫生」一詞與男性優先關聯,而非女性,或者圖像識別算法也會更大概率的將黑人錯誤分類為大猩猩。
2015 年,Google Photos 應用誤把兩名黑人標註為「大猩猩」,當時這一錯誤意味着谷歌的機器學習還處於「路漫漫其修遠兮」的狀態。隨後,谷歌立即對此道歉,並表示將調整算法,以修復該問題。近日,作為該項錯誤的責任方,谷歌正在試圖讓大眾了解 AI 是如何在不經意間永久學習到創造它們的人所持有的偏見。一方面,這是谷歌對外 PR(公共關係)的好方式,其次,AI 程序員也可以用一種簡單的方法來概述自己的偏見算法。
在該影音中,谷歌概述了三種偏見:
互動偏差:用戶可以通過我們和其交互的方式來偏移算法。例如,谷歌把一些參與者召集其起來,並讓他們每人畫一隻鞋,但多半用戶會選擇畫一隻男鞋,所以以這些數據為基礎的系統可能並不會知道高跟鞋也是鞋子。
潛在偏差:該算法會將想法和性別、種族、收入等不正確地進行關聯。例如,當用戶在 Google Search 搜尋「醫生」時,出現的大多為白人男性。
雷鋒網了解到,此前 Quarts 發布了一則相關新聞,該報道稱,經普林斯頓大學最新研究成果表明,這些偏見,如將醫生與男性相關聯,而將護士與女性關聯,都來自算法被教授的語言的影響。正如一些數據科學家所說:沒有好的數據,算法也做不出好的決策。
選擇偏差:據了解,用於訓練算法的數據量已經大大超過全球人口的數量,以便對算法實行更好的操作和理解。所以如果訓練圖像識別的數據僅針對白人而進行,那麼得到的數據也只能來自 AI 的認定。
圖片來源:Qaurtz
去年 6 月, 「青年實驗室」(英偉達、微軟等科技巨擘均是該實驗室的合作夥伴和支持者)舉辦了一次 Beauty.ai 的網絡選美大賽。該比賽通過人工智能分析,徵集了 60 萬條記錄。該算法參考了皺紋、臉部比例、皮膚疙瘩和瑕疵的數量、種族和預測的年齡等等因素。最後結果表明,種族這一因素比預期發揮了更大的作用:在 44 名獲獎者當中,其中有 36 人為白人。
事實上,關於算法中含有性別、種族偏見的研究和報道,早已有之。而據雷鋒網此前報道,要消除這些偏見,並不容易。正如微軟紐約研究院的高級研究員 Hanna Wallach 所說:
「只要機器學習的程序是通過社會中已經存在的數據進行訓練的,那麼只要這個社會還存在偏見,機器學習也就會重現這些偏見。」
- 如何發揮多重資產策略的最大優勢?
- 掌握全球財經資訊點我下載APP
上一篇
下一篇