IBM發布了一套包括100萬張多元化的人類臉部圖像的(Diversity in Faces)數據合集,希望能夠幫助開發者們訓練基于人工智能和神經網絡的臉部識別系統,提高AI在臉部識別方面的多樣性和準確性,戰勝面對年齡、性別和種族膚色差異的人臉識別時存在的技術偏見問題。
此前研究人員發現人臉識別分析軟件依據其識別對象的年齡、性別和種族膚色的差異,結果會反饋出不同的準確性表現,存在一定的技術偏見。
整套IBM數據庫采集自Flickr共享CC協議的1億多張人臉影像和視頻中,數據庫圖像均有注釋著顱面測量數據(頭部高度、鼻梁高度、前額高度、臉部比例)年齡、性別、姿勢、清晰度等等。
目前這套數據庫已經于今日向開發者社區開放。