[20180518] 美國犯罪數據的嚴重偏差

Let’s Not Forget How Wrong Our Crime Data Are

By Cathy O’Neil @Bloomberg

本文作者在之前 <[20180510] 構思一個比 Facebook 更好的社交平臺> 這篇裡面有介紹過,她的書 <Weapons of Math Destruction> 用了不少篇幅解釋美國法院判刑參考的再犯 (recidivism) 機率模型為什麼有問題,展示了演算法用在有問題的數據時造成的嚴重社會結果。

在這篇文章 Cathy O’Neil 簡短介紹了為什麼她 (以及很多研究) 認為現在美國的犯罪數據存在嚴重偏差,使用這些數據來做決定的時候需要加倍小心、甚至完全避免使用。 而這個偏差的證據主要是持有大麻相關的數據,因為美國人對於在匿名調查中對承認自己持有大麻比較沒有心理障礙,不像一些比較嚴重的罪行如持有非法槍械或謀殺等。 隨著美國各州漸漸開始合法化大麻,O’Neil 警告我們將失去幾乎唯一的一個偏差偵測指標,需要趕快計劃并實施因應的措施。

根據 ACLU 的調查,美國白人和黑人使用大麻的人口比例是差不多的,但是黑人因持有大麻被逮捕的機率是 10 萬分之 716,白人被逮捕的機率是 10 萬分之 192,黑人被逮捕的機率幾乎是白人的 4 倍,而且這個差距從調查覆蓋的 2001 年到 2010 年之間不斷擴大。以這個數據為基礎,我們可以猜測其他種類的犯罪都有類似的情形。

警方這種差別性的執法會造成什麼結果呢?一個黑人因為持有大麻被逮捕後,如果他還是繼續使用大麻,第二次被逮捕的機率也比白人高很多,所以就造成了從數據上看起來黑人再犯率較高的假象,法官可能因此就給黑人判更重的刑期,產生一系列的惡性循環。這就是天真地堅認在法治社會所有人都按照同一個遊戲規則,拒絕承認一些族群收到明顯歧視 (像認為有色人種窮困純粹是因為懶惰這種說法) 會導致的結果。

O’Neil 呼籲數據科學家和 AI 從業人員應該考慮演算法的潛在偏誤以及道德風險,不要成為持續當今各種社會壓迫的幫兇。

Photo Credit

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料