從此結案:拐賣兒童案背後的人工智慧|穀雨

七月 17, 2019 0 次閱讀 0 人點讚

從此結案:拐賣兒童案背後的人工智慧|穀雨

過去,一些拐賣兒童案會陷入僵局,真相被掩藏,充滿懸念。警察有時會被困在迷宮中,付出常人無法想象的努力。現在,由於人工智慧的介入,四川、廣東等地,先後有8名被拐多年的兒童被重新找到。最新的案例是一起發生在深圳羅湖的綁架兒童案:19年前,孩子被綁架後消失,那時他只有3歲。19年後,他被人工智慧找到時,已經是深圳一家餐廳的廚師。這意味著,我們可能站在一個時間的分水嶺上:一種犯罪型別正在被技術逐步瓦解。

這是一個技術向善的故事。

撰文丨姚胤米

出品丨穀雨工作室

1

人工智慧破案的事不是在未來發生的,這件事就發生在昨天。2019年1月25日,一個星期五,四川省公安廳8層的DNA實驗室裡,近300份DNA樣本被錄進檢驗系統中。下午兩點多,所有資訊都收錄完畢,接下來是等待結果。打拐處處長蔣曉玲在辦公室裡坐不住,她叫上搭檔胡麗,兩人一塊上樓,直接坐在DNA檢驗系統旁。

機器運轉得很慢。那個DNA庫“比較老”,蔣曉玲的手一直放在儀器旁邊的電腦滑鼠上,“一會兒重新整理一下,一會兒重新整理一下”。她很急,想要馬上知道結果。

過去的幾年,四川打拐的警察們都在跟一個案子纏鬥。最初,只是2014年4月一個四川遂寧的兒童被拐,經過了2個多月的偵查,同年發生在巴中、南充的兩個拐賣案被串併到一起。四川省公安廳排程幾個市轄的警察成立專案組,稱為“426案”。這些案子手法一致、嫌疑人體貌特徵接近。

線索都指向了王×文。

他走路有點拖,“但也不是瘸”。7月31日,在四川省達州市渠縣老家,王×文被抓了,這次行動有三個男孩被解救。經過進一步審訊,一個驚人的進展出現了:從2008年起,發生在四川多市縣總共13起兒童拐賣案,都跟王×文有關。很快,這個系列拐賣案被公安部列為部督案件,但這只是個開始。

幹了多年警察,蔣曉玲偶爾會遇到這樣的案子。這些案子的線索就像一根斷線的風箏,會在某個環節突然斷掉。警察們用盡一切辦法,不放過任何機會,但所有的努力都卡在一個關節處,成為積案。

王×文就是這樣一個關節——他不斷翻供,拒絕提供中間人的資訊。越來越清楚,指望從他這裡開啟局面並不現實。

青少年是兒童成長最迅速的時期,孩子的臉一年一個樣子。時間每多一天,找到的概率就少了一些。最長的一起拐賣案,有的警察跟了十年,沮喪感一度籠罩著他們。DNA比對已經進行過一次,無功而返。那一次,警察們完全依賴人的經驗,從一個人口資料庫中,篩出一批兒童,但沒有一箇中的。——即使是最親密的父母,對於失蹤了多年的孩子,肉眼和記憶也並不可靠。

直到人工智慧出現了。

從此結案:拐賣兒童案背後的人工智慧|穀雨

人臉比對模擬 圖 | 優圖實驗室

2018年11月,上海漕河涇開發區軟體園裡,騰訊的優圖實驗室,一臺擁有4塊GPU的組裝電腦開始高速運轉。顯示屏的程式設計軟體終端介面上,一串串超級長的字元自動生成,動態移動,像一道向上流動的瀑布。

這些字元,代表著一個龐大資料庫中,與十位在十年前被拐兒童的相似程度。兩個小時後,研究員曉程的電腦上生成了10個資料夾壓縮包。核實無誤後,資料夾壓縮包最終被轉交到蔣曉玲的手上。

每個資料夾裡有101張照片。第一張照片是被拐兒童,看著有年頭了。畫素很低,很模糊,是個只有兩三歲的小男孩。

剩下的100張照片,是100個13歲左右的兒童,他們以滿分100分制降序排列。一張照片下寫著分數:98.3。這意味著照片裡的人與被拐兒童有98.3%的概率是同一個人。

提交給四川警方的說明文件中,騰訊團隊的湯海鵬做了解釋:75分是萬分之一閾值,80分是十萬分之一閾值,85分是百萬分之一閾值。以75分為例,如果兩個人臉比對分數超過75,則這兩個人臉是“萬里挑一的像”。

從此結案:拐賣兒童案背後的人工智慧|穀雨

這是跨年齡人臉識別技術的第一次應用。人工智慧是否可以幫警方解決一個多年的難題,沒有人知道答案。在四川省公安廳,參與打拐的警察們都充滿期待。有人很樂觀,猜測可能會比對上幾個,一個幹了多年警察的老刑偵比較保守,猜兩個。

多年以來,這個案子成了他們最大的心結。蔣曉玲說,要是這條路走不通,“我們可能現在又換另外一條路走,反正一直得往前走,走下去,不能停止,一直得走。”

那天,他們一直在DNA實驗室裡等了八個小時,晚上十點多,仍然沒有結果出來,他們只好先回家。下個週一,一到公安廳,蔣曉玲就直奔八樓。她還是不停地刷,沒有,然後再刷,上午九點多,“一重新整理,刷,出來了四個人。”

盯了一會兒這個數字,她趕緊回過神來。“一下子從八樓跑到六樓”,她找到胡麗,語氣特別興奮和激動地說:“比上了四個!”

案子拖了快10年了。兩個女警察在公安廳六樓的走廊裡情不自禁地“跳圈圈”,一直在轉。“搞得整層樓別的科室的人都跑出來看,說打拐處的怎麼回事。”回憶起這個細節時,蔣曉玲抑制不住情緒,眼淚要掉下來。

2

王×文是一個記憶力極其出色的人。在描述拐賣現場時,他能記住幾乎所有的細節。2009年6月12日,他在武勝縣一個農貿市場拐走了一個小男孩。“那個市場裡,有人賣蛋糕,有人賣蔬菜,還有人在下棋。旁邊還有一個水渠,從房子上面經過。我就去看。”——那條水渠是真實存在的,在市場一個入口的不遠處,孩子的父親桂巨集正把它描述成“天橋”。但一旦談起孩子的下落,王×文要麼翻供,要麼就“不記得了”。

“確實太狡猾了。”幾乎每一個我碰到的專案組警察都這樣評價。“他有時候就說,哎,又換新手了,我不知道啊,我之前說的,我現在記不清楚了。”王×文知道,一旦這些孩子被找到,他可能面臨《刑法》中規定的最嚴厲的死刑。

王×文是四川省達州渠縣人。2004年,他到廣東探望遠嫁的妹妹,白天沒事的時候去公園轉。——那個公園人流量大,構成也很複雜,“什麼三教九流的都有”,算命的、搞六合彩的、包小姐的。王×文字寫得不錯,在公園裡和人混熟了,就有人找他幫忙代寫文書。

他嘴上不說話,但默默記下了文書中各種各樣地下交易的細節,其中就包括“轉讓小孩”的協議,他從裡面看到了機會。

2006年,王×文在湖南第一次作案。那個小孩看起來很老實,在長途客車上睡得很安靜。可醒來後,開始哇哇大哭。“他不是我爸爸,我不認識他。”有人立即報警,王×文以拐賣未遂被判處3年有期徒刑。

蹲監獄的三年,他不服氣,“一直在琢磨,在總結這個經驗。”專案組的警察說。直到北京奧運會前夕,他刑滿釋放,出來後又開始重操舊業。

2009年6月12日,他來到武勝縣,先是在那住了幾天,最終,決定在混亂的農貿市場下手。——辦法是蹲下來,跟孩子們一塊玩。大一點的男孩子跑出市場,最小的孩子跟在後面追,“由於他太小,跑不贏那些娃兒。”王×文就一把抱起來,說:“走,我們去追他們。”跑出路口,他們上了一輛摩的,又換計程車。

先是一個,然後又一個。他表現得很有心機,不會打孩子,孩子們要什麼,他就給什麼。那些玩具,飛機啊、汽車啊。那些吃的,零食啊,隨便買。孩子抱著玩具,好高興,這麼多吃的,這麼多玩的。玩累了,孩子就睡著了,然後就被他帶走了。

幾年間,王×文從四川省南充市、廣安市、遂寧市等地的縣城或農村拐走10餘名兩三歲男童,都被賣到廣東,一個孩子要價“五萬多”。湊夠了幾十萬後,他適時收手,帶著這筆錢到青海跟人做起了建材生意。

不到三年,他的錢賠光了,賣小孩的念頭又冒了出來。“他可能覺得風險比較小,感覺好像我們抓不住他。”蔣曉玲說。但這一次,他沒那麼幸運了。

2019年4月15日,我在南充市看守所見到了被關押將近5年的王×文。他的頭髮剃得很短,幾乎全白了,看起來也頗有老態。

回答問話時,他通常要思考一兩秒,聲音極小。對於之前十起拐賣兒童案,他全部翻供,一口咬定沒有作案。他抱著一點僥倖:只要找不到這些孩子,警察就無法定案。

即使掌握著越來越多的刑事偵查手段,但面對這樣的拐賣案,也沒有立刻奏效的辦法。——錯過找回失蹤兒童的黃金時間,就只能從市縣一級適齡人口中進行搜尋,這意味著至少數十萬級別的檢索規模。如果進一步擴大搜尋範圍至省一級,檢索規模將急劇擴大到千萬以上,堪稱“大海撈針”。

從此結案:拐賣兒童案背後的人工智慧|穀雨

數名被拐兒童照片資料供親屬指認

負責打拐的警察們付出了大量努力,他們的名字很難被一一記下。比如,四川省很多老刑偵都記掛著這個案子。其中一個老警察,2018年被公安部評為百佳刑警,已經50多歲了。一直參與案件,工作做得很細。

公安廳刑偵局局長王巨集偉回憶,他到省廳工作,接起這個案件,“當時還沒有打拐處的時候,這一塊工作就抓得很緊。”

“426案”是一個系統工程。“就像我們猜謎語,你首先要揭曉謎底,這個我們有一個艱苦複雜的偵破過程。”王巨集偉說。但越到後面,案子變得越棘手。因為王×文拒不供述這些被拐兒童的下落,全國打拐DNA資訊庫比對也沒有結果,案件的偵破工作陷入僵局。

對於那些丟失孩子的父母來說,十年裡,他們只是在嘗試各種徒勞的辦法。桂巨集正聽說深圳有個父親“通過不斷地在電腦上發發發”,找回了孩子。他就也買了一臺電腦,在天涯論壇、百度貼吧裡發帖。他加了三十幾個尋子微信群,每天收到成千上萬條訊息。

孩子被拐前唯一清晰的單人照,被印在各種形式的尋人啟示上。包括:張貼在電線杆、建築物外牆上的普通A4紙;可以用一根繩子連線起來,掛在脖子上雙手託舉的泡沫板;可以被掛在汽車上幾個月不掉色的彩色噴繪布;還有尋人公益組織為了某次活動而印製分發的撲克牌。

以及,鄭州一傢俬人手機店的牆面上——手機店的老闆也是被拐孩子的父親,他的店鋪牆面上全是丟失孩子的照片。他讓來店裡買手機的人都看一眼,這樣找到的希望就多一些。

但這只是其中的一個故事。現實比期待殘忍多了。

從此結案:拐賣兒童案背後的人工智慧|穀雨

桂巨集正

3

線索匱乏,專案組的警察們各種辦法都試過了。一條路沒走通,“又換這邊,也沒走通,然後又走。”他們進行了數次頭腦風暴,對於人類的智力組織來說,這就像是站在一個迷宮中,面前是無數的岔路,通向無數的死衚衕。這樣的努力是常人無法想象的。

其中的一些辦法,蔣曉玲現在看來,會覺得“很幼稚”。一次,專案組到廣東,借了一間辦公室。警察曹軍和十餘名同事每人對著一臺電腦,一條條看別人的“家譜”。——一個家庭裡有幾個小孩?最後一個是不是男孩?和姐姐相差多大?和父母的年齡相差多大?

他們每天泡在數學題裡,“看瞎了,幾乎家家戶戶都好多人啊,比我們那裡人多多了。”十幾萬條資料,專案組的警察用肉眼一個個篩查,最終顆粒無收。

2014年底,他們曾經冒著極大的風險把王×文從看守所提出來,押到廣東去指認現場。

專案組十餘名警察集體行動,曹軍也去了。他是武勝縣的警察,那起農貿市場的案子串並後,他被領導指派加入了專案組。為此,他到廣東出了數不清多少次的差。走訪的多了,他對當地的民風也有了解,“他們那裡,家裡沒有男孩是沒有地位的。”

曹軍非常符合人們想象中的基層警察,長得高大,身材很壯,能吃苦,看起來沒有架子,說話很生動。押解期間,專案組的民警們和王×文吃在一起,住在一起,24小時輪流看守,又要防止他生病,還要提防他自殘或自殺。

出發前,王×文說:“應該能找到。”可一到目的地,他就改口說:“路都變了,認不出。”

車在市內剛開了沒多遠,王×文說:“車開得太快了,我看不清。”曹軍他們只好押著他下來走路。走了一會兒,實在太慢,他們便找了幾輛“火三輪”,那是11月,三輪車沒有棚頂,露天,風大,“慢慢開,又冷,吹得頭髮全是立起來的。”

他們終於在當地一個縣找到了王×文供述的“一所小學”。一下車,所有人都傻眼了——“修的房子都是一模一樣的。”曹軍說,不僅如此,村子裡大部分人家連姓氏都是一樣的。

一群四川人到廣東找小孩,語言都是不通的。他們試過挨家挨戶走訪,沒有效果。他們問了一圈兒,什麼都問不出,最後只能押著王×文回去。

2015年,專案組聯絡了瀋陽著名刑事相貌專家、中國刑警學院的趙成文教授畫像,根據孩子們的童年照片,畫出他們十幾歲的樣子。

模擬畫像是刑事偵查中的一項重要技術,它曾幫助中國警方破獲了相當多的案件。這一次,專案組帶著這些畫像再到廣東,提取適齡兒童照片,“用肉眼找出覺得和這個像的”。

看了十天,找到176張照片帶回四川,組織家長辨認。南充市公安局刑偵支隊的賈副支隊長回憶,在辨認現場,一開始,孩子的父母覺得“都不像”,看著看著,一個覺得這個像,一個覺得不像,夫妻之間有時會陷入爭吵。

“你才帶了幾天,你知道像不像?”

“要不是你,孩子能丟麼?”

一份資料裡顯示:這樣的家庭,“70%夫妻關係破裂,分居或離婚”。最後,他們篩出來100多個“疑似物件”,做DNA比對,一個都沒中。

局面困在了這裡。

從此結案:拐賣兒童案背後的人工智慧|穀雨

模擬畫像

4

挫折接連不斷。在警方嘗試各種新辦法時,2015年,具有更大運算力和儲存空間的GPU的應用,把人工智慧的熱度推向巔峰。——GPU是圖形處理器的簡稱,比傳統中央處理器計算速度快10至100倍。

深度學習演算法使得訓練出一個“更聰明”的AI成為可能。人類“不可靠”的部分——人工智慧總有辦法規避掉。

2017年12月,公安部刑偵局副局長陳士渠到騰訊調研。騰訊守護者計劃安全團隊的李新和他交流時,提到人工智慧和跨年齡人臉識別技術。陳士渠很感興趣,他想起了“426系列”拐賣案——近十年來,公安部打拐辦和四川公安從未放棄過努力和偵查,他曾多次前往四川督辦此案。他希望找到突破口,便要求四川專案組和騰訊團隊對接,“希望利用新技術查詢被拐兒童下落。”

需求被轉達給騰訊人臉識別團隊——優圖實驗室時,沒有人感到樂觀。這是一個“全博士”團隊,都畢業於名校,技術水平很高。但得到這個訊息時,優圖實驗室總經理Kyle的第一反應是:“難度還是挺大的。”

跨年齡比對是人臉識別領域一個公認的難點,特別是青少年階段,人臉特徵變化最大。優圖當時的演算法模型,並沒有進行過大規模的跨年齡比對,準確率在80%左右,這遠不是一個能夠應用到安防打拐領域的演算法。

之後的十幾天,守護者計劃團隊和優圖實驗室的同事開了很多次會。2018年1月的一個深夜,十二點左右,已經入睡的優圖實驗室總監Allen電話突然響起,是守護者計劃團隊的同事,Allen當時“並不明確公安部要做什麼事情”,他的第一反應是“這件事情肯定很重要,不然不會這麼晚緊急找過來。”

第二天上午10點,Allen就接到通知,要用優圖的技術幫助尋找這起拐賣大案中的失蹤兒童。

Allen心裡沒底。跨度十年的案件難度,超過他們的想象,世界上也沒有成功的案例。但他決心要全力以赴。Allen說:“也算比較幸運,找到了這麼一個實際落地的case。”

執行工作由優圖人臉識別團隊的李博士牽頭。最重要的是“學習材料”。一開始的版本,用李博士的話說,“很裸”。他們通過各種數學約束條件,教導AI——“這是同一個人。”“這是這個人1歲的樣子,5歲的樣子,10歲的樣子,30歲的樣子。”“這個大人的照片,跟其他小孩子都是不像的。”

“它會學到一個人的面部隨年齡演變時,不變的那些量是什麼。”研究員曉程說,這些面部特徵,“可能對應著一些語義描述”。

曉程總是會冒出這種又準確又幹脆的詞——“比如,一個人的耳垂長得很特別,或者他的眉峰、眉骨走向不一樣。”他說,AI是無法用這樣的語言去定義的,研究員們把它“轉化成一些數學語言”。

最終的結果是,機器學習總結出了“不隨時間變化的人臉特徵”——在研究員的電腦上,是由長度為512維的特徵向量呈現出來的。

很多個夜晚,研究員們消耗在這些事情上。他們加了數不清的班,提交了5個版本演算法模型,其中大大小小的修改多達上千次。

中間,有一次測試的機會。2018年年初,公司年會。他們收集了一些同事小時候的照片,在年會上讓機器和人一起競猜,“人機大戰”。“因為都是比較熟的人,”李博士覺得,“這肯定能認出來吧。”遊戲進行了幾輪,最終的結果是,人最多猜對了4個,而演算法比對了7個。

這終於讓他放心了——“這個事情雖然難度大,但演算法肯定是比人強的。”

從此結案:拐賣兒童案背後的人工智慧|穀雨

2019年5月,騰訊全球數字生態展上的人臉識別技術展示

5

1月28日,比中4個孩子的結果,陸續向整個專案的參與者傳遞。李新是在飛機上得到訊息的,四川省公安廳前打拐處副處長唐中琦給他打來電話,叫他猜,比中了幾個。

李新沒敢多猜,他說:“一個。”唐處說:“不對,再猜。”李新猜:“兩個。”唐處揭曉答案:“四個。”

李新聽完,幾乎尖叫出來。湯海鵬也很激動,他已經記不清當時在哪,但非常清楚地記得,聽到結果時,他真的哭了。

當結果傳到上海優圖辦公室時,幾名研究員正在如常地對著電腦寫程式碼,看到比對上4個,李博士、曉程、安平幾個人“小聲地yeah了一下”。

那天是週一,Allen說,“覺得不可思議,就是一下子從凳子上坐起來,很驚奇,很驚喜。”他的預期是能找到一個就不錯了。

打拐的警察們付出了幾個月的努力:人工智慧可以幫助警方把海量的資料縮小到100個,但拿到資料,並不意味著工作就結束了。蔣曉玲組織警員,先用四個多月的時間,進行了基礎的刑偵工作。2019年2月11日,四川省公安廳刑偵局副局長宋月齊率12名專案組人員趕到廣東,對比中的4個孩子的情況進行落地偵查。剩下的就是最後一步——驗證結果。

春節假期剛過,警方提出進行第二次比對。研究員們又對演算法進行了優化。這一次,他們擴大了比對範圍。——原有的辦法受“學習材料”的影響很大,因為缺乏足夠的跨年齡影象資料,這個AI並不能做到像是針對成年人的人臉識別AI那樣好。

李博士用“祖母細胞”打比方。“它假設人,比如說腦子裡面有一個祖母細胞,只有在看到祖母的時候它才會響應。”

人類的智力不可能這樣思考。但在優圖內部,他們把所有的人臉識別模型都按照“祖母1、2、3、4”這樣推下來,它對熟悉的東西“學得特別好”,對不熟的東西“學得就不好”。

關鍵時刻,曉程開發了一套損失函式,把識別成年人時表現得“很聰明”的AI作為老師,將跨年齡識別“不夠聰明”的AI作為學生,讓學生給出的判斷結果儘可能靠近老師。現實條件中,照片的質量、人臉的角度、遮擋、光線都有可能對AI的判斷帶來影響。——“我們去教這個老師,儘量克服其他因素的影響,去獲得人臉特徵。”

對於教導和開發AI的研究員來說,與AI的關係是很特別的。他們雖然是AI的設計師,但AI經過自我學習後,又變成一個強於人類智力組織的存在。

“就像我們人類去認識世界,” 曉程說,“牛頓力學定律,這麼簡單的幾套定律,結果演化出這麼大的一個世界。我們教導AI,通過精簡後的一些學習準則,行為設計的標準,把它生產出來,最終,它就是會達到人類都無法達到的高度。”

AI的識別精度最終提升到接近96%。它還在不斷的進化。2019年2月,第二次比對,又找到1人。2019年3月,第三次比對,又找到2人。至此,這起部督拐賣專案的13名被拐兒童,只有3人尚未被確認身份。

6

2019年4月,釀酒商人桂巨集正和妻子終於等到了人生裡最渴望的那個訊息——被拐十年的兒子找到了。他們的心情和他們的狀態一樣慌亂。從警察手裡接過兩張照片:那是他們的孩子,變樣了,有點陌生。他們仔細看,才看得出孩子兩三歲時的樣子。十年過去了,即使是親生父母,也不能在人群中一下認出他。

桂巨集正夫婦曾經歷過一場空歡喜,那種心情“比悲傷更要悲傷”。2012年,有志願者聯絡桂巨集正,說疑似在西寧看到了他。志願者發過來一張照片,那個小孩戴了頂帽子,低著頭。

男孩的眼角也是垂下來的,兩頰紅紅的。桂巨集正幾乎確認那就是他兒子。他的心情急迫而強烈,叫志願者在當地報警,再去拍照片。幾天之後,志願者確認那個孩子不是他的。

“那次我真的就太傷心了。”桂巨集正掏出手機,開啟相簿刷了幾秒鐘,點開那個小孩的照片,拿給我看:“你看像不像?”

不等我回答,他說:“整個都像。”

出現這樣的“錯誤”並不奇怪。生物學統計,女性懷雙胞胎的自然概率是八十分之一。人群中,兩個相似度極高的人出現的概率更高,人類肉眼分辨人臉相似度沒有那麼可靠。

“說實在的,他就是坐在我們身邊,我都認不出來,是吧?”之後的兩個月,桂巨集正和妻子無數次拿出那兩張照片,和那張3歲的照片放到一塊兒比。也說不上是要確認什麼,但還是努力尋找幾張照片的共同點。

“小時候上幼兒園的看起來很像,像得很。現在臉型變了,瘦了,原來臉很圓。”桂巨集正的妻子說。

他們唯一能掌握的不太會被時間改變的細節,是孩子右腳小腿上的一處疤痕。那是男孩小時候在酒坊玩耍,不當心被滾燙的水燙的。4月12日,在廣東一處民宅與兒子相認時,這對父母做的第一件事情是:一把掀開孩子的褲腳,看看小腿上是不是有一條疤。

技術帶來的結果令人欣喜,6月19日,最新的一個訊息:今年四五月,優圖的人臉識別技術又幫助深圳警方找回一個失聯多年的兒童。那是2000年,深圳羅湖發生一起綁架兒童案,綁匪索要贖金二十萬元。奇怪的是,小孩和綁匪隨後卻消失了。多年來,警察沒有放棄尋找,也曾找畫像專家進行跨年齡模擬畫像,都沒有獲得有價值的線索。孩子失聯時只有3歲,19年過去了,他被找到時在深圳一家餐廳當廚師。

陳士渠說,這些兒童被找回,“充分證明人工智慧對於查詢被拐多年兒童能夠發揮重要作用。”而目前,採取盜竊、搶奪、拐騙等方式拐賣兒童的案件,“全國年發案只有幾十起”,基本可以快偵快破。

這意味著,我們可能站在一個時間的分水嶺上:一種犯罪型別正在被技術逐步瓦解。

從此結案:拐賣兒童案背後的人工智慧|穀雨

跨年齡人臉匹配準確度高達99.80% 圖 | 優圖實驗室

蔣曉玲對未來充滿期待,“我們今年準備看能不能把剩下幾個解決掉,要是這幾個也找到的話,我們的案子就比較完美了。”

四川的案子中,還有3個孩子沒有確認。這三個人中,有一個男孩的比對結果很特殊。三次比對,排在相似度第一位的始終是同一個人。即便以肉眼看,這個男孩與被拐兒童的面部特徵都很相似——甚至耳朵上一處非常特殊的標誌。但奇怪的是,幾次DNA比對都不成功。

頭兩次,機器判斷:97、98分,第三次——100分。

警察們對這個結果感到困惑。他們調查過孩子親生父母生產時的狀況,那對夫妻是在鎮上一家診所生下的男孩,診所並不正規,“都沒有留下出生記錄”。

研究員們的看法各不相同。“機器也有bad case。”李博士說,“所有的人工智慧都不是百分之百正確,比如說它的識別能力就是95%,在一個千萬的集合裡,有一兩個找不到,我覺得是在演算法誤差內,很正常。”

曉程則相信機器比人坦誠,也比人可靠。從2009年開始從事人臉識別,過去十年的工作給他帶來的一個啟發是——“它的錯肯定是有理由的。”

這個世界上有太多巧合和錯亂的事情了,再強大的AI也解釋不了一切。

* 文中圖片由騰訊守護者計劃安全團隊提供,Kyle、Allen、曉程為化名。