《攻殼機(jī)動(dòng)隊(duì)》描述了大量機(jī)器技術(shù)深入發(fā)展的時(shí)代的犯罪形態(tài)癌瘾,而早在《2010太空漫游》觅丰,新如《異形:契約》中也都有大量對(duì)“不友好”的人工智能的描述。當(dāng)然這些都是對(duì)發(fā)展人工智能的風(fēng)險(xiǎn)的揣測(cè)妨退,但其實(shí)在初期人工智能作為一種工具妇萄。雖然工具“本無(wú)善惡”蜕企,但當(dāng)強(qiáng)大的人工智能為惡人掌握的時(shí)候,其“惡能”也更為強(qiáng)大冠句!
今年9月轻掩,浙江紹興警方宣布破獲全國(guó)首例利用人工智能技術(shù)竊取公民個(gè)人信息的案件,截獲了 10 億余組公民個(gè)人信息懦底。
關(guān)于上述案件的詳細(xì)介紹老土轉(zhuǎn)載如下文唇牧。
AI 開(kāi)始進(jìn)入我們的生活,棲息在智能音箱或者手機(jī)里的它們聚唐,是能夠給你放音樂(lè)丐重、陪聊天的助手,而在互聯(lián)網(wǎng)的灰色地帶里杆查,它們也正成為犯罪分子的幫兇扮惦。
今年 9 月,浙江紹興警方公布亲桦,破獲全國(guó)首例利用人工智能技術(shù)竊取公民個(gè)人信息的案件崖蜜,截獲了 10 億余組公民個(gè)人信息。
被警方查封的平臺(tái)叫做「快啊」烙肺,曾經(jīng)是市場(chǎng)上最大的打碼平臺(tái)纳猪。他們?cè)谄平庋跷浴⒏`取桃笙、販賣(mài)和盜用個(gè)人信息實(shí)施詐騙有著完整的鏈條,其中人工智能技術(shù)運(yùn)用在識(shí)別驗(yàn)證碼這個(gè)環(huán)節(jié)沙绝。
為什么 AI 會(huì)先學(xué)習(xí)識(shí)別驗(yàn)證碼搏明?
一般而言,黑產(chǎn)最初盜取的賬號(hào)密碼信息往往是「粗糙」的闪檬。但由于人們的同一個(gè)郵箱星著,通常也是多個(gè)網(wǎng)站的登陸賬號(hào),同樣的密碼往往也在多個(gè)網(wǎng)站使用粗悯。因此黑產(chǎn)會(huì)通過(guò)利用已有的賬號(hào)密碼信息虚循,去批量嘗試這些賬號(hào)密碼能否在更多不同的平臺(tái)上登陸。(所以真的不要在多個(gè)網(wǎng)站使用同樣的密碼)
這個(gè)過(guò)程被稱為「撞庫(kù)」样傍,而撞庫(kù)的過(guò)程中最主要的障礙就是各個(gè)網(wǎng)站設(shè)置的驗(yàn)證碼横缔。
總是擔(dān)心被盜號(hào)?淡定衫哥,搜索微信公眾號(hào)愛(ài)范兒(微信號(hào):ifanr)茎刚, 后臺(tái)回復(fù)「安全」,獲取密碼管理利器清單和防盜號(hào)指南撤逢。
黑產(chǎn)使用的 AI膛锭,就是用來(lái)應(yīng)對(duì)這些驗(yàn)證碼的粮坞。為什么 AI 會(huì)先學(xué)習(xí)識(shí)別驗(yàn)證碼呢?我們先來(lái)解釋一下驗(yàn)證碼是什么初狰。
當(dāng)我們登陸網(wǎng)站莫杈、提交信息時(shí),總能遇上驗(yàn)證步驟跷究,尤其是在 12306 上買(mǎi)票時(shí)姓迅,對(duì)那些圖片驗(yàn)證碼真的是咬牙切齒。但事實(shí)上俊马,驗(yàn)證碼是各個(gè)網(wǎng)站用來(lái)對(duì)抗網(wǎng)絡(luò)黑產(chǎn)惡意登陸等行為而設(shè)置的安全策略丁存。
驗(yàn)證碼的全名是「全自動(dòng)區(qū)分計(jì)算機(jī)和人類(lèi)的圖靈測(cè)試」,由卡內(nèi)基梅隆大學(xué)的路易斯 · 馮 · 安(Luis von Ahn)提出柴我。圖靈測(cè)試解寝,顧名思義,驗(yàn)證碼的目的艘儒,是為了識(shí)別網(wǎng)絡(luò)請(qǐng)求的發(fā)起方是人類(lèi)聋伦,亦或是機(jī)器。因此早期的驗(yàn)證碼就是網(wǎng)站提出一些問(wèn)題界睁,這些問(wèn)題不能被機(jī)器破解回答觉增,又得能夠被人類(lèi)輕易答對(duì)。
網(wǎng)絡(luò)黑產(chǎn)在撞庫(kù)時(shí)翻斟,他們就會(huì)將所遇到的海量驗(yàn)證碼「打碼」任務(wù)逾礁,交給「打碼平臺(tái)」去完成。
根據(jù)騰訊守護(hù)者計(jì)劃安全團(tuán)隊(duì)的介紹嘹履,網(wǎng)絡(luò)黑產(chǎn)撞庫(kù)時(shí),與打碼平臺(tái)是這樣合作的:
首先黑產(chǎn)把已竊取的帳號(hào)密碼信息導(dǎo)入到撞庫(kù)軟件债热,撞庫(kù)軟件模擬登錄協(xié)議砾嫉,向互聯(lián)網(wǎng)公司的服務(wù)器發(fā)送登錄請(qǐng)求。服務(wù)器檢測(cè)到登錄異常時(shí)窒篱,會(huì)通過(guò)驗(yàn)證碼來(lái)進(jìn)行攔截焕刮;
撞庫(kù)軟件將收到的驗(yàn)證碼圖片發(fā)送給「打碼平臺(tái)」,請(qǐng)求將圖片轉(zhuǎn)化為字符墙杯。打碼平臺(tái)后臺(tái)破解驗(yàn)證碼配并,將字符結(jié)果返回給撞庫(kù)軟件,完成撞庫(kù)流程霍转,得到更多的用戶信息荐绝。
隨后這些信息可能被販賣(mài)、用于詐騙犯罪等避消。
早期的打碼平臺(tái)低滩,是通過(guò)眾包讓分布在各地電腦前的打碼小工來(lái)完成的召夹。后來(lái)進(jìn)化到了「人工 + OCR 降維識(shí)別圖片」。隨著互聯(lián)網(wǎng)公司對(duì)驗(yàn)證碼識(shí)別難度的升級(jí)恕沫,「人工 + OCR 降維識(shí)別圖片」的識(shí)別率在降低监憎,因此像「快啊」這樣的打碼平臺(tái)就開(kāi)始運(yùn)用 AI 技術(shù)訓(xùn)練機(jī)器,提高識(shí)別驗(yàn)證碼的精度和效率婶溯。
隨著安全防護(hù)與破解入侵兩方面的抗衡日益升級(jí)鲸阔,驗(yàn)證碼的難度在增加,形式也在多樣化迄委。從簡(jiǎn)單的字母數(shù)字褐筛、算術(shù)題,到扭曲的字符叙身、模糊的圖片渔扎,這些被歸類(lèi)為知識(shí)性驗(yàn)證碼;如今新一代的驗(yàn)證碼已經(jīng)開(kāi)始向無(wú)知識(shí)型進(jìn)化信轿,例如 Google 的 reCAPTCHA晃痴,某些網(wǎng)站需要拖動(dòng)滑條的驗(yàn)證步驟。
機(jī)器學(xué)習(xí)的發(fā)展财忽,讓字母倘核、數(shù)字組成的知識(shí)性驗(yàn)證碼被識(shí)別和破解的風(fēng)險(xiǎn)日漸增大,但這種驗(yàn)證碼即彪,依然是主流紧唱。據(jù)警方公布,這次抓捕的團(tuán)伙所使用和訓(xùn)練的 AI祖凫,已經(jīng)能夠識(shí)別出 98% 以上的驗(yàn)證碼琼蚯。
上文中案件相關(guān)的內(nèi)容摘自下面的帖子酬凳。
全國(guó)首例 AI 技術(shù)犯罪案背后惠况,你的個(gè)人信息被最先盯上(http://www.ifanr.com/923886?utm_source=rss&utm_medium=rss&utm_campaign=)