我們閱讀互聯(lián)網(wǎng)的激蕩十幾年,看盡巨頭之爭纵诞、指點江山上祈、群雄逐鹿。這些離我們又近又遙遠:近是指的我們作為用戶離的很近,我們能清楚的感知到又一起的電商大戰(zhàn)雇逞,谷歌的退出百度的崛起荤懂、打車APP回饋或者各種新產(chǎn)品的發(fā)布。而作為一個創(chuàng)業(yè)者塘砸,這又離我們很遙遠:閱讀這些容易节仿,而深刻去體會行業(yè)的發(fā)展興衰,思維轉(zhuǎn)變掉蔬,并應(yīng)用到自己的項目并創(chuàng)業(yè)廊宪,又是另一回事了。
當(dāng)我們真正創(chuàng)業(yè)的時候女轿,開始甚至根本接觸不到什么戰(zhàn)略箭启,只是帶著幾個人幾桿槍打獵而已,能打到獵物蛉迹,餓不死已經(jīng)著實不易了傅寡。
今天我們的數(shù)據(jù)洞察報告,希望能給大家?guī)硪粋€新的創(chuàng)業(yè)視角北救。我們先從一個人人皆知的小東西說起:驗證碼(CAPTCHA)荐操。
驗證碼背后的故事
關(guān)于驗證碼,我們每個人應(yīng)該都非常熟悉珍策。幾乎所有網(wǎng)絡(luò)應(yīng)用的注冊托启、提交信息或者交互信息時都要求輸入指定圖片上的七歪八扭的文字,這是為了防止使用特定程序模擬用戶行為攘宙。例如:論壇灌水屯耸、批量注冊ID、各種刷票蹭劈、等疗绣。我們每個人都有輸入驗證碼的經(jīng)歷。
驗證碼链方,這個源自卡內(nèi)基梅隆大學(xué)的發(fā)明英文名是CAPTCHA(下文統(tǒng)一稱之為CAPTCHA)持痰,是一個很高大上的名字的縮寫:Completely Automated Public Turing test to tell Computers and Humans Apart (全自動區(qū)分計算機和人類的圖靈測試)。區(qū)分計算機和人類的圖靈測試祟蚀,那什么是圖靈測試呢工窍?
1950年10月,圖靈發(fā)表了一篇題為《機器能思考嗎前酿?》的論文患雏,成為劃時代之作。正是這篇文章罢维,為圖靈贏得了桂冠——“人工智能之父”淹仑。在這篇論文里,圖靈提出“機器思維”的概念,對智能問題從行為主義的角度給出了定義匀借,由此提出假想:即一個人在不接觸對方的情況下颜阐,通過一種特殊的方式,和對方進行一系列的問答吓肋,如果在相當(dāng)長時間內(nèi)凳怨,他無法根據(jù)這些問題判斷對方是人還是計算機,那么是鬼,就可以認為這個計算機具有同人相當(dāng)?shù)闹橇Ψ粑瑁催@臺計算機是能思維的。這就是著名的“圖靈測試”(Turing Testing)均蜜。
而CAPTCHA李剖,是最簡單、應(yīng)用最廣的行之有效的囤耳、全自動化的圖靈測試篙顺。如果你是人類,就可以正確的輸入歪曲的字符充择,如果是計算機慰安,就不能。
從2000年CAPTCHA出現(xiàn)開始聪铺,人工智能領(lǐng)域就有無數(shù)科學(xué)家和黑客致力于破解它!為什么有大量的人試圖破解呢萄窜?
大家想想:圖靈測試是“人工智能之父”圖靈提出來的铃剔,而代表人工智能學(xué)科最高水平的卡內(nèi)基梅隆大學(xué)研究出來最通用的圖靈測試CHPTCHA,誰要是能通過技術(shù)手段來識別出來查刻,誰就一個單挑了人工智能領(lǐng)域的江湖泰斗“少林寺”键兜!想想一個人單挑了“少林寺”是什么感覺?穗泵!
卡內(nèi)基梅隆大學(xué)計算機科學(xué)家普气,CAPTCHA聯(lián)合開發(fā)人Luis von Ahn說:“驗證碼在2000年左右出現(xiàn),自2003年開始佃延,每隔幾個月就有消息聲稱有軟件可以將其破解现诀。即便是字母驗證碼被破解,但還有圖片驗證碼履肃,圖片驗證碼變形的背景只有人類才能識別仔沿。”
十多年來尺棋,大量的團隊和公司都在這個上面不斷的嘗試封锉,但是魔高一尺道高一丈,驗證碼也不斷升級,變得越來越復(fù)雜成福,復(fù)雜到有時候我們?nèi)祟愐残枰獛状螄L試才能識別正確碾局。研究人工智能的科學(xué)家和黑客們在上面嘔心瀝血,也很難完成這樣“單挑少林寺”的超級壯舉奴艾。破解CAPTCHA 也就成為了一個神一樣存在的目標(biāo)净当。
但是如果我告訴你,遠在中國的互聯(lián)網(wǎng)創(chuàng)新精英們早在2003年就已經(jīng)徹底攻破了CAPTCHA握侧,你信么蚯瞧?
打碼模式與打碼軟件
隨著CAPTCHA的使用越來越廣泛,破解CAPTCHA不僅僅一項“單挑少林寺”的壯舉品擎,還有著大量的經(jīng)濟利益埋合。這個世界上永遠不缺為了金錢和榮譽而肝膽涂地的人,有些人“單挑少林寺”是為了江湖榮譽萄传,而更多的人是為了存儲在少林寺里面的大量財寶 -- 這些財寶都是附近的財主因為相信少林寺的絕對安全而存放在少林寺的甚颂。
從2003年開始,從來沒有人能“單挑少林寺”秀菱,但是少林寺的珠寶也從來沒有安全過振诬。因為發(fā)源自中國,推廣到全世界有效的破解方法“打碼模式”出現(xiàn)了衍菱。
所謂的打碼模式赶么,其實很簡單,就是用人工的方式去破解脊串。破解組織制作了打碼軟件辫呻,當(dāng)在網(wǎng)上需要輸入CAPTCHA時,打碼軟件自動的把歪曲的圖片信息送到打碼工人面前琼锋,一個熟練的打碼工人一分鐘可以輸入20個以上的CAPTCHA放闺。這就是最早的打碼破解模式。
接下來起源于中國的這種人力破解的方式傳到了全球各地缕坎,各大第三世界國家很多人靠打碼為生(不完全統(tǒng)計有100萬以上的打碼工人存在)怖侦,而這種工作也有了一個全球通用的名字:CAPTCHA Human Bypass。
有人會問了谜叹,少林寺的珠寶到底是什么東西呢匾寝?為什么大家都拼命要破解CAPTCHA呢,下面看TOMsInsight的數(shù)據(jù)組冒死從國內(nèi)一著名打碼軟件組織獲取的數(shù)據(jù):
從2006年開始叉谜,中國互聯(lián)網(wǎng)的游戲和電商開始了高速發(fā)展旗吁,流量終于可以變現(xiàn)。郵件營銷停局,SEO很钓,IM工具營銷等開始火熱香府,打碼模式到了新的發(fā)展高度,由于打碼軟件用戶的特殊性码倦,也是為了隱藏自己企孩,目前的打碼組織都是通過API(國內(nèi)以易語言API為主,關(guān)于易語言這個國內(nèi)互聯(lián)網(wǎng)地下世界最常用的語音袁稽,TOMsInsight正在調(diào)研分析會在稍后分享)來分發(fā)勿璃,而集成到專有專用的軟件中使用(一般使用打碼API的軟件都是定制開發(fā)),所以假設(shè)我如果定制一個郵件營銷的程序推汽,如果需要識別驗證碼补疑,我只需要在軟件中接入打碼組織的API,沖上錢歹撒,那么CAPTCHA就再無法阻攔這個程序莲组。
少林寺再也無法保護這些珠寶,而從此垃圾郵件暖夭、論壇營銷锹杈、QQ 的各種群發(fā)廣告、各種SEO手段迈着,也屢禁不止竭望。著名的圖靈測試CAPTCHA在理論上從沒有被攻破,但也從沒有安全過裕菠。
創(chuàng)業(yè)視角與分析
我們再回到開頭咬清,通過這樣的方式來破解人工智能領(lǐng)域神一樣存在的目標(biāo),雖然目的并不能說是正大光明奴潘,但是過程不得不說是一種偉大的創(chuàng)新:雖然并不是在科學(xué)領(lǐng)域的突破枫振,而是通過互聯(lián)網(wǎng)的信息傳播速度、商業(yè)模式的設(shè)計萤彩、和勞動力成本不均衡等因素,來達到“通過”圖靈測試的目的斧拍。
對于大多數(shù)創(chuàng)業(yè)者來說雀扶,技術(shù)優(yōu)勢并不成立,所以依靠獨一無二的技術(shù)來獲取競爭上的優(yōu)勢和產(chǎn)品門檻并不現(xiàn)實肆汹,而更多的創(chuàng)新只是商業(yè)模式愚墓、產(chǎn)品設(shè)計、或者是思維方式上昂勉。
這樣的產(chǎn)品或者商業(yè)模式在中國互聯(lián)網(wǎng)世界中已成常態(tài)浪册,但是創(chuàng)業(yè)者們對此有多少了解呢?看我們接下來一份調(diào)查:
可以看出在站長論壇里面沉浸的草根站長們比北京各大創(chuàng)業(yè)峰會的高大上創(chuàng)業(yè)者們明顯更懂得如何利用中國化的互聯(lián)網(wǎng)思維模式岗照。以生存為目的的站長們村象,明顯知道打到獵物活下去的重要性笆环。而大量想把創(chuàng)新型想法變現(xiàn),拿到投資厚者,甚至改變世界的高大上創(chuàng)業(yè)者們躁劣,卻又不明白江湖險惡和真正的地氣。
中國互聯(lián)網(wǎng)創(chuàng)新絕對帶有中國人獨有的智慧库菲,從美國互聯(lián)網(wǎng)巨頭在國內(nèi)紛紛失敗就可見一斑账忘。我們叫囂著在國內(nèi)做互聯(lián)網(wǎng)一定要接地氣才能成功。但是“地氣”這兩個字熙宇,卻又是慢功夫鳖擒,是踏實的摸索。很多思維模式的轉(zhuǎn)變不是一朝一夕烫止,同樣蒋荚,接地氣也不是說接就接的事情。就如美國的互聯(lián)網(wǎng)巨頭們烈拒,多少年了也沒學(xué)會接中國互聯(lián)網(wǎng)的地氣不是圆裕。
原文鏈接:
http://mp.weixin.qq.com/s?__biz=MzA3NTcwOTIwNg==&mid=200199792&idx=1&sn=0093876d0adb91eedea51ee78f2da67d&scene=0#rd