人工智能是近年來十分熱火的討論話題,法律人士每當(dāng)討論到人工智能時(shí),往往會(huì)有一種被機(jī)器人替代的擔(dān)憂。尤其是今年Alpha Go打敗柯潔之后洛口,這種擔(dān)憂加劇:計(jì)算機(jī)技術(shù)對(duì)傳統(tǒng)行業(yè)的顛覆從替代機(jī)械勞動(dòng)凯沪,進(jìn)一步影響到腦力勞動(dòng)領(lǐng)域。
計(jì)算機(jī)能否替代腦力勞動(dòng)买优?計(jì)算機(jī)技術(shù)的邊界是什么妨马?這還要從人工智能的目前常見的三種類型說起。
一杀赢、Type I - 相似性
許多律師會(huì)使用筆記類軟件作為工作記錄烘跺,我們所大部分律師用的都是印象筆記。印象筆記相較于其它電子筆記軟件脂崔,有一項(xiàng)殺手級(jí)應(yīng)用——“推薦內(nèi)容”(高級(jí)版功能)滤淳。這個(gè)功能可以在你寫筆記的時(shí)候,自動(dòng)在下方提示可能與本條筆記相關(guān)的其它筆記砌左。如果你習(xí)慣于將平時(shí)的工作和思考都記錄在印象筆記里的話脖咐,這一功能十分實(shí)用。我經(jīng)常遇到這樣一種情形:在記錄某項(xiàng)正在進(jìn)行的工作時(shí)汇歹,印象筆記提示我之前曾做過類似的工作或是讀過與此相關(guān)的文章屁擅,從而避免重復(fù)勞動(dòng),事半功倍产弹。
更重要的是派歌,這是一種模擬人腦思維的表現(xiàn)。人腦發(fā)揮創(chuàng)造力最重要的一個(gè)手段,就是把兩個(gè)不同的想法連接起來胶果。這個(gè)連接越是意想不到匾嘱,創(chuàng)造出來的東西就可能越有意思。想要讓想法連接早抠,你得先擁有很多很多想法才行霎烙,而現(xiàn)在你可以把想法寄存在一個(gè)外部工具里,讓計(jì)算機(jī)幫你建立連接贝或!
這個(gè)功能看起來非常人工智能吼过,但使用的技術(shù)并不高深∵浣保可以推測(cè)該功能主要是通過內(nèi)容分詞以及詞匯匹配算法盗忱,即當(dāng)兩則筆記有多個(gè)詞匯一致時(shí),則視為兩則筆記有“相似性”羊赵,根據(jù)相關(guān)性的高低排序趟佃,顯示在筆記下方。
無訟天同碼也使用了類似的技術(shù)昧捷。眾所周知闲昭,天同律師事務(wù)所出版的天同碼,是一套“麻袋”級(jí)別的重量級(jí)工具書靡挥,在體現(xiàn)法律知識(shí)厚重感的同時(shí)序矩,也帶來了極度的不便利性。我為了能方便查閱這套工具書跋破,將天同碼整體掃描成PDF版簸淀,并對(duì)目錄部分進(jìn)行OCR識(shí)別校對(duì),建立索引毒返。即便如此租幕,用起來還是多有不便。
無訟科技顯然也意識(shí)到這個(gè)問題拧簸。近期上線的無訟天同碼劲绪,也做到了相似性自動(dòng)匹配的功能,不禁讓人眼前一亮盆赤。當(dāng)你在無訟案例中打開某篇裁判文書時(shí)贾富,系統(tǒng)會(huì)自動(dòng)提示與這個(gè)判決相關(guān)的天同碼(如有)。我推測(cè)這種關(guān)聯(lián)是基于案由牺六、標(biāo)簽祷安、案件關(guān)鍵詞等實(shí)現(xiàn)的相關(guān)性匹配,準(zhǔn)確率很高兔乞。我們查找裁判文書汇鞭,常常是為了找到一個(gè)結(jié)論凉唐,以及與這個(gè)結(jié)論相關(guān)的案例來支撐自己的觀點(diǎn)。但是要判斷某篇裁判文書的結(jié)論是什么霍骄,十分耗費(fèi)時(shí)間台囱,通常需要大致先看一下案情,再看法院查明事實(shí)读整,最后重點(diǎn)閱讀法院認(rèn)為部分簿训。有了天同碼之后,你可以第一眼就看到天同碼的22字結(jié)論米间,方便你作快速判斷强品。
想像如果能將天同碼集成到印象筆記里將會(huì)多么美妙!相當(dāng)于你有了一位貼身秘書屈糊,這位秘書通讀天同碼中所有的判決的榛,當(dāng)你談到一個(gè)法律問題時(shí),這位秘書會(huì)主動(dòng)提示你逻锐,法院判決是怎樣的夫晌。而且這位秘書惜字如金,每次只說22個(gè)字昧诱。
二晓淀、Type II - 用戶大數(shù)據(jù)+相似性
大數(shù)據(jù)也是一個(gè)十分火的概念,甚至有些過火盏档,說什么都要和大數(shù)據(jù)扯上關(guān)系凶掰,出現(xiàn)了一種言必稱大數(shù)據(jù)的局面。但從定義上看蜈亩,大數(shù)據(jù)是指“讓傳統(tǒng)數(shù)據(jù)處理應(yīng)用無法處理其復(fù)雜性的數(shù)據(jù)集”懦窘,所以那些用excel統(tǒng)計(jì)出來數(shù)據(jù)咱就別硬叫大數(shù)據(jù)了吧。
大數(shù)據(jù)與相似性的組合可以讓人工智能更進(jìn)一步勺拣,具有更高的擬人性。以我們?nèi)粘J褂玫囊魳奋浖槔闾睿S多音樂軟件都會(huì)有推薦算法药有。比如你收藏了某一首歌,軟件就會(huì)推薦相似的歌曲和歌單給你苹丸。這個(gè)推薦功能有的時(shí)候準(zhǔn)到讓你懷疑人生愤惰,我有一次就因?yàn)橥扑]聽到了一首我很多年前聽過非常喜歡但記不起名字的歌曲,頓時(shí)覺得它比我自己還要懂我的音樂品味赘理。
然而宦言,音樂品味這個(gè)東西這么玄,軟件是如何做到識(shí)別你的品味的呢商模?其實(shí)并沒有奠旺,軟件根本不會(huì)去分析你的品味蜘澜,而是從海量的用戶數(shù)據(jù)中去檢測(cè)相似性——如果有許多用戶在喜歡A歌曲的同時(shí)也喜歡了B歌曲,那么軟件就判定A和B兩首歌是有相關(guān)性的响疚。然后當(dāng)你喜歡了A或B歌曲后鄙信,軟件就會(huì)將另一首歌推薦給你。
法律界有沒有這種模式的人工智能忿晕?目前看來還沒有装诡,原因在于法律圈缺少一個(gè)記錄用戶行為的大數(shù)據(jù)來源。有人可能會(huì)問這么多裁判文書不是大數(shù)據(jù)嗎践盼?裁判文書確實(shí)是大數(shù)據(jù)鸦采,但更像是一種難以啃動(dòng)的原始素材數(shù)據(jù),相當(dāng)于音樂軟件里的海量歌曲咕幻,其本身難以被直接分析渔伯;而大量用戶對(duì)裁判文書(歌曲)的評(píng)價(jià)、點(diǎn)贊等行為才是真正的用戶大數(shù)據(jù)谅河。用戶大數(shù)據(jù)有其特定類型咱旱、具體數(shù)據(jù),能夠很容易被計(jì)算機(jī)分析绷耍,并以此輔助對(duì)原始素材的整理吐限、分類以及各種智能化的運(yùn)用。
我之前曾和Open Law的創(chuàng)辦者聊過用戶大數(shù)據(jù)的一種可能:讓用戶給判決書評(píng)勝負(fù)褂始,即你認(rèn)為是原告勝訴還是被告勝訴诸典;讓用戶給法官評(píng)分,即判得好不好崎苗。這類大數(shù)據(jù)一旦形成狐粱,會(huì)讓司法審判更有可預(yù)見性:某個(gè)類型的案件通常是如何判的,該案審判法官可能有某種傾向性胆数,系統(tǒng)為你推薦擅長這個(gè)領(lǐng)域的律師肌蜻,該律師勝訴率為多少,都可以通過大數(shù)據(jù)分析得出參考結(jié)論必尼。
三蒋搜、Type III - 大數(shù)據(jù)+特征分析+策略評(píng)估
讓我們說回Alpha GO。圍棋曾因?yàn)槠洳豢筛F舉性判莉,一度被認(rèn)為計(jì)算機(jī)無法戰(zhàn)勝人類中的頂尖高手豆挽。但事實(shí)證明Alpha GO已經(jīng)“學(xué)會(huì)”了圍棋,并戰(zhàn)勝了人類券盅。這個(gè)學(xué)會(huì)過程十分復(fù)雜帮哈,很難講清。簡單理解锰镀,Alpha GO做的事情其實(shí)是策略分析娘侍,利用海量棋譜(大數(shù)據(jù))分析目前局面下(特征分析)下一步棋的最優(yōu)解(策略評(píng)估)咖刃。具體來說,就是讓機(jī)器學(xué)習(xí)大量棋譜私蕾,從中自動(dòng)找到特征(類似于圍棋定式)僵缺,符合某一特征可以評(píng)幾分,模擬多種策略選擇其中評(píng)分最高的策略踩叭。
法律問題也是如此復(fù)雜磕潮,無法窮盡,一度讓人覺得機(jī)器無法介入容贝。但如果參照Alphda GO的思路細(xì)想自脯,其實(shí)法律實(shí)務(wù)中同樣存在“一些特征”。美國電影《失控陪審團(tuán)》一開場(chǎng)就講述了雙方律師在選擇陪審團(tuán)時(shí)斤富,分析陪審團(tuán)候選人員的背景信息膏潮,如性別、年齡满力、婚姻狀況焕参、工作情況等,就能敏銳地捕捉到一些特征信息油额,比如失業(yè)婦女有可能情緒不穩(wěn)定叠纷,不適合作為本案的陪審員。資深律師一旦發(fā)現(xiàn)特征信息潦嘶,就會(huì)直覺式地對(duì)案件有一個(gè)初步判斷涩嚣。同樣道理,計(jì)算機(jī)如果能將這些特征納入分析并評(píng)估掂僵,也能產(chǎn)生類似的“直覺感”航厚、“大局觀”。
有了特征分析之后锰蓬,便可以作進(jìn)一步的策略評(píng)估幔睬。美劇《POI》中第S04E11集,講述了主角被困芹扭,人工智能(The Machine)通過監(jiān)控周圍敵人力量分布麻顶,并預(yù)演各種逃生可能,算出生存概率最大的逃生路線冯勉,最后幫助主角逃出層層包圍的故事澈蚌。
這一類型種人工智能則是否足以撼動(dòng)法律工作者的飯碗摹芙?未必灼狰。我們可能忽略了一個(gè)問題——真實(shí)性。對(duì)于圍棋比賽來說浮禾,是不存在真實(shí)性疑問的交胚,落子無悔份汗,也不可能造假,Alpha GO只要根據(jù)盤面數(shù)據(jù)直接分析即可蝴簇。但是法律實(shí)務(wù)中是存在大量真實(shí)性問題的杯活,審判質(zhì)證環(huán)節(jié)就是為了解決這個(gè)真實(shí)性問題。事情真實(shí)與否熬词,計(jì)算機(jī)很難判斷旁钧,比如一份文件上的簽字,律師一摸沒有筆跡用力形成的痕跡互拾,就立刻知道不是原件歪今,真實(shí)性存疑。真實(shí)世界如此復(fù)雜颜矿,計(jì)算機(jī)怎么玩得過人類的套路寄猩,單獨(dú)出來混,只有被騙的份骑疆。
想像一種可能的場(chǎng)景:律師通過與當(dāng)事人面對(duì)面溝通田篇、書面閱讀證據(jù)材料、實(shí)地走訪現(xiàn)場(chǎng)等方式獲取一手信息資料并捕捉其中的細(xì)節(jié)箍铭,然后借助計(jì)算機(jī)進(jìn)行策略分析泊柬,并對(duì)其中一些復(fù)雜問題進(jìn)行人為修正,實(shí)其更符合真實(shí)情形坡疼,最終得出一個(gè)最優(yōu)方案彬呻,著手處理。說得形象一些柄瑰,就是帶著機(jī)器人去開庭闸氮。以后當(dāng)事人在給律師出具授權(quán)委托書時(shí),有可能需要多委托“一位”了教沾。