佳文?礪道智庫?2023-09-07 14:18?發(fā)表于北京
國際象棋是世界上最古老的戰(zhàn)爭游戲沟娱,計算機在 1997 年就掌握了它。真正的戰(zhàn)爭要復(fù)雜得多腕柜,機器仍然難以理解它济似。因此,盡管為當今人工智能提供動力的機器學(xué)習(xí)技術(shù)可以通過計算數(shù)字來贏得國際象棋比賽(兩支由 16 枚棋子組成的軍隊在 64 個方格上作戰(zhàn))盏缤,但它們無法應(yīng)對實際戰(zhàn)斗中的模糊性和混亂砰蠢。
據(jù)“防務(wù)快訊”網(wǎng)9?月?5?日報道,五角大樓希望人工智能驅(qū)動的“戰(zhàn)斗管理”助手幫助人類指揮官協(xié)調(diào)與數(shù)十艘艦艇唉铜、數(shù)百架飛機台舱,在陸地、海上潭流、空中竞惋、太空和網(wǎng)絡(luò)空間進行機動的聯(lián)合全域作戰(zhàn)柜去。
DARPA嘗試3 種方式
美國國防部負責(zé)遠景、高回報研究的官方機構(gòu) DARPA 在今年早些時候與三家公司簽訂了合同拆宛,將過去的機器學(xué)習(xí)推向下一代人工智能——至少在理論上嗓奢,這可能有助于為人類帶來秩序。DARPA 稱之為“戰(zhàn)略混亂”胰挑。
“JADC2(聯(lián)合全域指揮與控制)確實需要大量規(guī)劃蔓罚,” DARPA項目經(jīng)理Aaron Kofford說,“這就是 SCEPTER 的意義所在瞻颂。”
科福德解釋稱郑象, SCEPTER 是戰(zhàn)略混沌引擎(Strategy Chaos Engine for Planning贡这、Tactics、Experimentation and Resiliency)的縮寫厂榛,其中“引擎”是對被稱為國際象棋引擎的游戲程序的特意致敬盖矫。
“我是一名國際象棋棋手,”科福德說击奶,從國際象棋人工智能中可以學(xué)到很多東西辈双。他強調(diào),現(xiàn)代國際象棋引擎不僅可以擊敗人類棋手柜砾,還可以通過分析棋局湃望、評論和建議更好的走法來幫助他們。類似的戰(zhàn)爭人工智能工具可以幫助指揮官及其參謀人員規(guī)劃軍事行動痰驱。
“這并沒有取代人類证芭,”他強調(diào)〉S常“這是人類的工具废士。”?(這符合五角大樓長期的政策和戰(zhàn)略文化蝇完,即更喜歡人與機器之間的共生官硝,而不是像天網(wǎng)式的人工智能那樣控制一切,就像棋子一樣)短蜕∏饧埽“我們正在努力改進人類所擁有的工具來幫助他們評估情況》尬#”
“嘗試”是非常重要的詞达箍。“我們?nèi)蕴幱凇@可能行得通嗎铺厨?’的問題中缎玫∮蚕耍”?“一步,”科福德坦率地承認赃磨◇菁遥“這是一個非常瘋狂的想法×诨裕”
為什么溪王?像國際象棋這樣的游戲適合計算機,因為正如科福德所說值骇,它們是“有界限的”莹菱。雖然可能的位置總數(shù)實際上是無限的,但每個玩家在每個回合中的可用選擇是完全有限且明確定義的吱瘩。因此算法可以逐步探索潛在的路徑道伟,然后計算哪些分支路徑可能導(dǎo)致勝利,哪些分支導(dǎo)致失敗并應(yīng)被修剪使碾。(技術(shù)術(shù)語是“蒙特卡羅樹搜索”)蜜徽。
但對于即將投入戰(zhàn)斗或剛剛離開大本營奔赴前線的軍隊來說,可能的“下一步行動”數(shù)量比 8 x 8 網(wǎng)格要大得多票摇,而且難以精確測量拘鞋。即使是一個普通平民早上起床,也面臨著無數(shù)的選擇矢门,有的瑣碎盆色,有的激進,從“煮咖啡颅和,然后上班”到“上班傅事,然后喝咖啡”,再到“辭掉工作峡扩,賣掉工作”蹭越。帶著我所有的東西,去尼泊爾的一個公社教届∠炀椋”
“接下來我可以做無數(shù)的事情,”科福德說案训,這需要將無限的可能性減少到機器可以處理的事情上买置。
事實證明,要做到這一點强霎,你需要復(fù)興機器學(xué)習(xí)之前的一個想法忿项,回到DARPA 所說的“第一波人工智能”:所謂的專家系統(tǒng),至今仍用于從稅務(wù)準備到醫(yī)療診斷的各種領(lǐng)域。您不必在大量數(shù)據(jù)上使用算法并通過反復(fù)試驗來尋找相關(guān)性轩触,而是從知識淵博的人類(專家)開始寞酿,定義一組供機器遵循的選項和規(guī)則。
科福德說:“我確實認為我們可以運用一些專業(yè)知識來搜索一些更重要的空間脱柱,并且搜索速度比任何個人或任何集體人類委員會都要快伐弹。”
目標是充分利用人類對宇宙的理解(如老式專家系統(tǒng))和計算機處理大數(shù)據(jù)的速度(如現(xiàn)代機器學(xué)習(xí))的協(xié)同作用榨为。但就像戰(zhàn)斗中的決策樹一樣惨好,如何達到最終結(jié)果有多種想法,而且 DARPA 對不同的方法持開放態(tài)度随闺。因此日川,該機構(gòu)向SCEPTER 授予了三份合同——分別授予研究公司Charles River Analytics胯府、非營利性視差高級研究公司和龐然大物BAE Systems——以探索三種不同的路徑。
符號推理:人類會做什么售滤?
普通人如何應(yīng)對日常生活中令最聰明的機器感到困惑的現(xiàn)實世界的混亂呢蒂窒?查爾斯河科學(xué)家邁克爾·哈拉登(Michael Harradon)稱:“至少對人類來說,這些問題之所以能夠解決瓣铣,是因為人類總是在應(yīng)用一大堆你可能稱之為啟發(fā)法或近似法的東西。”例如笨使,當您駕駛并決定轉(zhuǎn)向何處時,您不會計算從?0?度到?180?度之間的每個可能的角度僚害,您通常只是選擇左/右/直硫椰。哈拉登解釋說,當稅務(wù)準備軟件生成您的納稅申報表時萨蚕,它不會將所有可能的數(shù)字隨機分配給?1040?表格的所有可能的行靶草,然后應(yīng)用機器學(xué)習(xí)來找出哪些組合不太可能讓您接受審計;它遵循人類專家預(yù)先編程的嚴格規(guī)則岳遥。
哈拉登解釋說:“任何時候你在邏輯上推論一些東西奕翔,任何時候你在制作一個清單,任何時候你在制定一個計劃浩蓉,這些都是符號推理的真正形式派继。”?計算機可能很難列出清單捻艳,但一旦制作完成驾窟,它們核對清單的速度比人類快得多,甚至比試圖計算每種可能性的機器學(xué)習(xí)算法還要快认轨。
那么如何創(chuàng)建足夠大的清單來計劃戰(zhàn)斗呢绅络?哈拉登承認,這就是事情變得棘手的地方。他說恩急,你不能只使用啟發(fā)式方法或機器學(xué)習(xí)杉畜,而是要“充分利用兩者的優(yōu)點”并將它們結(jié)合起來,相互反饋以改進對方假栓。在某些領(lǐng)域寻行,人類可以輸入啟發(fā)式方法來馴服大量數(shù)據(jù);在其他情況下匾荆,算法可以處理數(shù)據(jù)拌蜘,找到相關(guān)性,并推斷出自己的經(jīng)驗法則牙丽。
“這個領(lǐng)域還處于起步階段简卧,”哈拉登承認,“[但是]有許多非常好的示范”——包括查爾斯河尚未準備好分享的一些內(nèi)部研究烤芦。
以流程圖的形式講述人工智能故事
與?Charles River?將人類專業(yè)知識與計算機計算相結(jié)合的直接方法相比举娩,Parallax?的方法幾乎是異想天開:它讓人們以流程圖的形式講述人工智能故事。
視差科學(xué)家范帕魯納克?表示构罗,通過一步步連接所有這些相對簡單的選項铜涉,您最終會得到一個復(fù)雜的可能性地圖,正式稱為“因果網(wǎng)絡(luò)”遂唧。
計算機程序員已經(jīng)一直在使用這種故事流程圖:它是許多角色扮演游戲的基本骨架芙代。帕魯納克說,你不必分析每一個可能的選擇盖彭,而是將問題簡化為“當玩家處于一種特定狀態(tài)時纹烹,你下一步能做什么?”
視差公司的一個軍事場景(他們無法與公眾分享)是由一位退休的空軍軍士長起草的召边,其中包括近千個離散事件铺呵。
AI不需要理解流程圖的故事來分析它,只需了解事件A有選項A1隧熙、A2片挂、A3等,這些選項會導(dǎo)致情況B1贱鼻、B2宴卖、B3等。為每種情況添加正值和負值邻悬,這樣計算機就知道要尋找哪些情況以及要避免哪些情況症昏,然后寬松地設(shè)置算法以一遍又一遍地探索可能性,學(xué)習(xí)人類在查看流程圖時可能顯而易見的最佳路徑父丰。
“這是一個非常簡單的決策過程肝谭,”帕魯納克說掘宪,“這讓它運行得非常快”攘烛,一遍又一遍魏滚,直到人工智能有足夠的數(shù)據(jù)來建立關(guān)聯(lián)。
可定制的抽象:模擬模擬
國際象棋引擎的一個教訓(xùn)是坟漱,如果你讓人工智能一遍又一遍地玩游戲鼠次,它就能學(xué)得和人類一樣好,甚至比人類更好芋齿。BAE科學(xué)家Marco Pravia稱腥寇,雖然國際象棋太簡單,無法成為現(xiàn)實的戰(zhàn)爭游戲觅捆,但有很多更好的模擬可用?-?其中許多是專門為國防部開發(fā)的赦役,使用了真實世界武器系統(tǒng)的詳細(通常是機密)數(shù)據(jù)。
“已經(jīng)有一個巨大的模擬庫栅炒,人們花了幾十年的時間掂摔,在許多情況下,對其進行了改進赢赊,[并且]規(guī)劃者已經(jīng)發(fā)現(xiàn)它們已經(jīng)有用乙漓,”普拉維亞在接受采訪時說。因此释移,您不需要運行模擬國際象棋游戲來訓(xùn)練國際象棋機器人如何獲勝簇秒,而是一遍又一遍地運行軍事專用模擬器,直到人工智能開始了解哪些選擇模式會導(dǎo)致成功秀鞭。
當然,普拉維亞承認扛禽,有一個問題:這些軍事模擬比國際象棋復(fù)雜得多锋边,因此它們需要更多的計算能力才能運行。雖然你可以通過蠻力反復(fù)試驗來教人工智能下國際象棋编曼,運行數(shù)百萬個模擬國際象棋游戲豆巨,直到它了解某些動作和將死之間的統(tǒng)計相關(guān)性,但你不能通過軍事特定的模擬來做到這一點掐场。
所以 BAE 走了一條捷徑:本質(zhì)上往扔,他們是在模擬模擬。運行軍事模擬器會創(chuàng)建人工智能可以分析的數(shù)據(jù)熊户。給人工智能足夠的數(shù)據(jù)萍膛,它可以創(chuàng)建原始模擬的簡化版本,捕捉基本的動態(tài)嚷堡,但抽象出次要的細節(jié)蝗罗。這種簡化的模擬仿真(BAE 稱之為“可定制抽象”)運行所需的計算能力要少得多,因此您可以一遍又一遍地運行它,為機器學(xué)習(xí)算法創(chuàng)建足夠的數(shù)據(jù)來分析該輸出反過來串塑。
但是沼琉,當您將原始模擬簡化為“可定制的抽象”時,您怎么知道您只是擺脫了瑣碎的細節(jié)桩匪,而不是重要的細節(jié)打瘪?普拉維亞承認,這是一種判斷傻昙,必須由人類專家做出闺骚。
從本質(zhì)上講,它是人工智能和人類專業(yè)知識的夾層蛋糕:人類創(chuàng)建底層模擬屋匕,人工智能生成模擬的模擬葛碧,人類調(diào)整這些可定制的抽象以滿足特定目的。
DARPA 將如何評估這三種方法是否有效过吻?通過將結(jié)果反饋給人類进泼。科福德說:“我們讓[軍事]規(guī)劃專家查看了結(jié)果并說纤虽,‘實際上乳绕,這有點用’”——無論是否有用。最終逼纸,將由規(guī)劃者讓我們知道洋措,如果我們要么是在浪費時間,要么是在幫助他們杰刽〔しⅲ”