AI Agent 學(xué)習(xí)筆記(一)

一币厕、Agent 四大要素

規(guī)劃(Planning)
記憶(Memory)
工具(Tools)
執(zhí)行(Action)



規(guī)劃: Agent需要具備規(guī)劃(同時(shí)也包含決策)能力列另,以有效地執(zhí)行復(fù)雜任務(wù)。這涉及子目標(biāo)的分解(Subgoal Decomposition)旦装、連續(xù)的思考(即思維鏈)页衙、自我反思和批評(píng)(Self-critics),以及對(duì)過去行動(dòng)的反思(Reflection)阴绢。
記憶:包含短期記憶和長(zhǎng)期記憶兩部分店乐。短期記憶與上下文學(xué)習(xí)有關(guān),屬于提示工程的一部分呻袭,而長(zhǎng)期記憶涉及信息的長(zhǎng)時(shí)間保留和檢索眨八,通常利用外部向量存儲(chǔ)和快速檢索。
工具:包括 Agent 可能調(diào)用的各種工具左电,如日歷踪古、計(jì)算器、代碼解釋器和搜索功能等券腔。由于大模型一旦完成預(yù)訓(xùn)練伏穆,其內(nèi)部能力和知識(shí)邊界就基本固定下來,而且難以拓展纷纫,因此這些工具顯得尤其重要枕扫。這些工具可以擴(kuò)展Agent的能力,使其能夠執(zhí)行更復(fù)雜的任務(wù)辱魁。
執(zhí)行(或稱行動(dòng)): Agent基于規(guī)劃和記憶來執(zhí)行具體的行動(dòng)烟瞧。這可能包括與外部世界互動(dòng)诗鸭,或者通過調(diào)用工具來完成一個(gè)動(dòng)作(任務(wù))。

二参滴、Agent 是怎樣“動(dòng)”起來的

1强岸、任務(wù)分解

任務(wù)分解包括下述技術(shù)。
思維鏈:這是一種提示技術(shù)砾赔,通過讓模型“一步一步地思考”蝌箍,幫助它將大任務(wù)分解成小任務(wù),并清楚地解釋自己的思考過程暴心。
思維樹(Tree of Thoughts妓盲,ToT):通過在每個(gè)步驟探索多種推理可能性,進(jìn)而形成一種樹狀結(jié)構(gòu)专普。思維樹可以用不同的搜索方法悯衬,例如廣度優(yōu)先搜索(Breadth-FirstSearch,BFS)或深度優(yōu)先搜索(Depth-FirstSearch檀夹,DFS)筋粗,并通過提示或投票來評(píng)估每個(gè)步驟。
還可以通過簡(jiǎn)單提示炸渡、特定任務(wù)的指令或手動(dòng)(人工)進(jìn)行任務(wù)分解等娜亿,結(jié)合外部規(guī)劃器的代表是“大模型 +P”方法:它使用PDDL(Planning DomainDefinition Language,一種規(guī)劃問題描述語言)來描述問題偶摔,首先由大模型將問題轉(zhuǎn)化為 Problem PDDL,然后請(qǐng)求外部規(guī)劃器生成計(jì)劃促脉,最后將這個(gè)計(jì)劃轉(zhuǎn)換回自然語言辰斋。本質(zhì)上,規(guī)劃步驟被外包給外部工具來完成瘸味。這種方法在某些機(jī)器人設(shè)置中很常見宫仗。

2、自我反思

ReAct: 這個(gè)框架通過結(jié)合特定任務(wù)的動(dòng)作和語言空間旁仿,讓模型能夠與環(huán)境交互藕夫,并生成推理軌跡。這是一種大模型推理和行動(dòng)的一種認(rèn)知框架枯冈,是ShunyuYao等人在ICLR 2023的論文“ReAct:SynergizingReasoning and Actingin Language Models”中提出的毅贮。


該循環(huán)過程主要涉及如下 3個(gè)步驟。
思考(Thought):涉及對(duì)下一個(gè)行動(dòng)進(jìn)行推理尘奏。在這一步驟中需要評(píng)估當(dāng)前情況并考慮可能的行動(dòng)方案滩褥。
行動(dòng)(Action):基于思考的結(jié)果,決定采取什么行動(dòng)炫加。這一步驟是行動(dòng)計(jì)劃的選擇過程瑰煎。
觀察(Observation):執(zhí)行行動(dòng)后铺然,需要觀察并收集反饋。這一步驟將對(duì)行動(dòng)結(jié)果進(jìn)行評(píng)估酒甸。它可能影響或改變下一輪次思考的方向魄健。
Reflexion:這是一個(gè)使 Agent 具備動(dòng)態(tài)記憶和自我反思能力的框架。它通過幫助 Agent 回顧過去的行動(dòng)來提高推理能力插勤。
CoH(Chain of Hindsight ):這個(gè)方法通過向大模型展示一系列帶有反饋的過去輸出來鼓勵(lì)大模型改進(jìn)自己的輸出沽瘦。

3、調(diào)用工具

研究人員提出了一些策略來提升 Agent調(diào)用工具的能力饮六。工具封裝通過封裝將工具的復(fù)雜性隱藏起來其垄,為Agent提供簡(jiǎn)單、統(tǒng)一的接口卤橄,降低 Ageni工具調(diào)用的難度绿满。利用機(jī)器學(xué)習(xí)和其他自適應(yīng)技術(shù),Agent能夠?qū)W習(xí)如何更有效地使用工具窟扑。通過不斷實(shí)踐和反饋喇颁,Agent 可以提升對(duì)工具的理解和操作能力。通過開發(fā)上下文感知的決策算法嚎货,Agent能夠根據(jù)當(dāng)前的任務(wù)和環(huán)境條件選擇最合適的工具橘霎。這包括分析任務(wù)的需求、評(píng)估可用工具的性能殖属,以及預(yù)測(cè)工具使用的潛在結(jié)果姐叁。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市洗显,隨后出現(xiàn)的幾起案子外潜,更是在濱河造成了極大的恐慌,老刑警劉巖挠唆,帶你破解...
    沈念sama閱讀 216,372評(píng)論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件处窥,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡玄组,警方通過查閱死者的電腦和手機(jī)滔驾,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來俄讹,“玉大人哆致,你說我怎么就攤上這事』继牛” “怎么了沽瞭?”我有些...
    開封第一講書人閱讀 162,415評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我驹溃,道長(zhǎng)城丧,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評(píng)論 1 292
  • 正文 為了忘掉前任豌鹤,我火速辦了婚禮亡哄,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘布疙。我一直安慰自己蚊惯,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評(píng)論 6 388
  • 文/花漫 我一把揭開白布灵临。 她就那樣靜靜地躺著截型,像睡著了一般。 火紅的嫁衣襯著肌膚如雪儒溉。 梳的紋絲不亂的頭發(fā)上宦焦,一...
    開封第一講書人閱讀 51,125評(píng)論 1 297
  • 那天,我揣著相機(jī)與錄音顿涣,去河邊找鬼波闹。 笑死,一個(gè)胖子當(dāng)著我的面吹牛涛碑,可吹牛的內(nèi)容都是我干的精堕。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評(píng)論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼蒲障,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼歹篓!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起揉阎,我...
    開封第一講書人閱讀 38,887評(píng)論 0 274
  • 序言:老撾萬榮一對(duì)情侶失蹤庄撮,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后余黎,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體重窟,經(jīng)...
    沈念sama閱讀 45,310評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡载萌,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評(píng)論 2 332
  • 正文 我和宋清朗相戀三年惧财,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扭仁。...
    茶點(diǎn)故事閱讀 39,690評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡垮衷,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出乖坠,到底是詐尸還是另有隱情搀突,我是刑警寧澤,帶...
    沈念sama閱讀 35,411評(píng)論 5 343
  • 正文 年R本政府宣布熊泵,位于F島的核電站仰迁,受9級(jí)特大地震影響甸昏,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜徐许,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評(píng)論 3 325
  • 文/蒙蒙 一施蜜、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧雌隅,春花似錦翻默、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至检盼,卻和暖如春肯污,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背梯皿。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評(píng)論 1 268
  • 我被黑心中介騙來泰國(guó)打工仇箱, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人东羹。 一個(gè)月前我還...
    沈念sama閱讀 47,693評(píng)論 2 368
  • 正文 我出身青樓剂桥,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親属提。 傳聞我的和親對(duì)象是個(gè)殘疾皇子权逗,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評(píng)論 2 353

推薦閱讀更多精彩內(nèi)容