大模型智能體(Agent)入門學(xué)習(xí)

智能體是什么

????????智能體是指基于大語(yǔ)言模型（LLMs）構(gòu)建的智能體摹察，具有強(qiáng)大的語(yǔ)言理解和處理能力捌朴，可以自動(dòng)化地完成各種復(fù)雜的任務(wù)。大模型智能體的構(gòu)建需要使用大量的數(shù)據(jù)和計(jì)算資源桥帆，并進(jìn)行精細(xì)的模型訓(xùn)練和優(yōu)化赖淤，以實(shí)現(xiàn)高性能的智能體蜀漆，展現(xiàn)出類似人類的歸納和思考能力。

智能體的應(yīng)用場(chǎng)景

大模型智能體在多個(gè)領(lǐng)域有廣泛的應(yīng)用：

自然語(yǔ)言處理：處理文本分類漫蛔、情感分析嗜愈、命名實(shí)體識(shí)別等功能。
問(wèn)答系統(tǒng)：自動(dòng)回答用戶問(wèn)題莽龟，提供準(zhǔn)確的信息和服務(wù)蠕嫁。
文本生成：生成新聞報(bào)道、小說(shuō)毯盈、廣告語(yǔ)等剃毒。
語(yǔ)音識(shí)別和生成：實(shí)現(xiàn)語(yǔ)音轉(zhuǎn)文字、文字轉(zhuǎn)語(yǔ)音等功能搂赋。
機(jī)器翻譯：將一種語(yǔ)言的文本翻譯成另一種語(yǔ)言赘阀。

智能體的組成

智能體.png

智能體四個(gè)組成部分：大模型+工具+記憶+規(guī)劃

規(guī)劃(Planning)

把大型任務(wù)分解為子任務(wù)，以便高效的處理復(fù)雜任務(wù)脑奠，并規(guī)劃執(zhí)行任務(wù)的流程基公；
對(duì)任務(wù)執(zhí)行的過(guò)程進(jìn)行思考和反思，從而決定是繼續(xù)執(zhí)行任務(wù)宋欺，或判斷任務(wù)完結(jié)并終止運(yùn)行轰豆。

規(guī)劃，可以理解為觀察和思考齿诞。如果用人類來(lái)類比酸休，當(dāng)我們接到一個(gè)任務(wù)，我們的思維模式可能會(huì)像下面這樣:

我們首先會(huì)思考怎么完成這個(gè)任務(wù)祷杈。
然后我們會(huì)審視手頭上所擁有的工具斑司，以及如何使用這些工具高效地達(dá)成目的。
我們會(huì)把任務(wù)拆分成子任務(wù)但汞。
在執(zhí)行任務(wù)的時(shí)候宿刮，我們會(huì)對(duì)執(zhí)行過(guò)程進(jìn)行反思和完善互站，吸取教訓(xùn)以完善未來(lái)的步驟
執(zhí)行過(guò)程中思考任務(wù)何時(shí)可以終止

這是人類的規(guī)劃能力，我們希望智能體也擁有這樣的思維模式糙置，因此可以通過(guò) LLM 提示工程云茸，為智能體賦予這樣的思維模式。在智能體中谤饭，最重要的是讓 LLM 具備這以下能力：

子任務(wù)分解(Subgoal decomposition)

通過(guò) LLM 使得智能體可以把大型任務(wù)分解為更小的标捺、更可控的子任務(wù)，從而能夠有效完成復(fù)雜的任務(wù)揉抵。

思維鏈（Chain of Thoughts, CoT）

思維鏈已經(jīng)是一種比較標(biāo)準(zhǔn)的提示技術(shù)亡容，能顯著提升 LLM 完成復(fù)雜任務(wù)的效果。當(dāng)我們對(duì) LLM 這樣要求「think step by step」冤今，會(huì)發(fā)現(xiàn) LLM 會(huì)把問(wèn)題分解成多個(gè)步驟闺兢，一步一步思考和解決，能使得輸出的結(jié)果更加準(zhǔn)確戏罢。這是一種線性的思維方式屋谭。

思維鏈的 prompt 可以像是如下這樣（這里只是一個(gè)極簡(jiǎn)的 prompt，實(shí)際會(huì)按需進(jìn)行 prompt 調(diào)優(yōu)）：

template="Answer the question: Q: {question}? Let's think step by step:"

反思和完善(self-critics)

智能體在執(zhí)行任務(wù)過(guò)程中龟糕，通過(guò) LLM 對(duì)完成的子任務(wù)進(jìn)行反思桐磁，從錯(cuò)誤中吸取教訓(xùn)，并完善未來(lái)的步驟讲岁，提高任務(wù)完成的質(zhì)量我擂。同時(shí)反思任務(wù)是否已經(jīng)完成，并終止任務(wù)缓艳。這種反思和完善可以幫助 Agent 提高自身的智能和適應(yīng)性校摩。

Reflection

通過(guò)結(jié)合推理（Reasoning）和行動(dòng)（Acting）來(lái)增強(qiáng)推理和決策的效果

推理(Reasoning)： LLM 基于已有的知識(shí)或行動(dòng)(Acting)后獲取的知識(shí)，推導(dǎo)出結(jié)論的過(guò)程阶淘。
行動(dòng)(Acting)： LLM 根據(jù)實(shí)際情況衙吩，使用工具獲取知識(shí)，或完成子任務(wù)得到階段性的信息溪窒。

為什么結(jié)合推理和行動(dòng)坤塞？

僅推理(Reasoning Only)：LLM 僅僅基于已有的知識(shí)進(jìn)行推理，生成答案來(lái)回答這個(gè)問(wèn)題霉猛。很顯然，如果 LLM 本身不具備這些知識(shí)珠闰，可能會(huì)出現(xiàn)幻覺(jué)惜浅，胡亂回答一通。
僅行動(dòng)(Acting Only)：大模型不加以推理伏嗜，僅使用工具（比如搜索引擎）搜索這個(gè)問(wèn)題坛悉，得出來(lái)的將會(huì)是海量的資料伐厌，不能直接回答這個(gè)問(wèn)題。
推理+行動(dòng)(Reasoning and Acting)：LLM 首先會(huì)基于已有的知識(shí)裸影，并審視擁有的工具挣轨。當(dāng)發(fā)現(xiàn)已有的知識(shí)不足以回答這個(gè)問(wèn)題，則會(huì)調(diào)用工具轩猩，比如：搜索工具卷扮、生成報(bào)告等，然后得到新的信息均践，基于新的信息重復(fù)進(jìn)行推理和行動(dòng)晤锹，直到完成這個(gè)任務(wù)。

Reasoning+Acting 的 prompt 模版的大致思路為:

Thought（思考）: ...
Action（行動(dòng)）: ...
Observation（觀察）: ...

Thought（思考）: ...
Action（行動(dòng)）: ...
Observation（觀察）: ...

...(Repeated many times（重復(fù)多次）)
Final Answer: ...

使用LangChain實(shí)現(xiàn)零樣本智能體彤委，零樣本智能體是指在不給大模型任何樣本提示信息的情況鞭铆，由大模型去實(shí)現(xiàn)工具調(diào)用來(lái)得到問(wèn)題的答案，代碼實(shí)現(xiàn)如下：

from langchain.agents import tool
from langchain.agents import initialize_agent
from langchain.agents import AgentType
from langchain.llms import OpenAI
from datetime import date

llm = OpenAI(
    api_key="sk-esjT0arInWjjUXbfCcF228498d99433...........",
    base_url="https://api.aigc369.com/v1"
)

@tool
def time() -> str:
 """
  Return the date of Today
  """
 return str(date.today())

agent = initialize_agent([time], llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)

agent.run("今天是什么日期")

智能體執(zhí)行過(guò)程如下：

> Entering new AgentExecutor chain...
 I should use the tool "time" to find the date
Action: time
Action Input: Today
Observation: 2024-11-06
Thought: I now know the final answer
Final Answer: Today's date is November 6th, 2024.

> Finished chain.

記憶(Memory)

短期記憶是指在執(zhí)行任務(wù)的過(guò)程中的上下文焦影，會(huì)在子任務(wù)的執(zhí)行過(guò)程產(chǎn)生和暫存车遂，在任務(wù)完結(jié)后被清空，短期記憶受到有限上下文窗口長(zhǎng)度的限制斯辰，不同的模型的上下文窗口限制不同舶担。
長(zhǎng)期記憶是長(zhǎng)時(shí)間保留的信息，一般是指外部知識(shí)庫(kù)椒涯，通常用向量數(shù)據(jù)庫(kù)來(lái)存儲(chǔ)和檢索柄沮，向量數(shù)據(jù)庫(kù)通過(guò)將數(shù)據(jù)轉(zhuǎn)化為向量存儲(chǔ)。

工具(Tool)

LLM 是數(shù)字世界中的程序废岂，想要與現(xiàn)實(shí)世界互動(dòng)祖搓、獲取未知的知識(shí)，或是計(jì)算某個(gè)復(fù)雜的公式等湖苞，都離不開(kāi)工具拯欧。有了這些工具 API，智能體就可以與物理世界交互财骨，解決實(shí)際的問(wèn)題镐作。因此需要為智能體配備各種工具以及賦予它使用工具的能力。

Function Calling 是一種實(shí)現(xiàn)大型語(yǔ)言模型連接外部工具的機(jī)制隆箩。通過(guò) API 調(diào)用 LLM 時(shí)该贾，調(diào)用方可以提供一系列描述函數(shù)(包括函數(shù)的功能描述、請(qǐng)求參數(shù)說(shuō)明捌臊、響應(yīng)參數(shù)說(shuō)明)杨蛋，讓 LLM 根據(jù)用戶的輸入，合適地選擇調(diào)用哪個(gè)函數(shù)，同時(shí)理解用戶的自然語(yǔ)言逞力，并轉(zhuǎn)換為調(diào)用函數(shù)的請(qǐng)求參數(shù)(通過(guò) JSON 格式返回)曙寡。調(diào)用方使用 LLM 返回的函數(shù)名稱和參數(shù)，調(diào)用本地函數(shù)并得到響應(yīng)寇荧。最后举庶，如果有進(jìn)一步需求，把本地函數(shù)的響應(yīng)傳給 LLM揩抡，讓 LLM 組織成自然語(yǔ)言再給出最終答案户侥。
function calling 具體工作流程如下圖所示：

function calling.png

詳細(xì)介紹可以參考文章大模型 Function Call介紹
本文是對(duì)大模型Agent入門級(jí)學(xué)習(xí)，參考了以下文章：
https://cloud.tencent.com/developer/article/2422923捅膘，后續(xù)有新的收獲再進(jìn)行更新添祸。。寻仗。

最后編輯于：2024.11.13 13:45:39

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末刃泌，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子署尤，更是在濱河造成了極大的恐慌耙替，老刑警劉巖，帶你破解...
沈念sama閱讀 217,277評(píng)論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件曹体，死亡現(xiàn)場(chǎng)離奇詭異俗扇，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)箕别，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,689評(píng)論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門铜幽，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人串稀，你說(shuō)我怎么就攤上這事除抛。” “怎么了母截？”我有些...
開(kāi)封第一講書(shū)人閱讀 163,624評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵到忽，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我清寇，道長(zhǎng)喘漏，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,356評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任华烟，我火速辦了婚禮翩迈，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘盔夜。我一直安慰自己负饲，他們只是感情好搅方，可當(dāng)我...
茶點(diǎn)故事閱讀 67,402評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著绽族，像睡著了一般。火紅的嫁衣襯著肌膚如雪衩藤。梳的紋絲不亂的頭發(fā)上吧慢，一...
開(kāi)封第一講書(shū)人閱讀 51,292評(píng)論 1贊 301
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音赏表，去河邊找鬼检诗。笑死，一個(gè)胖子當(dāng)著我的面吹牛瓢剿，可吹牛的內(nèi)容都是我干的逢慌。我是一名探鬼主播，決...
沈念sama閱讀 40,135評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼间狂，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼攻泼！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起鉴象，我...
開(kāi)封第一講書(shū)人閱讀 38,992評(píng)論 0贊 275
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤忙菠，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后纺弊，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體牛欢，經(jīng)...
沈念sama閱讀 45,429評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,636評(píng)論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年淆游，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了傍睹。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,785評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡犹菱，死狀恐怖拾稳，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情已亥，我是刑警寧澤熊赖，帶...
沈念sama閱讀 35,492評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站虑椎，受9級(jí)特大地震影響震鹉，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜捆姜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,092評(píng)論 3贊 328
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一传趾、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧泥技，春花似錦浆兰、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,723評(píng)論 0贊 22
一樁弒父案簸呈，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)榕订。三九已至，卻和暖如春蜕便，著一層夾襖步出監(jiān)牢的瞬間劫恒，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,858評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工轿腺，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留两嘴，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,891評(píng)論 2贊 370
代替公主和親
正文我出身青樓族壳，卻偏偏與公主長(zhǎng)得像憔辫，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子仿荆，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,713評(píng)論 2贊 354

大模型 智能體(Agent)入門學(xué)習(xí)