智能體與環(huán)境
什么是智能體镀虐?
智能體可以被視為通過傳感器感知所處的環(huán)境并通過執(zhí)行器對該環(huán)境產(chǎn)生作用的東西祟蚀。
假設(shè)現(xiàn)在每個智能體都能知覺自己的行動洒敏,但不一定能夠感知行動的效果樊卓。并且用感知信息來表示任何給定時刻智能體的感知輸入。智能體的感知序列是該智能體所收到的所有數(shù)據(jù)完整的歷史短蜕。
智能體函數(shù)和智能體程序的區(qū)別氢架?
智能體函數(shù)是通過智能體程序?qū)崿F(xiàn)的。智能體函數(shù)是一個抽象的數(shù)學(xué)表示朋魔。智能體程序是一個具體的表現(xiàn)岖研。智能體的概念只是我們用來分析系統(tǒng)的一個工具。而不是用來把整個世界劃分為智能體和非智能體的絕對特性警检。
智能體應(yīng)有的幾個概念
1:好的行為表現(xiàn):理性的概念
具體案例:真空吸塵器案例
理性的智能體是做事正確的智能體
性能度量“你所要求孙援,即你所得”。性能度量是智能體成功標(biāo)準(zhǔn)的具體化扇雕,作為一般的規(guī)則拓售,最好根據(jù)實(shí)際在這個環(huán)境中希望得到的結(jié)果來設(shè)定性能度量。而不是根據(jù)智能體應(yīng)當(dāng)表現(xiàn)的行為镶奉。
2:理性
理性智能體的定義:
對每個可能得序列础淤,根據(jù)已知的感知序列提供的證據(jù)和智能體內(nèi)建的先驗(yàn)知識。理性智能體應(yīng)該選擇期望使其性能度量化最大的行動腮鞍。
任何指定的時刻。什么是理性的判斷莹菱?
1:定義成功標(biāo)準(zhǔn)的性能度量移国。2:智能體對環(huán)境的先驗(yàn)認(rèn)識。3:智能體可以執(zhí)行的行動道伟。
4:智能體到未知的感知序列迹缀。
全知使碾,學(xué)習(xí)和自主性
理性和全知的概念:
一個全知的智能體知道它的行動產(chǎn)生的實(shí)際結(jié)果并且做出相應(yīng)的動作。但一個全知者在實(shí)際情況中是不現(xiàn)實(shí)不可能的祝懂。理性不等于完美票摇。理性是使期望的最大化。而完美是使實(shí)際性能的最大化砚蓬,所以完美是對一個智能體不合理的要求矢门。因?yàn)槔硇缘倪x擇取決于當(dāng)時的感知序列。
所以理性智能體在行動前應(yīng)當(dāng)觀察行動灰蛙。因?yàn)橛^察有助于最大化期望性能祟剔。為了修改未來的感知信息而采取行動的那個過程稱為信息收集。這也是理性的重要的一部分摩梧。
對于理性物延,不僅是需要智能體收集信息,而且需要智能體盡可能的從他感知的東西中進(jìn)行學(xué)習(xí)仅父。智能體最初的設(shè)定可以反映了環(huán)境的一些先驗(yàn)知識叛薯,但是隨著智能體獲得經(jīng)驗(yàn)。這些知識會被改變或者增加笙纤。有一些極端的情況中環(huán)境就會被完全當(dāng)成先驗(yàn)知識耗溜。在這樣的情況下,智能體不再需要感知和學(xué)習(xí)粪糙,他只需要正確的感知即可强霎。
一般來說成功的智能體會把智能體函數(shù)的計算任務(wù)分成三個不同的時期:
1:設(shè)計智能體的時候,設(shè)計者會完成一些計算
2:思考下一步的時候蓉冈,智能體會做更多地計算城舞。
3:當(dāng)他從經(jīng)驗(yàn)中進(jìn)行學(xué)習(xí)的時候他要進(jìn)行更多地計算來決定如何修改自己的行為。
現(xiàn)階段拓展一個智能體依賴于設(shè)計者的先驗(yàn)知識而不是它自身的感知能力寞酿。我們就說該智能體缺乏自主性家夺。理性智能體應(yīng)該是自主的。他應(yīng)該能夠盡可能的學(xué)習(xí)伐弹,以此來彌補(bǔ)不全面或者不正確的先驗(yàn)知識拉馋。當(dāng)?shù)玫疥P(guān)于經(jīng)驗(yàn)的環(huán)境的充分地經(jīng)驗(yàn)后。理性智能體的行動才會有效果的獨(dú)立于他的先驗(yàn)知識惨好,從而與學(xué)習(xí)相結(jié)合后使得設(shè)計一種在很多不同環(huán)境下都能成功的理性智能體成為可能煌茴。
智能體所處環(huán)境:
首先要考慮任務(wù)環(huán)境,這是理性智能體要解決的基本問題日川。而任務(wù)環(huán)境的風(fēng)味會直接影響到智能體程序的適當(dāng)設(shè)計蔓腐。
現(xiàn)在詳細(xì)說一下任務(wù)環(huán)境。典型的案例是自動駕駛出租車案例龄句。首先設(shè)計智能體時回论,第一部一定要詳細(xì)說明任務(wù)環(huán)境散罕,而且要盡可能的全面。對于智能體感知環(huán)境首先需要PEAS(性能傀蓉,環(huán)境欧漱,執(zhí)行器,傳感器)葬燎。對于任務(wù)環(huán)境的屬性误甚,如果一個智能體的傳感器在每個時間點(diǎn)上都可以訪問到獲取到所處環(huán)境的完整狀態(tài),那么我們就可以說這個環(huán)境是完全可觀察的萨蚕,如果智能體的傳感器能檢測能夠所有與行動選擇相關(guān)的方面靶草,那么這個就可以歸類于有效可觀察門類。并且相關(guān)性取決于性能度量岳遥。
對于確認(rèn)性和隨機(jī)性奕翔,如果一個環(huán)境的下一個狀態(tài)完全決定于當(dāng)前的狀態(tài)和智能體的動作。那么我們可以說該環(huán)境是確定性的浩蓉。否則可以說是隨機(jī)的派继,原則上智能體是完全可以觀察的,確認(rèn)的環(huán)境捻艳。但是在一些環(huán)境中無需考慮非確定性驾窟,不過如果該環(huán)境部分是可以觀察的,那么他可能表現(xiàn)是隨機(jī)的认轨。如果環(huán)境是確定性的绅络,除非有其他的智能體的影響。那么我們稱該環(huán)境是策略的嘁字。
對于片段式和延續(xù)式的問題恩急,在片段式的任務(wù)環(huán)境中,智能體的經(jīng)驗(yàn)被分成一個個的原子片段纪蜒,每個片段的組成包含了智能體所感知的信息以及進(jìn)一步執(zhí)行的單個行動衷恭。最為重要的是下一個片段,不依賴于以前的片段中采取的行動纯续。在片段或者環(huán)境中随珠,行動的選擇只取決于當(dāng)前的片段的自身。大多數(shù)分類任務(wù)屬于片段式的或者任務(wù)環(huán)境要比延續(xù)性的任務(wù)簡單的要很多猬错。因?yàn)橹悄荏w有些時候不需要前瞻窗看。
對于靜態(tài)或者動態(tài),如果環(huán)境在智能體思考時發(fā)生變化倦炒,那么我們稱該環(huán)境是動態(tài)的显沈,否則是該環(huán)境是靜態(tài)的。如果該環(huán)境本身不隨時間的流逝發(fā)生的變化而變化析校。但智能體的本身性能評價隨時間的變化而變化构罗,我們就稱其為半動態(tài)的。
對于離散和連續(xù)智玻,離散的區(qū)別可以應(yīng)用于環(huán)境的狀態(tài)遂唧,時間的處理方式,以及智能體的感知信息的行動和能力吊奢。但是對于單智能體與多智能體的方面盖彭,在多智能作為理性的設(shè)計與單智能體的環(huán)境設(shè)計相比相差很遠(yuǎn)。比如像是通訊作為理性的行動出現(xiàn)在多智能體的環(huán)境中页滚,在一部分可觀察的環(huán)境中召边,隨機(jī)是理性的,因?yàn)樗梢员苊忸A(yù)測之中的缺陷裹驰。
未完待續(xù)
參考文獻(xiàn)
[1]Nils J Nilsson.人工智能[M].機(jī)械工業(yè)出版社,2000.8.
[2][4]M Wooldridge, R Jennings.Methodology for A-gent-oriented Analysis and Design [J]In AAAI-9987-98.
[3]趙龍文,侯義文斌.智能軟件:由面向?qū)ο蟮矫嫦駻.gent[J].計算機(jī)工程與應(yīng)用,2001(8):41-42.
[5][6][11]周昌樂.無心的機(jī)器[M].湖南科學(xué)技術(shù)出版社,1999.20,25,216.
[7][13]克勞斯.邁因策爾.復(fù)雜性中的思維—物質(zhì),精神和人類的復(fù)雜動力學(xué)[M].中央編譯出版社,1999.114-121.
[8][9]程毅,等.軟件Agent是一個計算實(shí)體[J].計算機(jī)工程與設(shè)計,2001(1):41-43
[10][20]漢肯.控制論與社會—關(guān)于社會系統(tǒng)的分析[M].商務(wù)印書館,1984.136,157.
[12][14][21]黃小兵,唐文勝.基于Agent系統(tǒng)的概念.方法和應(yīng)用[J].計算機(jī)與現(xiàn)代化,2000(4):6-11.
[15][16]張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海三聯(lián)書店,上海人民出版社,1996.4.
[17][18][19]余永定,等.西方經(jīng)濟(jì)學(xué)[M].經(jīng)濟(jì)科學(xué)出版社,1999.162-185,705.
The Frontier of AI____The Deveiopment of Agent Theory and Its Philosophy
XIANG Hou-jun ZHOU Chang-le
(Zhejiang University1.Humansm School2.Information School Hangzhou 310028,China)
Abstract:Adopting philosophical,social and economic viewpoints,the thesis analyzes and discusses the philosophy of Agent theory, the front research field of computer and AI,thereby confirming the value of adopting a systematic viewpoint in Agent re-search,espcially that of the introduction of social intelligence to bread the limits of individual intelligence,and confirming the im-provement of epistemology and methodouction of social intelligence to break the limits of individual intelligence, and confirming the im-provement of epistemology and methodology in the research. The thesis also studies such exploratory issues as the game,utility,rea-son,norm and common knowledge intelligence;interaction;reason