《控制論與科學(xué)方法論》第一章
? ? ? ? 控制論旨在通過(guò)一些控制手段使得事物朝著目標(biāo)的方向發(fā)展。控制的手段有很多,作者簡(jiǎn)單介紹了最常見(jiàn)的幾種。
隨機(jī)控制
? ? ? ? 當(dāng)人們對(duì)于某一個(gè)事物的了解處于最開(kāi)始的懵懂無(wú)知狀態(tài)時(shí)泪漂,隨機(jī)控制往往是最先用到的手段。一個(gè)典型的例子就是神農(nóng)嘗百草歪泳。原始人類(lèi)對(duì)于各種植物的治療功效一無(wú)所知萝勤,所以只能通過(guò)隨機(jī)嘗試的手段加以檢驗(yàn)。我還想到一個(gè)案例呐伞。電影里經(jīng)常見(jiàn)到的一個(gè)場(chǎng)景是炸彈即將爆照敌卓,主人公還沒(méi)有找到拆除的辦法,然后就隨機(jī)地剪斷某一個(gè)導(dǎo)線伶氢。隨機(jī)控制的壞處是不可控趟径,當(dāng)可能性空間非常大時(shí),工作量就會(huì)變得非常巨大癣防,尤其是如果需要人工執(zhí)行的話蜗巧。不過(guò),現(xiàn)代社會(huì)隨著高速計(jì)算機(jī)的出現(xiàn)蕾盯,隨機(jī)控制又展現(xiàn)出了巨大的應(yīng)用價(jià)值幕屹。比如,現(xiàn)在非臣对猓火的機(jī)器學(xué)習(xí)算法望拖,就是通過(guò)極大量的隨機(jī)抽樣數(shù)據(jù),訓(xùn)練機(jī)器識(shí)別目標(biāo)信息挫鸽。數(shù)據(jù)量越大说敏,隨機(jī)性越高,訓(xùn)練效果也隨之越好掠兄。還有20世紀(jì)末首次完成的人類(lèi)全基因組測(cè)序時(shí)所使用的鳥(niǎo)槍法像云,也屬此類(lèi)锌雀。
有記憶的控制
? ? ? ? 這是指當(dāng)選擇一種情況之后蚂夕,就不再重復(fù)選擇相同的情況迅诬。我想到了中學(xué)數(shù)學(xué)課上做的關(guān)于排列組合的題目:從一堆球中不放回地抽出2個(gè)黑球和2個(gè)白球的概率。人類(lèi)的記憶也屬于此類(lèi)婿牍。還是拿做數(shù)學(xué)題舉例侈贷,在解幾何體時(shí),經(jīng)常需要畫(huà)輔助線進(jìn)行求解等脂。當(dāng)嘗試過(guò)一種方法無(wú)效時(shí)俏蛮,我們就會(huì)換一種新的方法,而不會(huì)又繞回之前的不正確的解法上遥。這讓我聯(lián)想到了孔子講的“不二過(guò)”搏屑,顏回能夠做到絕不重復(fù)之前犯過(guò)的錯(cuò)誤,對(duì)于一個(gè)人成長(zhǎng)而言粉楚,只怕沒(méi)有比這更快更有效的途徑了吧辣恋?
共軛控制
? ? ? ? 作者用曹沖稱(chēng)象的故事來(lái)作解釋。因?yàn)闆](méi)有辦法直接稱(chēng)量大象的體重模软,所以曹沖想到通過(guò)將大象的體重轉(zhuǎn)換成具有相同重量的石塊伟骨,然后通過(guò)稱(chēng)量石塊的重量進(jìn)而推知大象的體重。在這個(gè)過(guò)程當(dāng)中燃异,首先需要將大象的重量轉(zhuǎn)換成同等重量的石塊携狭,該過(guò)程記為L(zhǎng),然后稱(chēng)量石塊重量回俐,該步驟記為A逛腿,最后將石塊的重量轉(zhuǎn)換成大象的體重,該步驟極為L(zhǎng)-1仅颇。整個(gè)步驟可以記為L(zhǎng)-1AL鳄逾。通常將L-1AL稱(chēng)作與A共軛的控制方法。此法的好處是將原來(lái)不可控的對(duì)象變成可控的A過(guò)程灵莲。這讓我想到了跨人際的調(diào)控雕凹。A想讓C做某事,但A和C沒(méi)有直接關(guān)系政冻,故而找到和C具有直接聯(lián)系的B枚抵,通過(guò)B實(shí)現(xiàn)間接控制C。公司里跨部門(mén)的人員調(diào)用屬于此類(lèi)明场。
負(fù)反饋控制
? ? ? ? 一個(gè)典型的例子是空中的雄鷹追捕快速奔跑的兔子汽摹。雄鷹向下俯沖之時(shí)吟策,眼睛緊緊地盯著兔子的跑動(dòng)蒜绽,隨時(shí)調(diào)整自己飛行的方向蹦玫,角度,姿勢(shì)泄私,逐步縮減和目標(biāo)之間的差距,直至最終與目標(biāo)重復(fù)恐似∧痉欤“目標(biāo)差”的減少是負(fù)反饋控制的核心。負(fù)反饋控制包含3個(gè)基本組分:感受器氏仗,控制系統(tǒng)吉捶,效應(yīng)器。感受器實(shí)時(shí)采集關(guān)于目標(biāo)的所有信息皆尔,傳入控制系統(tǒng)呐舔,控制系統(tǒng)及時(shí)調(diào)整效應(yīng)器,以實(shí)現(xiàn)逐步減小目標(biāo)差慷蠕。大腦就是一個(gè)高效的負(fù)反饋控制系統(tǒng)珊拼。眼睛看著碗里的菜,該視覺(jué)信息輸入大腦流炕,大腦再發(fā)出指令控制手中的筷子以精準(zhǔn)的夾住想吃的菜澎现。許多生態(tài)系統(tǒng)的動(dòng)態(tài)平衡也包含負(fù)反饋控制。應(yīng)用于個(gè)人浪感,應(yīng)該說(shuō)昔头,一切高效的學(xué)習(xí)過(guò)程都離不開(kāi)負(fù)反饋控制(在學(xué)習(xí)的早期,從錯(cuò)誤當(dāng)中學(xué)習(xí)扮演著更為重要的角色影兽,即學(xué)習(xí)的目標(biāo)是減少錯(cuò)誤)揭斧。反饋越及時(shí),越準(zhǔn)確峻堰,學(xué)習(xí)的方向越清晰讹开,越有針對(duì)性,犯錯(cuò)就會(huì)越少捐名,進(jìn)步的速度也就越快旦万。這是學(xué)習(xí)中每一章節(jié)練習(xí)題的價(jià)值所在,也是學(xué)習(xí)游泳時(shí)有教練在旁邊提供實(shí)時(shí)反饋的價(jià)值所在镶蹋。很多時(shí)候成艘,學(xué)習(xí)進(jìn)度停滯不前,往往都是因?yàn)槿狈皶r(shí)準(zhǔn)確的反饋信息贺归。善于學(xué)習(xí)之人淆两,應(yīng)當(dāng)在大腦中努力搜集所有有用的反饋信息,持續(xù)做出有針對(duì)性地改進(jìn)拂酣。另外秋冰,數(shù)學(xué)建模中減少估計(jì)誤差的做法也屬于負(fù)反饋控制。
正反饋控制
? ? ? ? 良性競(jìng)爭(zhēng)屬于此類(lèi)婶熬。兩個(gè)朋友在學(xué)習(xí)上你爭(zhēng)我趕剑勾,互相砥礪埃撵;兩個(gè)相互競(jìng)爭(zhēng)的企業(yè),相互較勁虽另,有可能刺激整個(gè)行業(yè)不斷創(chuàng)新暂刘,不斷進(jìn)步。比如可口可樂(lè)和百事可樂(lè)洲赵。機(jī)器學(xué)習(xí)中的加強(qiáng)學(xué)習(xí)(reinforcement learning)算法鸳惯,心理學(xué)中學(xué)習(xí)理論的正向增強(qiáng)子(positive reinforcer)效用商蕴,日常生活中通過(guò)鼓勵(lì)來(lái)促進(jìn)他人的做法叠萍,都屬于此類(lèi)。在《掌控習(xí)慣》或《福格行為模型》這兩本書(shū)里介紹的通過(guò)及時(shí)提供正反饋以養(yǎng)成習(xí)慣的做法也屬于正反饋控制绪商。此法既可以用于調(diào)控自己的行為苛谷,還可以用于(在商業(yè)中)操縱他人行為。