經(jīng)過最近一段時(shí)間的查閱資料,我明白了視覺處理的大致過程被去。視網(wǎng)膜上有兩種視覺感受細(xì)胞主儡,一種是視錐細(xì)胞,對彩色光比較敏感惨缆,另一種是視桿細(xì)胞糜值,對較暗的光線比較敏感,夜晚就大部分是視桿細(xì)胞在發(fā)揮功能坯墨。工作機(jī)理是:視錐細(xì)胞里有一種視紫紅質(zhì)(一種結(jié)合蛋白)寂汇,遇到光會發(fā)生反應(yīng),分解成Va捣染,Va在暗處又會結(jié)合成視紫紅質(zhì)骄瓣。化學(xué)反應(yīng)的發(fā)生導(dǎo)致了神經(jīng)沖動(本質(zhì)是電位變化)耍攘,刺激也就傳到了大腦的視覺皮層榕栏。所以這是一種被動的處理過程。同時(shí)也表明眼睛真的只是一個(gè)器官蕾各,只負(fù)責(zé)傳輸圖像刺激扒磁,真正使視覺產(chǎn)生的是視覺神經(jīng)系統(tǒng)的視覺加工作用!
那么視覺加工到底做了哪些事情呢式曲?按道理來說妨托,眼睛只傳遞了一張類似于全是象素點(diǎn)的二維圖片,但是大腦最后卻能感受到顏色吝羞,形狀兰伤,深度,立體感等等脆贵。這期間到底發(fā)生了什么医清?很多資料上表明:視覺加工是分區(qū)分層次的,也就是不同的部門處理不同的信息卖氨,越后面的層次分析出越抽象的信息会烙,同時(shí)各部門又相互聯(lián)系负懦,相互傳送信息。類似于:部門a分析顏色柏腻,部門b分析形狀纸厉,部門c分析層次感,然后部門d連接在c的后面接受c的結(jié)果分析立體感五嫂,然后更深層次的部門開始工作颗品,最后得出整個(gè)視覺情況。這個(gè)過程合情合理沃缘,但是還是過于抽象躯枢,怎么分析層次感?層次感怎么表示都是個(gè)問題槐臀。
不過這里我有一個(gè)大膽的設(shè)想:或許象素點(diǎn)并沒有意義锄蹂,有意義的是一個(gè)整體,也就是說水慨,大腦不能分析單個(gè)的象素點(diǎn)得糜,而只能處理完整的整體。就像一個(gè)人很難看清一個(gè)文字里的細(xì)節(jié)一樣晰洒,只有形成一個(gè)形狀以后朝抖,大腦才會產(chǎn)生反應(yīng)。大腦也只對整體產(chǎn)生反應(yīng)谍珊。這說明視覺加工把單個(gè)的視覺信息整合起來了治宣,只有形成某個(gè)形狀以后才通知大腦,如果大腦只識別幾個(gè)整體之間的相互關(guān)系抬驴,那么分析層次感(也就是前后左右的位置關(guān)系)就容易很多炼七。這也能說明為什么有的人能看到一個(gè)東西的更多細(xì)節(jié)了,很有可能是在象素點(diǎn)那個(gè)層次部分細(xì)胞就告訴了大腦情況布持,使得大腦處理了一些細(xì)節(jié)情況豌拙,也看到了這個(gè)整體的部分構(gòu)成成分,所以相比其他只能看到整體形態(tài)的人記得也更清楚题暖,因?yàn)橛浀眉?xì)節(jié)更多按傅,印象更深。
而且在我看來胧卤,這種視覺整合的能力用數(shù)學(xué)公式來表示并不合適唯绍。雖然數(shù)學(xué)公式可以完成特定的形狀分析弓叛,但是太過復(fù)雜和不全面绩郎。在細(xì)胞這個(gè)層次是不可能會計(jì)算與思考的松忍,細(xì)胞只有本能和被動反應(yīng)猪勇。也就是說還有更簡單的辦法來實(shí)現(xiàn)識別形狀的功能。而且肯定是被動的垫毙,接受到某種刺激蜜葱,然后連接某條神經(jīng)元寺庄,一直連接下去,就形成了對某種形狀的唯一表示压汪,也就是這條神經(jīng)元通道代表了識別形狀的過程粪牲,最終的結(jié)果就是形狀的認(rèn)知和保存。通道的神經(jīng)元數(shù)目與層次決定了可識別形狀的數(shù)目止剖,很明顯和二進(jìn)制位一樣腺阳,32位可以表示2^32種,而且還不是二進(jìn)制的,可能是8層穿香,16亭引,100都可以,每一層都可以有n條扔水。同時(shí)也可以解釋分類功能和對形狀的迅速反應(yīng)痛侍。分類功能是因?yàn)閹讉€(gè)相似的形狀前面的神經(jīng)元通路是一樣的,只是后面產(chǎn)生了不同魔市,所以只要想前面的,后面的全部列出來就可以赵哲。很明顯我們可以從分類當(dāng)中得出前面的神經(jīng)元是根據(jù)什么連接的待德,為什么這些相似的東西前面的神經(jīng)元通路是一樣的!枫夺,視覺加工時(shí)先提取了這些相似形狀的哪些特征(被動先對哪些些特征產(chǎn)生了反應(yīng))将宪。迅速反應(yīng)則是前面可能分叉多,但后面就只有一條直路橡庞,所以就直接迅速地識別了出來较坛。
建立這種被動連接(進(jìn)化,進(jìn)化出識別與記憶)人類花了幾千萬年扒最,這其中肯定有許多的奧妙和特殊的功能丑勤,但是這些我們不需要關(guān)心,要關(guān)心的只是大致的一種識別吧趣,記憶與學(xué)習(xí)能力法竞,畢竟這是一種新的生命體,完全沒必要和人類一模一樣强挫,生命源也本就不一樣岔霸。一個(gè)是生物能,一個(gè)是電能俯渤。主要的還是類人呆细,像人就行。各有優(yōu)劣八匠。
貌似神經(jīng)網(wǎng)絡(luò)從名字上講述的就是這個(gè)東西絮爷,還有深度學(xué)習(xí)趴酣。
總結(jié)下來就是,視覺加工就是把細(xì)節(jié)上的一個(gè)個(gè)象素點(diǎn)整合成一個(gè)整體略水,然后才通知大腦价卤。而我要完成的就是這個(gè)視覺加工功能了,也叫形狀識別渊涝,用一種最簡單的方法慎璧,被動連接的方法。把一張圖片上的各個(gè)象素點(diǎn)分析組合成一個(gè)個(gè)的整體跨释,分析的過程是一個(gè)連接的過程胸私,最后連接出的結(jié)果就是所要識別的整體了,這個(gè)識別過程中的神經(jīng)元通路要記住鳖谈,結(jié)果也要記住岁疼。就像識別一個(gè)“張”字一樣,識別過程中很自然地走"張"的神經(jīng)元通路缆娃,最后認(rèn)出“張”捷绒;如果你不認(rèn)識張,識別時(shí)就會構(gòu)造這條神經(jīng)元通路贯要,但這個(gè)時(shí)候你只認(rèn)識“張”的這個(gè)形狀暖侨,下次看到你能認(rèn)出這同一個(gè)形狀,也能自然地寫這個(gè)形狀崇渗,但還不認(rèn)識這個(gè)字讀什么字逗,因?yàn)闆]人告訴你他在聲音上怎么讀,直到有一天宅广,有人告訴你“張”讀“zhang”葫掉,于是你不僅會寫“張”了,還會讀了跟狱,別人說出來的時(shí)候俭厚,你也能寫出來了。因?yàn)槁犛X和視覺上最終的處理結(jié)果都是大腦里同一個(gè)保存的“張”字(編碼)兽肤。
我相信套腹,視覺加工功能完成的時(shí)候,人類如何識別资铡,如何學(xué)習(xí)电禀,如何記憶的奧秘也就迎刃而解了,后面也就是意識是如何出現(xiàn)的問題了笤休。