文章通過人類被試的實驗來檢驗rule和exemplar representation模型训措,在這之后作者對二者在分類學習上的結合進行了討論廊驼,并且提出一個新的學習模型(鏈接模型——ATRUIM模型)通過新模型的擬合與被試實驗進行比較來檢驗鏈接模型的適用性嫌拣。
Rules模型認為分類的規(guī)則一旦確定恢口,那么刺激的頻率是不會對被試的學習產(chǎn)生影響的聂渊;而exemplar模型則認為刺激呈現(xiàn)的頻率也會對被試的分類產(chǎn)生影響且高頻條件下的表現(xiàn)要好于低頻條件下欢顷。如果兩個模型系統(tǒng)相互獨立祠挫,那么按照理論外推的例外刺激的分類將不會受到樣例頻率的影響
文章通過兩個實驗(人類被試和模型擬合)來研究基于rules和exemplar模型的3個問題——規(guī)則的必要性/exemplar記憶的必要性/兩基礎模型的交互作用八孝。
人類被試實驗
實驗材料為內部含有線段的矩形问潭,刺激的變化維度是矩形的高度和線段的水平位置,高度和水平位置的變化范圍是0-9之間饼暑。刺激一共有四類稳析,分別有不同的圖形表示。首先弓叛,根據(jù)長方形高度大于4.5的是類A(圖形為方塊)彰居,長方形高度小于4.5的是類B(圖形為圓形);其次撰筷,空心方塊和空心圓是類中的例外刺激陈惰;空白格子和TE,TR是用來測試的沒有學習過的新刺激空白格與ab類相同,而TE,TR是例外的新刺激毕籽。
實驗對于類別的結構有要求抬闯,即一些刺激是可以通過給定規(guī)則進行分類的,但還有一些規(guī)則外的刺激必須進行記憶才能分類关筒。
實驗1分為學習階段和遷移階段溶握。
學習階段內,被試會通過規(guī)則進行訓練使得能夠將大部分刺激進行分類平委,在之后會隨機給與被試2個呈現(xiàn)符合之前學習規(guī)則的樣例和2個規(guī)則外的刺激奈虾,被試進行歸類判斷之后再給被試進行反饋;而在之后的遷移階段會出現(xiàn)新的刺激(新刺激分為2類廉赔,在學習階段的訓練范圍內的為內推法刺激,而規(guī)則外的叫外推法刺激)匾鸥,實驗會向被試逐一呈現(xiàn)4個外推法才能夠正確判斷的類別刺激蜡塌,并且不對被試的正確與否進行反饋,以此來考察類別特征的形成勿负。
程序:29個模塊馏艾,每個模塊14個試次劳曹,其中實心圖案播放一次,例外刺激播放兩次琅摩。要求被試將圖例分到四個類型中(有四個不同的按鍵)铁孵,并且反饋對錯和正確答案
*內推法/外推法:
學習的類別結構。例如函數(shù)區(qū)間房资,50-59范圍內的刺激為A類蜕劝,60-69的為B類,70-79的為A類(間隔)轰异。在學習階段從某個范圍區(qū)間內(比如50-89)中選擇刺激讓被試進行判斷與學習岖沛。那么在遷移階段,如果從50-89之間挑選的新刺激(學習階段內沒有出現(xiàn)的)來讓被試進行判斷即為內推法搭独;如果從50-89之外選擇新的刺激來讓被試進行分類判斷即為外推法婴削。
訓練階段示意圖。 圖左顯示牙肝,正確規(guī)則下被試分類的正確率在上升唉俗,對特例附近的刺激相應下降;圖右表示對正確的特例分類正確率在上升配椭,但是會有over-generalization虫溜,被試會出現(xiàn)對一些非特例的刺激錯誤分類。
遷移階段示意圖颂郎。示意圖說明被試對TE和TR的分類沒有明顯區(qū)別吼渡,即被試更多的是采用rules模式。但是某一些部分還是體現(xiàn)了exemplar模式——新刺激與例外刺激相似性越低乓序,分類到該類的概率降低寺酪。
*實驗一中還發(fā)現(xiàn)了維度注意現(xiàn)象(Dimensional attention),即被試更多地注意到維度1(高度替劈,即訓練時的規(guī)則)的變化寄雀。被試對在維度1上與例外刺激相似的刺激會更多地分類到特例一類。
如果exemplar模式僅僅只對例外刺激分類陨献,那么更多的注意應該分配到特例的兩個維度上盒犹。但是實驗表明注意在維度1更多,說明exemplar模式同時處理例外刺激和rule-based分類的刺激眨业。
實驗2
實驗2通過控制樣例呈現(xiàn)的頻率急膀,進一步探討刺激呈現(xiàn)的頻率對于分類學習的影響。
與實驗1相同龄捡,刺激還是實心方塊卓嫂,實心圓,空心方塊(只有一個)聘殖,空心圓(只有一個)晨雳。數(shù)字代表出現(xiàn)的比率行瑞。
程序:一個16個模塊,每個模塊28個試次餐禁。每個模塊訓練結束血久,都有14試次的遷移實驗,要求被試給新刺激貼標簽帮非。
訓練階段示意圖氧吐。與實驗1大致相似,正確規(guī)則下的分類正確率更高喜鼓,而對例外刺激的分類正確率更加低副砍。同樣,over-generalization現(xiàn)象也更加嚴重庄岖。另外豁翎,被試對頻率更高的示例學習得更快(規(guī)則刺激及例外刺激)。
遷移訓練刺激示意圖隅忿。該圖表示對實驗2陰影部分的遷移數(shù)據(jù)統(tǒng)計心剥,實點心代表rule,橫線代表exemplar背桐。
高頻的例外刺激附近的刺激會更多地被分類到特例一類优烧,高頻的規(guī)則刺激附近的刺激也會更多地被分到規(guī)則刺激一類,即exemplar模型也適用于不同頻率rule-based的刺激——實驗2也能說明exemplar模型能夠同時處理例外和rule-based的刺激链峭。
實驗12說明了單獨的模型(rule與exemplar)都不能夠完全地探明分類學習過程畦娄,所以將兩者結合是有必要的。進一步地弊仪,作者提出了將二者結合的鏈接模型ATRUIM熙卡,
ATRUIM模型示意圖,是一個rules和一個exemplars的雙重模型励饵,虛線為學習到的權重驳癌。
該模型認為在分類學習中rules系統(tǒng)和exemplars系統(tǒng)共同存在,而分類學習的具體條件會決定二者的地位權重役听。如果類別樣例可以根據(jù)某個特征進行分類判斷颓鲜,那么ATRUIM中的rules模型比重就會較高;而如果刺激的正確分類是通過整合樣例信息的典予,那么exemplar模型的比重就會較高甜滨。文章通過機器擬合來單獨評估模型中exemplar的部分的性能,然后進一步評估整個模型瘤袖。
ATRUIM中的rule模型規(guī)則模塊包含兩種類型的節(jié)點:規(guī)則節(jié)點和類別節(jié)點艳吠。規(guī)則節(jié)點實現(xiàn)了一個線性sigmoid;響應最佳的類別節(jié)點來探索包含規(guī)則模塊的門控混合系統(tǒng)在任務中的工作情況孽椰。而ATRUIM中的exemplar模型建立涉及對ALCOVE的實現(xiàn)昭娩。
*ALCOVE是基于樣例表征和錯誤驅動學習的類別模型,對于每一個節(jié)點的輸入都會由門控的注意值來決定黍匾。在訓練開始時栏渺,給與刺激所有維度同等的注意,但隨著學習過程锐涯,更多的注意會被分配到表征相關的維度上磕诊。總的來說纹腌,ALCOVE可以選擇性地分配注意(在一定程度上忽略無關維度空間)來解決分類問題霎终。
ATRUIM將樣例以心理空間(例如三維坐標系)中的點方式存在。刺激會抽象成空間中的一個點升薯,而根據(jù)這些點的分布情況分類莱褒,劃分類別的線即為規(guī)則“rule”。當一個空間內不存在劃分的線時涎劈,根據(jù)模型儲存的空間將新刺激進行相似性對比后進行分類广凸。
ATRUIM模型的學習是基于梯度下降(gradient descent on error)來實現(xiàn)的(尋找梯度函數(shù),求偏導蛛枚,使其快速收斂至極值點)谅海。ATRUIM通過上圖的參數(shù)進行擬合。
*2個β參數(shù)由刺激所決定蹦浦,其余參數(shù)是隨機的扭吁。
機器擬合實驗
擬合實驗采用和人類被試實驗中相同的各項刺激,模型同樣將會擬合訓練階段和遷移階段盲镶。由于exemplar是ALCOVE的實現(xiàn)侥袜,可以推測ATRUIM是ALCOVE的拓展(即ALCOVE是ATRUIM自由度較低的子集)。實驗會同時用ALCOVE和ATRUIM對結果進行預測徒河。
實驗1:訓練示例外的外推擬合系馆。
實驗1采用和人類被試實驗相同的刺激,將實驗1的訓練數(shù)據(jù)交叉生成一個三向表顽照。
ALCOVE訓練階段擬合示意圖由蘑,實線表示被試實際結果,虛線表示擬合結果代兵。圖表明ALCOVE學習速度和人類被試學習速度大致相同尼酿,但前10個block左右ALCOVE擬合正確率較實際高而后10個block則較低(這種不匹配可以用例外刺激周圍的低特異性刺激解釋)。
ALCOVE遷移階段擬合示意圖植影。圖顯示了對刺激的預測比例裳擎,和人類被試相比,盡管有很多一般相符合思币,但例外刺激附近的刺激分類仍然有較大差異鹿响。另一方面羡微,ALCOVE對例外刺激的擬合說明了該模型將更多的注意力放到了主要維度(規(guī)則)上。
ATRUIM訓練階段擬合示意圖惶我÷杈螅可以看出,ATRUIM的學習速度同樣接近人類被試绸贡,并且相符程度更高(over-generalization現(xiàn)象的block也與被試一致)盯蝴。
ATRUIM遷移階段擬合示意圖。ATURIM對于例外刺激的預測率較ALCOVE有著很大的進步听怕。 當然捧挺,就像ALCOVE一樣,ATRIUM對與兩個維度上的例外刺激的預測模式表明尿瞭,更多的注意力被分配到了主要維度闽烙。
擬合實驗2:訓練示例頻率的影響
與擬合實驗1相同,擬合實驗2也采用了和被試實驗2一樣的實驗數(shù)據(jù)筷厘,但只對訓練階段進行擬合(因為遷移階段只是對刺激數(shù)量的改變)鸣峭。
ALCOVE擬合示意圖。與實驗1不同酥艳,實驗2的擬合不再能夠對數(shù)據(jù)進行定性預測(尤其是例外刺激)摊溶,并且右圖中ALCOVE預測將不會產(chǎn)生over-generalization現(xiàn)象。*作者認為在實驗2中例外刺激周圍刺激的泛化梯度極高充石,而為了顯示泛化梯度特異性參數(shù)必須盡可能低莫换,這種模型無法兼容的矛盾導致一些類似于例外刺激的刺激都未被歸類。
ATRUIM擬合示意圖骤铃。與ALCOVE不同拉岁,ATRUIM的擬合仍能很好地和實際相適應。在梯度漸進線的例外刺激正確率也高于被試數(shù)據(jù)惰爬,例外刺激出現(xiàn)時ATRUIM也能很好預測出over-generalization現(xiàn)象喊暖。但是,預測的trial數(shù)量與實際存在差異——預測over-generalization的出現(xiàn)和減少的速度都比被試數(shù)據(jù)慢撕瞧。
綜上陵叽,實驗1能夠在某些程度上說明ALCOVE的預測確實和實驗數(shù)據(jù)相一致——首先,與次要刺激匹配的刺激相對于與主要維度匹配的刺激丛版,例外泛化率較低巩掺;其次,ALCOVE中的注意力權重表明页畦,主要維度的差異被加權比次要差異更大胖替。但由于ATRIUM的exemplar模塊不需要學習表示規(guī)則的所有實例,因此它能夠顯示改變規(guī)則訓練實例頻率的效果。在實驗過程中独令,樣本模塊的最終輸出與規(guī)則模塊的輸出混合在一起端朵,ATRIUM預測的規(guī)則響應在異常訓練實例附近的比例比ALCOVE的預測更符合經(jīng)驗數(shù)據(jù)〖呛福可以看到逸月,ATRUIM在保留正確預測的同時優(yōu)化了錯誤預測。
討論
盡管ATRUIM模型并非是唯一可以解釋并且契合實驗數(shù)據(jù)的模型遍膜,但作者對該模型的性能高度的認可。根據(jù)該模型瓤湘,人們在進行較為簡單的分類任務時瓢颅,傾向于根據(jù)exemplar機制進行分類,而在復雜任務中人們更加傾向于根據(jù)rule模型弛说,運用抽象的規(guī)則進行分類挽懦。在討論中作者也說明了,由于被試數(shù)量已經(jīng)訓練樣例數(shù)目較少木人,結論不能很好地推廣信柿。
另外在討論中,作者還簡單地闡述了其余的分類學習模型醒第,例如RULEX模型渔嚷、COVIS模型等〕砺總之形病,通過規(guī)則和示例性結合的模塊化模型可以很好地描述人類的分類行為。分類學習任務中的規(guī)則和例外刺激對于兩種系統(tǒng)的分析有著很重要的作用霞幅,而成功建模的關鍵因素則是通過注意力分配來表示兩個系統(tǒng)間的交互漠吻。
*RULEX模型,類似的rule和exemplar結合模型司恳,該模型是將所有刺激共同學習途乃,從中找出能夠最大部分分類的規(guī)則,而將剩余的樣例作為例外樣例記憶扔傅。
*COVIS模型耍共,基于神經(jīng)機制的理論模型,該模型任務分類學習是由意識控制的言語規(guī)則的加工系統(tǒng)和內隱的基于信息整合的加工系統(tǒng)獨立形成的铅鲤。