關(guān)鍵函數(shù):readtable,summary,histogram,prctile,boxplot
1.統(tǒng)計詞匯頻率
有必要解釋下馅闽,C=categorial(T.TYPE),其中.TYPE意思是讀取“TYPE”標簽下的內(nèi)容:
表1
然后把這些數(shù)據(jù)以table的形式返回給C飘蚯。
整個程序主要的作用是,統(tǒng)計表1中的詞頻福也。目前給的表中是一個個詞匯局骤,而我們首先得知道有哪些詞,并得到一個這些詞的集合(詞之間不重復(fù))暴凑,這就用到:c=categories(C)峦甩。然后就可以得到不重復(fù)的詞的目錄了。
之后现喳,我們得知道每個詞出現(xiàn)的次數(shù)凯傲,這里matlab給了一個很方便的函數(shù),countcats嗦篱。
cf=countcats(C)冰单,就可以把每個詞出現(xiàn)的次數(shù)返回到cf里了,而且每個數(shù)字與categories所返回的標簽一一對應(yīng)灸促。(真是想要啥就有啥)
2.作圖
有了詞匯目錄诫欠,有了各個詞對應(yīng)的數(shù)字(頻率)之后涵卵,就需要把這些數(shù)據(jù)可視化了。就以條形圖為例荒叼,使用bar(cf); 就可以把cf中的數(shù)據(jù)展示在圖中了轿偎,但此時,橫坐標卻是1被廓,2坏晦,3.我們需要的橫坐標則是Anomic,Brocas嫁乘,Conduction昆婿。這是就要用到set函數(shù)了。只需在bar(cf)下方寫上set(gca,'XTickLabel',c)即可亦渗,gca表示當(dāng)前圖,XTickLabel表示橫坐標汁尺,c就是那三個單詞組成的標簽法精。