2019-04-29

開始嘗試用weka工具來做一些小示例纵揍,但是發(fā)現(xiàn)輸出結果里有很多不了解的地方顿乒,比如這樣的輸出代表什么意思,完全看不明白泽谨。

圖片大小可以調(diào)節(jié)一下嗎璧榄,這么大

1、mean absolute errorMAE={|p1-a1|+....+|pn-an|}/n. But what is the difference of predicted values pi and actual value ai in classification? 分類問題時吧雹,對于每一個instance,如何計算其error呢骨杂?發(fā)現(xiàn)一篇不錯的文章,http://weka.8497.n7.nabble.com/Mean-absolute-error-in-classification-td9440.html雄卷。但是還是擔心如果鏈接失效了搓蚪,以我的記性那是肯定記不住了。把他的意思簡單說一下丁鹉。

it's not too hard to replicate this using the GUI: go to "More options..." in the Classfy tab and then configure the "Output predictions" to generate a CSV table like below.


我生成的和大佬的不太一樣妒潭,不過我感覺吧悴能。。差不多吧,反正加起來為1雳灾,讓三個中一個為0漠酿。。

大佬生成的像下面這樣:

inst#,actual,predicted,error,distribution,,?

1,3:Iris-virginica,3:Iris-virginica,,0,0.02439024390243902464,0.975609756097561?

for the instance 1, the distribution given by Weka is: 0 ?0.02439024390243902464 ?0.975609756097561 (note that it adds up to 1; the order is the same as the order of the labels: first = Setosa, second = Versicolor & third = Virginica)?

I personally think that "distribution" it's a very vague name. I would rather call them something like prediction scores maybe, 【我感覺他的理解很透徹谎亩,有時候分布函數(shù)給人很高大上的感覺炒嘲,但是你如果說這是一個對預測的信心值,打分值匈庭,那比較好理解多了】as distribution can be many things in this context (for example, the actual distribution of classes in the dataset). Anyway, in the case of this instance, the error is very simple to calculate.?

First, the Expected distribution for the instance would be: 0 0 1. Since it's an instance of Iris virginica. Then the error is:?

abs(0 - 0)/3 + abs(0.02439024390243902464 - 0)/3 + abs(0.975609756097561 - 1)/3 = 0.01626016?

Repeating this for all the instances and summing up, I get 5.246992, which divided by 150 is 0.0349799, and that's the same answer I get with Weka.


2夫凸、correlation coefficient

When two sets of data are strongly linked together we say they have a?High Correlation。


from mathsisfun.com

相關性是說兩者有聯(lián)系阱持,比如氣溫和冰淇淋銷售額成在額定溫度內(nèi)存在正比關系寸痢,但是超過一定溫度后,銷售額又下降紊选,呈曲線啼止,相關性表述的是線性而無法描述曲線。同時兩者的聯(lián)系也不一定是因果關系兵罢,比如墨鏡的銷售額和冰淇淋的銷售額存在正比關系献烦,但僅僅是數(shù)值上的關系。


3卖词、choose the model with bigger correlation and smaller error estimates

下午看了一陣子coursera上Introduction to Data Science in Python的課程巩那,主要介紹pandas的用法,看完記住的甚少此蜈,關于missing value的填補他也介紹了方法fillna即横,如forward fill 和backward fill,不太明白為什么要排序裆赵,以后要是用到這些功能的時候再來回看課程我覺得效率會高些东囚。

函數(shù)名后直接加?可以顯示幫助战授。

shift + command +4截屏

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末页藻,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子植兰,更是在濱河造成了極大的恐慌份帐,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,423評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件楣导,死亡現(xiàn)場離奇詭異废境,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,147評論 2 385
  • 文/潘曉璐 我一進店門噩凹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來朦促,“玉大人,你說我怎么就攤上這事栓始∥衩幔” “怎么了?”我有些...
    開封第一講書人閱讀 157,019評論 0 348
  • 文/不壞的土叔 我叫張陵幻赚,是天一觀的道長禀忆。 經(jīng)常有香客問我,道長落恼,這世上最難降的妖魔是什么箩退? 我笑而不...
    開封第一講書人閱讀 56,443評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮佳谦,結果婚禮上戴涝,老公的妹妹穿的比我還像新娘。我一直安慰自己钻蔑,他們只是感情好啥刻,可當我...
    茶點故事閱讀 65,535評論 6 385
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著咪笑,像睡著了一般可帽。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上窗怒,一...
    開封第一講書人閱讀 49,798評論 1 290
  • 那天映跟,我揣著相機與錄音,去河邊找鬼扬虚。 笑死努隙,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的辜昵。 我是一名探鬼主播荸镊,決...
    沈念sama閱讀 38,941評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼路鹰!你這毒婦竟也來了贷洲?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,704評論 0 266
  • 序言:老撾萬榮一對情侶失蹤晋柱,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后诵叁,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體雁竞,經(jīng)...
    沈念sama閱讀 44,152評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,494評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了碑诉。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片彪腔。...
    茶點故事閱讀 38,629評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖进栽,靈堂內(nèi)的尸體忽然破棺而出德挣,到底是詐尸還是另有隱情,我是刑警寧澤快毛,帶...
    沈念sama閱讀 34,295評論 4 329
  • 正文 年R本政府宣布格嗅,位于F島的核電站,受9級特大地震影響唠帝,放射性物質(zhì)發(fā)生泄漏屯掖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,901評論 3 313
  • 文/蒙蒙 一襟衰、第九天 我趴在偏房一處隱蔽的房頂上張望贴铜。 院中可真熱鬧,春花似錦瀑晒、人聲如沸绍坝。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽陷嘴。三九已至,卻和暖如春间坐,著一層夾襖步出監(jiān)牢的瞬間灾挨,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,978評論 1 266
  • 我被黑心中介騙來泰國打工竹宋, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留劳澄,地道東北人。 一個月前我還...
    沈念sama閱讀 46,333評論 2 360
  • 正文 我出身青樓蜈七,卻偏偏與公主長得像秒拔,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子飒硅,可洞房花燭夜當晚...
    茶點故事閱讀 43,499評論 2 348

推薦閱讀更多精彩內(nèi)容