機器學習實戰(zhàn)Py3.x填坑記—樸素貝葉斯

沒辦法寥假,雖讓Py2.x和Py3.x是兩種不同的語言呢如输,不可避免擼這章的時候還是出現(xiàn)問題之拨。

在“程序清單4-5轻掩,文件解析及完整的垃圾郵件測試函數(shù)”代碼中應將里面的setOfWords2Vec改為bagOfWords2VecMN

錯誤:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence

那是因為書上的下面這兩行代碼有點問題:
wordList = textParse(open('email/spam/%d.txt' % i).read()
wordList = textParse(open('email/ham/%d.txt' % i).read()
需要將上面的代碼更為下面這兩行:
wordList = textParse(open('email/spam/%d.txt' % i, "rb").read().decode('GBK','ignore') )
wordList = textParse(open('email/ham/%d.txt' % i,  "rb").read().decode('GBK','ignore') )

因為有可能文件中存在類似“?”非法字符糙捺。

在運行程序清單中代碼時候出現(xiàn)錯誤:

del(trainingSet[randIndex])
TypeError: 'range' object doesn't support item deletion
將代碼del(trainingSet[randIndex])上面第4行代碼trainingSet = range(50)改為:
trainingSet = list(range(50))
因為是python3中range不返回數(shù)組對象捂刺,而是返回range對象  

運行<程序清單4-6 RSS源分類器及高頻詞去除函數(shù)>出現(xiàn)錯誤殴蹄。
這些問題前面都已經(jīng)遇到過了,輕車熟路粪滤。

AttributeError: 'dict' object has no attribute 'iteritems'
#將代碼中的iteritems更改為items就好了

TypeError: 'range' object doesn't support item deletion
#將此行代碼上面的第三行代碼中的trainingSet = range(2*minLen)更改為
#trainingSet = list(range(2*minLen))就好了缎谷。

運行<程序清單4-7 最具表征性的詞匯顯示函數(shù)>時派撕,如果用書上的
if p0V[i] > -6.0和if p1V[i] > -6.0時候則打印出來的非常長隧熙。將-6.0更改為大一些片挂,則好一些,比如-5.4贞盯。

出現(xiàn)問題進行搜索參考博客:
[機器學習&數(shù)據(jù)挖掘]樸素貝葉斯數(shù)學原理
TypeError: cannot use a string pattern on a bytes-like object解決方法
處理UnicodeDecodeError: ‘XXX' codec can't decode bytes in position...的問題
python3中報錯:TypeError: 'range' object doesn't support item deletion

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末宴卖,一起剝皮案震驚了整個濱河市滋将,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌症昏,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,635評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件父丰,死亡現(xiàn)場離奇詭異肝谭,居然都是意外死亡,警方通過查閱死者的電腦和手機蛾扇,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評論 3 399
  • 文/潘曉璐 我一進店門攘烛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人镀首,你說我怎么就攤上這事坟漱。” “怎么了更哄?”我有些...
    開封第一講書人閱讀 168,083評論 0 360
  • 文/不壞的土叔 我叫張陵芋齿,是天一觀的道長。 經(jīng)常有香客問我成翩,道長觅捆,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,640評論 1 296
  • 正文 為了忘掉前任麻敌,我火速辦了婚禮栅炒,結果婚禮上,老公的妹妹穿的比我還像新娘术羔。我一直安慰自己赢赊,他們只是感情好,可當我...
    茶點故事閱讀 68,640評論 6 397
  • 文/花漫 我一把揭開白布级历。 她就那樣靜靜地躺著释移,像睡著了一般。 火紅的嫁衣襯著肌膚如雪鱼喉。 梳的紋絲不亂的頭發(fā)上秀鞭,一...
    開封第一講書人閱讀 52,262評論 1 308
  • 那天,我揣著相機與錄音扛禽,去河邊找鬼锋边。 笑死,一個胖子當著我的面吹牛编曼,可吹牛的內容都是我干的豆巨。 我是一名探鬼主播,決...
    沈念sama閱讀 40,833評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼掐场,長吁一口氣:“原來是場噩夢啊……” “哼往扔!你這毒婦竟也來了贩猎?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,736評論 0 276
  • 序言:老撾萬榮一對情侶失蹤萍膛,失蹤者是張志新(化名)和其女友劉穎吭服,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蝗罗,經(jīng)...
    沈念sama閱讀 46,280評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡艇棕,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,369評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了串塑。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片沼琉。...
    茶點故事閱讀 40,503評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖桩匪,靈堂內的尸體忽然破棺而出打瘪,到底是詐尸還是另有隱情,我是刑警寧澤傻昙,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布闺骚,位于F島的核電站,受9級特大地震影響屋匕,放射性物質發(fā)生泄漏葛碧。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,870評論 3 333
  • 文/蒙蒙 一过吻、第九天 我趴在偏房一處隱蔽的房頂上張望进泼。 院中可真熱鬧,春花似錦纤虽、人聲如沸乳绕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,340評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽洋措。三九已至,卻和暖如春杰刽,著一層夾襖步出監(jiān)牢的瞬間菠发,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,460評論 1 272
  • 我被黑心中介騙來泰國打工贺嫂, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留滓鸠,地道東北人。 一個月前我還...
    沈念sama閱讀 48,909評論 3 376
  • 正文 我出身青樓第喳,卻偏偏與公主長得像糜俗,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,512評論 2 359

推薦閱讀更多精彩內容