![240](https://cdn2.jianshu.io/assets/default_avatar/15-a7ac401939dd4df837e3bbf82abaa2a8.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
IP屬地:廣東
數(shù)據(jù)分析 train.csv的屬性有: test.csv缺少Survived字段蛾洛,也是需要我們預(yù)測(cè)的 數(shù)據(jù)預(yù)處理 預(yù)覽數(shù)據(jù) 定義dummies函...
特征使用方案 確定需要的數(shù)據(jù) 需要相關(guān)業(yè)務(wù)知識(shí)和領(lǐng)域知識(shí)养铸,盡可能找出對(duì)因變量有影響的所有自變量 可用性評(píng)估 獲取難度、覆蓋率轧膘、準(zhǔn)確率 特征獲取方...
最近做數(shù)據(jù)預(yù)處理钞螟,需要將兩個(gè)本體數(shù)據(jù)集處理成字典,簡(jiǎn)單記錄下遇到的坑 1.obo本體 數(shù)據(jù)格式大概是這樣谎碍,總共1w多行鳞滨,一個(gè)term記錄了本體的...
轉(zhuǎn)自以下博客http://blog.csdn.net/kevinelstri/article/details/57413791