240 發(fā)簡信
IP屬地:北京
  • 特征選擇的方法

    特征選擇的好處 便于理解和可視化數(shù)據(jù),降低計算及存儲壓力,對抗維數(shù)災難提高準確率删壮,增加模型泛化能力吼畏; 總結(jié)一 三大主流方法:過濾式龙亲,包裹式昵骤,嵌入式宵睦; 過濾式:對特征重要性(方...

  • 損失函數(shù)

    聊聊機器學習中的損失函數(shù) 機器學習中的損失函數(shù) 平方損失(線性回歸) 對數(shù)損失(交叉熵損失 softmax, logstic) 最大熵原理(引出softmax, logsti...

  • 決策樹處理連續(xù)值,缺失值

    簡書:決策樹會有哪些特性阁危?知乎:決策樹是如何處理不完整數(shù)據(jù)的玛痊? 1. 連續(xù)值如何劃分? C4.5:Information Gain (Ratio) based Thresho...

  • 如何解決類別不平衡問題狂打?

    如何解決類別不平衡問題? 對大類欠采樣混弥,或者對小類過采樣趴乡; 設(shè)置不同的學習率,大類權(quán)值小蝗拿,小類權(quán)值大晾捏; 使用一些對樣本分布不敏感的評價指標,F(xiàn)1哀托,ROC等 嘗試不同的算法惦辛,尤...

  • 120
    方差和偏差

    博客:http://liuchengxu.org/blog-cn/posts/bias-variance/ 誤差一般包含偏差,方差和噪聲 偏差:偏差度量了學習算法的期望預測與...

  • 過擬合原因和方法

    過擬合的原因 數(shù)據(jù)方面仓手,比如數(shù)據(jù)不規(guī)范胖齐,數(shù)據(jù)量少玻淑,還有可能是數(shù)據(jù)穿越(統(tǒng)計特征用到了未來的信息或者標簽信息); 算法方面呀伙,模型過于復雜补履; 防止過擬合方法 進行數(shù)據(jù)規(guī)范化,處理...

  • 極大似然估計&最小二乘

    最大似然估計 似然函數(shù):這個函數(shù)反應的是在不同的參數(shù)θ取值下剿另,取得當前這個樣本集的可能性箫锤,因此稱為參數(shù)θ相對于樣本集X的似然函數(shù)。 最大似然估計:現(xiàn)在已經(jīng)拿到了很多個樣本(你...

  • LR模型的特征歸一化和離散化

    知乎問題:https://www.zhihu.com/question/31989952 為什么LR需要歸一化或者取對數(shù)雨女? 歸一化:可以提高收斂速度谚攒,提高收斂的精度; 為什么...

  • 120
    L1和L2正則直觀理解

    博客:http://blog.csdn.net/zouxy09/article/details/24971995博客:http://blog.csdn.net/jinping...

  • 數(shù)據(jù)預處理

    數(shù)據(jù)ETL: 數(shù)據(jù)挖掘一般過程: 數(shù)據(jù)探索: 數(shù)據(jù)預處理

  • 120
    EM算法

    博客CSDN: 從最大似然到EM算法淺解知乎:隱變量是什么? 隱變量:主要就是指“不能被直接觀察到氛堕,但是對系統(tǒng)的狀態(tài)和能觀察到的輸出存在影響的一種東西”五鲫。 1. 算法步驟 2...

  • 120
    K均值算法(K-Means)

    博客CSDN:深入淺出K-Means算法博客:機器學習算法-K-means聚類分布式:MapReduce實現(xiàn)并行化:kmeans算法并行化的mpi程序 1. K-Means算...

  • 迭代器和生成器的理解

    迭代器 迭代器是有一個next()方法的對象,在全部元素取出后岔擂,會引發(fā)StopIteration異常位喂; 使用return返回結(jié)果,一般是將結(jié)果保存至列表乱灵,return 列表塑崖;...

  • pandas讀取文件中包含中文,出錯

    pandas讀取 df = pd.read_csv("../input/*.csv", encoding="gb2312") pandas導出 df.to_csv("../s...

  • Ubuntu Kylin安裝Numix主題和圖標

    Ubuntu安裝Numix主題和圖標 使用 Numix 的官方 PPA 來進行安裝痛倚,先打開 終端 使用如下命令安裝 Numix 主題和圖標: 使用 unity tweak t...

  • Linux終端下Ctrl+S卡死

    第一次遇到 在vim插入模式下规婆,習慣使用Ctrl+s保存一下(在windows下的習慣),但是之后終端會卡死蝉稳; 解決辦法 原因是在終端下“CTRL+S”代表鎖定屏幕顯示抒蚜,使用...

  • 根目錄空間清理

    sudo apt-get autoclean 清理舊版本的軟件緩存sudo apt-get clean ...

  • python字符串多個分割符(借助正則表達式re)

    傳統(tǒng)的字符串分割,只是支持一個分隔符 通過借助正則表達式耘戚,可以完成多個字符分割嗡髓;

  • C++面試題目總結(jié)

    1.內(nèi)存的分配方式有幾種? 從靜態(tài)存儲區(qū)域分配。內(nèi)存在程序編譯的時候就已經(jīng)分配好收津,這塊內(nèi)存在程序的整個運行期間都存在饿这。例如全局變量。2 在棧上創(chuàng)建撞秋。在執(zhí)行函數(shù)時长捧,函數(shù)內(nèi)局部變...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品