剪枝是樹類算法防止過擬合的重要方法霞扬,而且其思想非常有啟發(fā)棋凳,可以在其他算法中參考使用蔽挠。而且,(樹的)過擬合本身就是重要的內(nèi)容,所以單列出來。不過這里簡(jiǎn)單一說思路即可。 剪枝 在...
![240](https://cdn2.jianshu.io/assets/default_avatar/8-a356878e44b45ab268a3b0bbaaadeeb7.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
剪枝是樹類算法防止過擬合的重要方法霞扬,而且其思想非常有啟發(fā)棋凳,可以在其他算法中參考使用蔽挠。而且,(樹的)過擬合本身就是重要的內(nèi)容,所以單列出來。不過這里簡(jiǎn)單一說思路即可。 剪枝 在...
冥思之時(shí),總是想表達(dá)些什么東西豹储;但當(dāng)提起筆來贷盲,卻覺得沒什么想要表達(dá)。 今天想聊一下自我的認(rèn)知剥扣。 古語有之:知人者智巩剖,自知者明。 八個(gè)字钠怯,很簡(jiǎn)單佳魔,可是你真的能做到自知嗎? 在生...
一.簡(jiǎn)介 Kolmogorov-Smirnov是比較一個(gè)累計(jì)分布(cumulative distribution function)函數(shù)與經(jīng)驗(yàn)分布函數(shù)(empirical d...
Mann-Kendall檢驗(yàn)是一種非參數(shù)檢驗(yàn)(無分布檢驗(yàn))晦炊,其優(yōu)點(diǎn)是不要求樣本遵從一定的分布鞠鲜,也不受少數(shù)異常值的干擾宁脊。常用于對(duì)降水、徑流贤姆、氣溫和水質(zhì)等要素時(shí)間序列變化趨勢(shì)和突...
一.背景 在 LOF 之前的異常檢測(cè)算法大多是基于統(tǒng)計(jì)方法的榆苞,或者是借用了一些聚類算法用于異常點(diǎn)的識(shí)別(比如 ,DBSCAN霞捡,OPTICS)坐漏。這些方法都有一些不完美的地方: ...
一.簡(jiǎn)介 所謂魔法函數(shù)(Magic Methods),是Python的一種高級(jí)語法碧信,允許你在類中自定義函數(shù)(函數(shù)名格式一般為__xx__)赊琳,并綁定到類的特殊方法中。比如在類A...
STL (Seasonal-Trend decomposition procedure based on Loess) 為時(shí)序分解中一種常見的算法音婶,基于LOESS[http:...
一.算法思想 局部加權(quán)回歸(Lowess)的大致思路是:以一個(gè)點(diǎn)為中心檐什,向前后截取一段長(zhǎng)度為的數(shù)據(jù)碴卧,對(duì)于該段數(shù)據(jù)用權(quán)值函數(shù)做一個(gè)加權(quán)的線性回歸,記為該回歸線的中心值乃正,其中為擬...
一.梯度下降算法簡(jiǎn)介 1. 批量梯度下降法 [BGD: Batch Gradient Descent] 批量梯度下降法瓮具,是梯度下降法最常用的形式荧飞,具體做法也就是在更新參數(shù)時(shí)使...
一.概述 在本篇文章中將對(duì)四種聚類算法(K-means,K-means++,ISODATA和Kernel K-means)進(jìn)行詳細(xì)介紹,并利用數(shù)據(jù)集來真實(shí)地反映這四種算法之...
一.簡(jiǎn)介 孤立森林(Isolation Forest)于2008年由西瓜書作者周志華團(tuán)隊(duì)提出名党,憑借其線性的時(shí)間復(fù)雜度與優(yōu)秀的準(zhǔn)確率被廣泛應(yīng)用于工業(yè)界中結(jié)構(gòu)化數(shù)據(jù)的異常檢測(cè)叹阔。 ...
一.簡(jiǎn)介 ELMo是Embeddings from Language Models的縮寫传睹,意思就是語言模型得到的(句子)Embedding耳幢。另外Elmo是美國(guó)兒童教育電視節(jié)目...
一.背景 RNN的缺陷 在沒有Transformer以前,大家做神經(jīng)機(jī)器翻譯用的最多的是基于RNN的Encoder-Decoder模型: Encoder-Decoder模型當(dāng)...
一.簡(jiǎn)介 Bert是什么欧啤? BERT睛藻,全稱是 Bidirectional Encoder Representation from Transformers,基于語義理解的深度...
一.背景 RNN的多種結(jié)構(gòu) 首先從RNN的結(jié)構(gòu)說起邢隧,根據(jù)輸出和輸入序列不同數(shù)量RNN可以有多種不同的結(jié)構(gòu)店印,不同結(jié)構(gòu)自然就有不同的引用場(chǎng)合。 one to one結(jié)構(gòu)倒慧,僅僅只是...
一.簡(jiǎn)介 Word2Vec是google在2013年推出的一個(gè)NLP工具按摘,它的特點(diǎn)是能夠?qū)卧~轉(zhuǎn)化為向量來表示包券,這樣詞與詞之間就可以定量的去度量他們之間的關(guān)系,挖掘詞之間的聯(lián)...
一.簡(jiǎn)介 N-Gram是一種基于統(tǒng)計(jì)語言模型的算法院峡。它的基本思想是將文本里面的內(nèi)容按照字節(jié)進(jìn)行大小為N的滑動(dòng)窗口操作兴使,形成了長(zhǎng)度是N的字節(jié)片段序列。 每一個(gè)字節(jié)片段稱為gra...