240 發(fā)簡(jiǎn)信
IP屬地:廣西
  • 決策樹防止過擬合方法

    剪枝是樹類算法防止過擬合的重要方法霞扬,而且其思想非常有啟發(fā)棋凳,可以在其他算法中參考使用蔽挠。而且,(樹的)過擬合本身就是重要的內(nèi)容,所以單列出來。不過這里簡(jiǎn)單一說思路即可。 剪枝 在...

  • 認(rèn)知偏差何陆,你有嗎

    冥思之時(shí),總是想表達(dá)些什么東西豹储;但當(dāng)提起筆來贷盲,卻覺得沒什么想要表達(dá)。 今天想聊一下自我的認(rèn)知剥扣。 古語有之:知人者智巩剖,自知者明。 八個(gè)字钠怯,很簡(jiǎn)單佳魔,可是你真的能做到自知嗎? 在生...

  • 120
    Kolmogorov-Smirnov test (K-S 檢驗(yàn))

    一.簡(jiǎn)介 Kolmogorov-Smirnov是比較一個(gè)累計(jì)分布(cumulative distribution function)函數(shù)與經(jīng)驗(yàn)分布函數(shù)(empirical d...

  • Mann-Kendall趨勢(shì)檢驗(yàn)算法

    Mann-Kendall檢驗(yàn)是一種非參數(shù)檢驗(yàn)(無分布檢驗(yàn))晦炊,其優(yōu)點(diǎn)是不要求樣本遵從一定的分布鞠鲜,也不受少數(shù)異常值的干擾宁脊。常用于對(duì)降水、徑流贤姆、氣溫和水質(zhì)等要素時(shí)間序列變化趨勢(shì)和突...

  • 120
    異常檢測(cè)算法-LOF(Local Outlie Factor)

    一.背景 在 LOF 之前的異常檢測(cè)算法大多是基于統(tǒng)計(jì)方法的榆苞,或者是借用了一些聚類算法用于異常點(diǎn)的識(shí)別(比如 ,DBSCAN霞捡,OPTICS)坐漏。這些方法都有一些不完美的地方: ...

  • 120
    python中的魔法函數(shù)

    一.簡(jiǎn)介 所謂魔法函數(shù)(Magic Methods),是Python的一種高級(jí)語法碧信,允許你在類中自定義函數(shù)(函數(shù)名格式一般為__xx__)赊琳,并綁定到類的特殊方法中。比如在類A...

  • 120
    時(shí)間序列分解算法:STL

    STL (Seasonal-Trend decomposition procedure based on Loess) 為時(shí)序分解中一種常見的算法音婶,基于LOESS[http:...

  • 馬氏距離

    一.簡(jiǎn)介 一個(gè)好的距離衡量方法應(yīng)該可以很好地表示數(shù)據(jù)之間的相似性慨畸,即距離近點(diǎn)的數(shù)據(jù)擁有更高的相似性。當(dāng)數(shù)據(jù)以向量進(jìn)行表示衣式,每個(gè)維度的值代表不同屬性時(shí),好的數(shù)據(jù)表示應(yīng)該: 1)...

  • 局部加權(quán)回歸(Lowess)

    一.算法思想 局部加權(quán)回歸(Lowess)的大致思路是:以一個(gè)點(diǎn)為中心檐什,向前后截取一段長(zhǎng)度為的數(shù)據(jù)碴卧,對(duì)于該段數(shù)據(jù)用權(quán)值函數(shù)做一個(gè)加權(quán)的線性回歸,記為該回歸線的中心值乃正,其中為擬...

  • 120
    梯度下降住册、優(yōu)化器、學(xué)習(xí)率

    一.梯度下降算法簡(jiǎn)介 1. 批量梯度下降法 [BGD: Batch Gradient Descent] 批量梯度下降法瓮具,是梯度下降法最常用的形式荧飞,具體做法也就是在更新參數(shù)時(shí)使...

  • 120
    聚類-kmeans,kmeans++,ISODATA

    一.概述 在本篇文章中將對(duì)四種聚類算法(K-means,K-means++,ISODATA和Kernel K-means)進(jìn)行詳細(xì)介紹,并利用數(shù)據(jù)集來真實(shí)地反映這四種算法之...

  • 120
    異常檢測(cè)-孤立森林

    一.簡(jiǎn)介 孤立森林(Isolation Forest)于2008年由西瓜書作者周志華團(tuán)隊(duì)提出名党,憑借其線性的時(shí)間復(fù)雜度與優(yōu)秀的準(zhǔn)確率被廣泛應(yīng)用于工業(yè)界中結(jié)構(gòu)化數(shù)據(jù)的異常檢測(cè)叹阔。 ...

  • 120
    降維-PCA

    一.簡(jiǎn)介 PCA(Principal Component Analysis)主成分分析(Principal Component Analysis)是一種常用的數(shù)據(jù)分析方法,它...

  • 120
    自然語言處理-ELMo

    一.簡(jiǎn)介 ELMo是Embeddings from Language Models的縮寫传睹,意思就是語言模型得到的(句子)Embedding耳幢。另外Elmo是美國(guó)兒童教育電視節(jié)目...

  • 120
    自然語言處理-transformer

    一.背景 RNN的缺陷 在沒有Transformer以前,大家做神經(jīng)機(jī)器翻譯用的最多的是基于RNN的Encoder-Decoder模型: Encoder-Decoder模型當(dāng)...

  • 120
    自然語言處理-bert

    一.簡(jiǎn)介 Bert是什么欧啤? BERT睛藻,全稱是 Bidirectional Encoder Representation from Transformers,基于語義理解的深度...

  • 120
    自然語言處理-Seq2Seq和attention機(jī)制

    一.背景 RNN的多種結(jié)構(gòu) 首先從RNN的結(jié)構(gòu)說起邢隧,根據(jù)輸出和輸入序列不同數(shù)量RNN可以有多種不同的結(jié)構(gòu)店印,不同結(jié)構(gòu)自然就有不同的引用場(chǎng)合。 one to one結(jié)構(gòu)倒慧,僅僅只是...

  • 120
    自然語言處理-word2vec

    一.簡(jiǎn)介 Word2Vec是google在2013年推出的一個(gè)NLP工具按摘,它的特點(diǎn)是能夠?qū)卧~轉(zhuǎn)化為向量來表示包券,這樣詞與詞之間就可以定量的去度量他們之間的關(guān)系,挖掘詞之間的聯(lián)...

  • 120
    自然語言處理-N-Gram

    一.簡(jiǎn)介 N-Gram是一種基于統(tǒng)計(jì)語言模型的算法院峡。它的基本思想是將文本里面的內(nèi)容按照字節(jié)進(jìn)行大小為N的滑動(dòng)窗口操作兴使,形成了長(zhǎng)度是N的字節(jié)片段序列。 每一個(gè)字節(jié)片段稱為gra...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品