![Avatar notebook default](https://cdn2.jianshu.io/assets/default_avatar/avatar-notebook-default-640f7dde88592bdf6417d8ce1902636e.png)
數(shù)據(jù)挖掘算法有一種叫時間序列分析的算法钞钙,時間序列分析模型建立了觀察結(jié)果與時間變化的關(guān)系挪拟,能幫我們預(yù)測未來一段時間內(nèi)的結(jié)果變化情況校坑。時間序列分析和...
構(gòu)建邏輯回歸分類器 邏輯回歸是分類方法闯团,主要解決二分類問題晾虑。在邏輯回歸中使用了 Logistic 函數(shù)疹味,也稱為 Sigmoid 函數(shù)。 為什么邏...
如何制作詞云 詞云也叫文字云糙捺,幫助統(tǒng)計文本中高頻出現(xiàn)的詞,過濾掉某些常用詞(比如“作曲”“作詞”)笙隙,將文本中的重要關(guān)鍵詞進行可視化洪灯。創(chuàng)建詞云并展...
隨機森林分類器 隨機森林的英文是 Random Forest,英文簡寫是 RF竟痰。它實際上是一個包含多個決策樹的分類器签钩,每一個子分類器都是一棵 C...
使用 Webdriver 自帶的元素定位功能 1.id定位browser.find_element_by_id(“l(fā)oginName”) 定位...
算法原理 集成算法的兩種模式:投票選舉(bagging)和再選舉(boosting)边臼。 AdaBoost(adaptive boost)自適應(yīng)算...
使用NetworkX工具 1. 關(guān)于圖的創(chuàng)建 使用 nx.Graph() 進行創(chuàng)建無向圖,使用 nx.DiGraph() 來創(chuàng)建有向圖假消。 2. ...
概念 關(guān)聯(lián)規(guī)則挖掘可以讓我們從數(shù)據(jù)集中發(fā)現(xiàn)項與項(item 與 item)之間的關(guān)系。 支持度是個百分比,它指的是某個商品組合出現(xiàn)的次數(shù)與總次數(shù)...
EM 算法是一種求解最大似然估計的方法臼予,通過觀測樣本鸣戴,來找出樣本的模型參數(shù)。最大似然估計是一種通過已知結(jié)果粘拾,估計參數(shù)的方法窄锅。 EM 聚類的工作原...