![240](https://cdn2.jianshu.io/assets/default_avatar/6-fd30f34c8641f6f32f5494df5d6b8f3c.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
聚類算法是沒用因變量的炼列。聚類算法有層次聚類、基于劃分的聚類音比、兩步聚類法俭尖、基于密度的聚類。 聚類方法的邏輯 客戶細分是將全體客戶劃分為多個分組并刻畫特征的過程洞翩,使得組內(nèi)客戶高度...
Seaborn其實是在matplotlib的基礎(chǔ)上進行了更高級的API封裝稽犁,從而使得作圖更加容易,在大多數(shù)情況下使用seaborn就能做出很具有吸引力的圖骚亿,而使用matplo...
回歸分析是統(tǒng)計學的核心已亥,通指那些用一個或多個預測變量(自變量)來預測相應變量(因變量)的方法OLS回歸法又稱普通最小二乘回歸法,主要包括簡單線性回歸来屠,多項式回歸虑椎,多元線性回歸...
在上一節(jié)中,我們學會了用lm()函數(shù)來擬合OLS回歸模型俱笛,通過summary()函數(shù)來獲取模型參數(shù)和相關(guān)統(tǒng)計量捆姜,但是沒有任何輸出告訴我們模型是否合適,所以我們要進行回歸診斷 ...
雙因素方差分析 在雙因素方差分析中迎膜,受試者被分到兩因子的交叉類別組中泥技。示例數(shù)據(jù)來源于ToothGrowth數(shù)據(jù)集-隨機分配60只豚鼠,分別采取兩種喂食方式(橙汁或維生素C)各...
數(shù)據(jù)分析離不開數(shù)據(jù)可視化磕仅。我們最常用的就是pandas零抬,matplotlib镊讼,pyecharts當然還有Tableau宽涌,看到一篇文章介紹plotly制圖后我也躍躍欲試平夜,查看了...
Plotly Express 是一個新的高級 Python 可視化庫:它是 Plotly.py 的高級封裝,它為復雜的圖表提供了一個簡單的語法卸亮。用 pip install p...
一.基本概念 "一張統(tǒng)計圖形就是從數(shù)據(jù)到幾何對象(geometric object, 縮寫為geom, 包括點忽妒、線、條形等)的圖形屬性(aesthetic attribute...
一兼贸、cars包中的Salaries數(shù)據(jù)集 1.查看原數(shù)據(jù)結(jié)構(gòu) 數(shù)據(jù)有重疊段直,調(diào)整透明度 修改為刻面圖 暫時忽略性別和學術(shù)等級,做非參數(shù)光滑曲線loess溶诞,即默認值smooth ...
機器學習的步驟:先擼一個baseline的model出來鸯檬,再進行后續(xù)的分析步驟,一步步提高螺垢,所謂后續(xù)步驟可能包括『分析model現(xiàn)在的狀態(tài)(欠/過擬合)喧务,分析我們使用的fea...
聚類分析是一種無監(jiān)督的學習方法,根據(jù)一定條件將相對同質(zhì)的樣本歸到一個類總(俗話說人以類聚枉圃,物以群分)正式一點的:聚類是對點集進行考察并按照某種距離測度將他們聚成多個“簇”的過...