240 發(fā)簡信
IP屬地:北京
  • 120
    數(shù)據(jù)分析師(運(yùn)營/增長)面試必備資料集合

    01 什么是用戶行為 目的:分析用戶購買行為用戶行為由最簡單的五個(gè)元素構(gòu)成:時(shí)間艇抠、地點(diǎn)、人物、交互钥勋、交互的內(nèi)容叶摄。 量化指標(biāo):將分析框架中的問題形成可量化的指標(biāo)進(jìn)行衡量和評價(jià)如...

  • 120
    主成分分析(PCA)教程(1)

    主成分分析(PCA)是現(xiàn)代數(shù)據(jù)分析的主要方法之一拍摇,它被廣泛使用但其內(nèi)在機(jī)制仍不為太多人理解煤裙。這篇文章的主旨就是厘清并解釋其原理掩完。這篇教程不僅能幫助建立起對 PCA 原理的直覺...

  • 標(biāo)準(zhǔn)化與歸一化 with Scikit-learn

    1. 范數(shù)公式 L0 范數(shù):所有非零元素個(gè)數(shù) L1 范數(shù): L2 范數(shù): Lp 范數(shù): 2. 標(biāo)準(zhǔn)化(Standardization) 對于一個(gè)數(shù)據(jù)集夺刑,如果其某些特征不服從正...

  • Python中sorted方法與operator.itemgetter方法的共用

    Python中的sorted函數(shù)和operator.itemgetter可以說經(jīng)常一起用,主要是處理一些復(fù)雜的排序問題的時(shí)候分别。 operator.itemgetter函數(shù) o...

  • 10行代碼實(shí)現(xiàn)kNN算法

    使用 numpy 庫遍愿,只需 10 行簡單的代碼就能實(shí)現(xiàn) k 近鄰算法。 算法邏輯 對要分類的點(diǎn)(X)進(jìn)行下列運(yùn)算: 計(jì)算 X 與已知分類的所有點(diǎn)的距離(歐氏距離)耘斩; 距離按照...

  • 數(shù)據(jù)預(yù)處理與特征工程初步

    Intro 使用鳶尾花數(shù)據(jù)集: 其中features是特征矩陣沼填,labels是真實(shí)分類。 1. 預(yù)處理(preprocessing) 1.1 預(yù)處理的目的 數(shù)據(jù)預(yù)處理的目的在...

  • 120
    不只是線性回歸(2):多重共線性與正則化

    Intro 線性回歸(Linear Regression)是機(jī)器學(xué)習(xí)的基本方式括授,但為了提升其性能坞笙,人們發(fā)明了無數(shù)優(yōu)化方式岩饼。這個(gè)“不只是線性回歸”系列就是為了記錄我在日常的學(xué)習(xí)...

  • 120
    不只是線性回歸(1):穩(wěn)健回歸

    Intro 線性回歸(Linear Regression)是機(jī)器學(xué)習(xí)的基本方式,但為了提升其性能薛夜,人們發(fā)明了無數(shù)優(yōu)化方式籍茧。這個(gè)“不只是線性回歸”系列就是為了記錄我在日常的學(xué)習(xí)...

  • 120
    最大似然估計(jì)、最大后驗(yàn)概率與貝葉斯估計(jì)

    Intro 眾所周知梯澜,機(jī)器學(xué)習(xí)的過程一般分兩個(gè)要點(diǎn)寞冯,第一是“模型”,第二是“優(yōu)化”晚伙∷绷洌“模型”這一點(diǎn)很好理解,就是要找到適合用于解決手頭上預(yù)測問題的模型咆疗。機(jī)器學(xué)習(xí)訓(xùn)練過程的核心...

  • 120
    互聯(lián)網(wǎng)金融用戶增長數(shù)據(jù)模型

    Intro 最近很集中地系統(tǒng)梳理了互金理財(cái)行業(yè)在用戶增長(Growth)方面的 methodology 與 practice漓帚,嘗試以文章的形式予以框架性地總結(jié),也算是給自己這...

  • 120
    梯度提升決策樹 - GBDT

    Intro 最近因?yàn)榇蛩銋⒓右恍〤TR預(yù)估的競賽午磁,對一些常見的CTR競賽所用模型做了些學(xué)習(xí)胰默,本文主要記錄一下對GBDT的學(xué)習(xí)收獲。 學(xué)過機(jī)器學(xué)習(xí)的人肯定對決策樹(Decisi...

亚洲A日韩AV无卡,小受高潮白浆痉挛av免费观看,成人AV无码久久久久不卡网站,国产AV日韩精品