![240](https://cdn2.jianshu.io/assets/default_avatar/9-cceda3cf5072bcdd77e8ca4f21c40998.jpg?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
一煌集、項(xiàng)目背景 2017年8月妓肢,“李文星遭BOSS直聘求職詐騙誤入傳銷死亡”事件,讓網(wǎng)絡(luò)求職詐騙第一次大規(guī)模曝光在大眾視野范圍內(nèi)苫纤。此后职恳,網(wǎng)絡(luò)招聘平臺的高薪高待遇詐騙、培訓(xùn)貸詐騙...
作為數(shù)據(jù)分析師操禀,使用的最多的莫過于SQL語句,這里拿幾道典型的SQL面試題為例横腿,學(xué)習(xí)一下數(shù)據(jù)庫知識颓屑。自己搭建MySQL服務(wù)器太麻煩,可以使用在線數(shù)據(jù)庫 發(fā)現(xiàn)sqlzoo是個(gè)不...
1.案例說明 一般案例客戶聚類分析流程(個(gè)人理解) 提取客戶消費(fèi)行為變量 對提取的行為變量進(jìn)行正態(tài)化(使聚類結(jié)果更有商業(yè)解讀意義),和Z-score處理(消除綱量) 對處理后...
1.讀取csv 2. 查看字段類型 同pandas [('PassengerId', 'int'),('Survived', 'int'),('Pclass', 'int')...
1. 連接本地spark 2. 創(chuàng)建DataFrame 2.1 從變量創(chuàng)建 2.2 使用自動類型推斷的方式創(chuàng)建dataframe 2.3 讀取json文件 2.4 讀取csv...
1.案例說明 數(shù)據(jù)來源狗熊會,數(shù)據(jù)完整,無缺失值,錯(cuò)誤值通過網(wǎng)球運(yùn)動的技術(shù)指標(biāo)探究運(yùn)動員的技術(shù)水平對世界排名的影響 2.變量修改及探索性分析 讀取數(shù)據(jù) 男性運(yùn)動員數(shù)據(jù) 男性運(yùn)...
1.案例說明 通過已知獲救數(shù)據(jù)耿焊,預(yù)測乘客生存情況 2.查看數(shù)據(jù) 3.數(shù)據(jù)預(yù)處理 其中Age,Cabin,Embarked有缺失值A(chǔ)ge變量缺失率19%,填充中位數(shù)Cabin缺...
1. 案例說明 通過收集相關(guān)網(wǎng)站對酒店評價(jià),poi地理數(shù)據(jù),和酒店自身介紹探索影響酒店入住價(jià)格的因素?cái)?shù)據(jù)來源:狗熊會 2.變量分析探索 查看酒店價(jià)格分布,酒店價(jià)格集中在100...
生成可視化決策樹代碼 錯(cuò)誤解決方式 下載安裝GraphViz(這是一個(gè)獨(dú)立軟件)https://graphviz.gitlab.io/_pages/Download/Down...
1. mysql不是內(nèi)部或外部命令 安裝Mysql后揪惦,當(dāng)我們在cmd中敲入mysql時(shí)會出現(xiàn)‘Mysql’不是內(nèi)部或外部命令,也不是可運(yùn)行的程序或其處理文件 解決方案:控制面...
案例背景 案例來源《python數(shù)據(jù)科學(xué):技術(shù)詳解與商業(yè)實(shí)踐》數(shù)據(jù)下載地址該案例使用一套來自某銀行真實(shí)數(shù)據(jù)集構(gòu)建貸款違約預(yù)測模型 本案例遵循數(shù)據(jù)挖掘項(xiàng)目通用流程CRISP-D...
1. 案例背景 國內(nèi)某航空公司面臨客戶流失,競爭力下降和航空資源未充分利用等經(jīng)營危機(jī)措左。 通過建立合理的客戶價(jià)值評估模型依痊,對客戶進(jìn)行分群,分析比較不同客戶群的客戶價(jià)值怎披,并制定相...
1. 聚類分析的典型應(yīng)用場景 聚類分析的一個(gè)重要用途就是針對目標(biāo)群體進(jìn)行多指標(biāo)的群體劃分胸嘁,類似這種目標(biāo)群體的分類就是精細(xì)化經(jīng)營,個(gè)性化運(yùn)營的基礎(chǔ)和核心凉逛,只有進(jìn)行了正確的分類缴渊,...