一斗遏、分析問題掰邢,明確目標(biāo) 1.風(fēng)險(xiǎn)訂單識(shí)別模型 很多互聯(lián)網(wǎng)公司都是中間商耕驰,需要連接用戶與供應(yīng)商据德,將用戶的訂單提供給供應(yīng)商肩民,由供應(yīng)商履行訂單 但是在這個(gè)過程中,很容易會(huì)因?yàn)楦鞣N原...
![240](https://upload.jianshu.io/users/upload_avatars/21997244/1daa1b9d-49c6-4e13-826e-fdf3130e6311.png?imageMogr2/auto-orient/strip|imageView2/1/w/240/h/240)
一斗遏、分析問題掰邢,明確目標(biāo) 1.風(fēng)險(xiǎn)訂單識(shí)別模型 很多互聯(lián)網(wǎng)公司都是中間商耕驰,需要連接用戶與供應(yīng)商据德,將用戶的訂單提供給供應(yīng)商肩民,由供應(yīng)商履行訂單 但是在這個(gè)過程中,很容易會(huì)因?yàn)楦鞣N原...
Q1:什么是用戶畫像蚪战? 用戶畫像是互聯(lián)網(wǎng)大數(shù)據(jù)體系中非常重要的一部分 通過用戶畫像牵现,可以對(duì)用戶進(jìn)行全面分析 可以利用用戶畫像“千人千面”地推薦相關(guān)產(chǎn)品 可以基于用戶畫像分析產(chǎn)...
Q1:簡(jiǎn)述AB測(cè)試。 1.AB測(cè)試 為了評(píng)估模型/項(xiàng)目的效果邀桑,在App/PC端同時(shí)設(shè)計(jì)多個(gè)版本 在同一時(shí)間維度下瞎疼,分別讓組成成分相同(相似)的訪客群組隨機(jī)訪問這些版本 收集各...
Q:如何提供數(shù)據(jù)分析報(bào)告的質(zhì)量? 一概漱、明確整體分析思路 好的數(shù)據(jù)分析報(bào)告都依賴于一個(gè)明確的思路丑慎,需要在開始設(shè)計(jì)報(bào)告前就整理出一個(gè)基本的框架喜喂,然后在設(shè)計(jì)過程中進(jìn)行適當(dāng)?shù)奶砑?切...
Q1:現(xiàn)在需要監(jiān)控?cái)?shù)據(jù)并設(shè)計(jì)相應(yīng)的報(bào)表瓤摧,應(yīng)該考慮哪些問題? 看什么:報(bào)表設(shè)計(jì)——提高信息量玉吁,提升可讀性 怎么看:報(bào)表輸出——圖表照弥、數(shù)據(jù)看板 給誰看:報(bào)表受眾——基于需要提供相...
在工作中,針對(duì)“xxxApp或xxx功能模塊最近的用戶量或者其他相關(guān)指標(biāo)下降了进副,你會(huì)如何進(jìn)行分析”等問題这揣,最直接的解決方法就是建立完整的指標(biāo)體系。通過指標(biāo)體系影斑,能夠很直觀的發(fā)...
作為數(shù)據(jù)分析師给赞,經(jīng)常被問到的問題是“XXX數(shù)據(jù)最近上升/下降了,是什么原因造成的矫户?”“新上線的功能給業(yè)務(wù)帶來的是正面影響還是負(fù)面影響”“對(duì)于xxx片迅,我們需要制定什么樣的策略,...
Q1:SQL中有哪些常用的聚合函數(shù)皆辽? 常用的聚合函數(shù) 注:對(duì)表中所有記錄進(jìn)行聚合計(jì)算時(shí)柑蛇,無需使用group by語句,可以在select后直接寫聚合函數(shù)驱闷,但是不能出現(xiàn)非聚合字...
在很多查詢場(chǎng)景中耻台,數(shù)據(jù)往往來源于多個(gè)表,所以需要將多個(gè)表連接起來進(jìn)行查詢空另,即多表查詢 Q1:簡(jiǎn)要介紹join連接盆耽,以及如何使用join進(jìn)行簡(jiǎn)單的表連接? 1.join joi...
本文通過案例進(jìn)行講解 假設(shè)數(shù)據(jù)庫有一個(gè)名為students_grade的表: 計(jì)算所有學(xué)生各個(gè)學(xué)科在2019年的平均分,篩選出平均分超過60分的記錄征字,并且最后以平均分進(jìn)行降序...
Q1:什么是SQL都弹?為什么要用到SQL? 1.SQL(Structured Query Language匙姜,結(jié)構(gòu)化查詢語言) SQL是一種數(shù)據(jù)庫查詢和程序設(shè)計(jì)語言畅厢,用于存取數(shù)據(jù)...
本文通過一個(gè)真實(shí)面試題目來講解R語言的數(shù)據(jù)挖掘 一、題目 建立線性回歸模型氮昧,預(yù)測(cè)各個(gè)酒店未來一段時(shí)間每天的訂單量 數(shù)據(jù): 二框杜、數(shù)據(jù)處理 首先,將沒有任何意義的單純表示排序的第...
Q1:如何使用R語言進(jìn)行數(shù)據(jù)可視化袖肥,用其可視化有什么特點(diǎn)咪辱? R語言可視化主要依賴ggplot2包以及相應(yīng)的衍生包 ggplot2的核心理念:將繪圖與數(shù)據(jù)分離,并且按圖層作圖椎组,...
Q1:如何用R語言進(jìn)行基本的數(shù)據(jù)框操作油狂? 1.讀取CSV文件并查看 read.csv()讀取csv文件 View()查看數(shù)據(jù)框數(shù)據(jù) 代碼示例: 輸出結(jié)果: 2.添加列 代碼示...
Q1:什么是R語言?它跟現(xiàn)在流行的Python相比有什么特點(diǎn)寸癌? 1.R語言簡(jiǎn)介 R語言在統(tǒng)計(jì)領(lǐng)域被廣泛使用专筷,是S語言的一個(gè)分支,可以認(rèn)為它是S語言的一種實(shí)現(xiàn)蒸苇,主要用于統(tǒng)計(jì)分析...
Q1:簡(jiǎn)要闡述分詞的三種模式及其區(qū)別磷蛹。 1.分詞的三種模式 精確模式:試圖將句子最精確地切分開,適合文本分析 全模式:把句子中所有可以成詞的詞都掃描出來溪烤,速度非澄犊龋快,但是不能...
Python中能實(shí)現(xiàn)數(shù)據(jù)可視化的包有很多:matplotlib檬嘀、pyecharts槽驶、seaborns、bokeh等鸳兽,本文主要介紹前兩個(gè)包掂铐。 Q1:如何使用matplotlib...
Q1:什么是pandas?為什么要用pandas贸铜? 在數(shù)據(jù)分析中堡纬,最重要的兩個(gè)Python庫就是NumPy和pandas,其中用得最多的是pandas庫蒿秦。 pandas是基于...
Q1:什么是python烤镐?為什么要選擇python? python是當(dāng)今應(yīng)用最廣泛的編程語言之一棍鳖,以效率高和代碼可讀性強(qiáng)而著稱 python介于R語言和Java語言之間炮叶,既可...
Q1:對(duì)于預(yù)測(cè)問題常用的評(píng)估方法有哪些碗旅? 1.MSE(Mean Squared Error,均方誤差) 定義:參數(shù)估計(jì)值與參數(shù)真值之差平方的期望值 MSE可以用于評(píng)估數(shù)據(jù)的變...