Access and DA

當(dāng)處理數(shù)據(jù)超過10w條趁猴,文件超過50M刊咳,你需要考慮一款新的數(shù)據(jù)處理軟件,MS旗下Access應(yīng)該是最好上手儡司,最便捷的一款娱挨。當(dāng)然,數(shù)據(jù)處理的工具不止這款捕犬,R跷坝、Python、Spoon同樣值得擁有碉碉!但是單單從DA的角度來(lái)看柴钻,我們關(guān)注的點(diǎn)在Analysis,難點(diǎn)BigData垢粮,用MS旗下Access足以將Data從50M10w條里瘦身顿颅。一起來(lái)學(xué)習(xí)一下!
PS:當(dāng)然足丢,SQL結(jié)構(gòu)化查詢規(guī)則較多粱腻,尤其MS旗下Access,先Mark斩跌,后續(xù)補(bǔ)上Python&R(又給自己挖坑 ><)

錄入數(shù)據(jù)

打開Access绍些,外部數(shù)據(jù)選項(xiàng)卡插入BigBoss(需要瘦身的data源),我保存的是excel文件耀鸦,也可以是text等柬批,你可以導(dǎo)入數(shù)據(jù)啸澡,也可以創(chuàng)建表鏈接。

Paste_Image.png
數(shù)據(jù)瘦身

創(chuàng)建查詢氮帐,就可以開始你數(shù)據(jù)瘦身之路嗅虏。
點(diǎn)擊“user”表,你可以看到倒入的數(shù)據(jù)明細(xì)上沐;
屏幕右下角皮服,點(diǎn)擊SQL,調(diào)出查詢界面参咙,在這里龄广,你可以開始SQL查詢語(yǔ)句。

Paste_Image.png
Paste_Image.png
數(shù)據(jù)處理

作為一名DA蕴侧,我們是結(jié)果導(dǎo)向型的择同,我們看到data的第一個(gè)想法是:我們能夠從數(shù)據(jù)中挖出什么緯度。净宵。敲才。這個(gè)也是我一直在思考的問題。择葡。以下就我研究的一些緯度做簡(jiǎn)單分享归斤。

一、地理分布

SELECT provice_name , count(id) as times
FROM user
GROUP BY provice_name;
Paste_Image.png

REULT:可以用ORDER BY 降序(默認(rèn)ASC)刁岸,也可以手動(dòng)降序

SELECT provice_name , count(id) as times
FROM user
GROUP BY provice_name
ORDER BY times DESC
;
Paste_Image.png

另脏里,分組的條件查詢不可以用WHERE,要用HAVING虹曙。

二迫横、轉(zhuǎn)化率

成功為1,失敗為0

SELECT level_id,
       count(level_success) as num,
       sum(level_success) as suc,
       suc/num as suc_rate
FROM user
group by level_id
;
image.png

三酝碳、留存

一天一張表(結(jié)構(gòu)完全相同)
去重矾踱,值為1,統(tǒng)計(jì)頻次

select distinct date4.ip,count(*) as how_many,1 AS has_left from date4 group by date4.ip
;
image.png

留存用戶統(tǒng)計(jì):

select n.d as 日期, n.newuser as 新增用戶, l.has_left as 次留用戶, has_left/newuser as 次日留存率
from(
  select '0803' as d,count(1) as newuser from (SELECT t1.ip FROM date3 t1 group by t1.ip)
       ) n left join(
 select '0803' as d,count(1) as has_left from (select t1.ip from date3 t1 inner join date4 t2 on t1.ip = t2.ip group by t1.ip)
       ) l on n.d = l.d
;
image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末疏哗,一起剝皮案震驚了整個(gè)濱河市呛讲,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌返奉,老刑警劉巖贝搁,帶你破解...
    沈念sama閱讀 219,366評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異芽偏,居然都是意外死亡雷逆,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門污尉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)膀哲,“玉大人往产,你說我怎么就攤上這事∧诚埽” “怎么了仿村?”我有些...
    開封第一講書人閱讀 165,689評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)兴喂。 經(jīng)常有香客問我蔼囊,道長(zhǎng),這世上最難降的妖魔是什么瞻想? 我笑而不...
    開封第一講書人閱讀 58,925評(píng)論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮娩嚼,結(jié)果婚禮上蘑险,老公的妹妹穿的比我還像新娘。我一直安慰自己岳悟,他們只是感情好佃迄,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評(píng)論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著贵少,像睡著了一般呵俏。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上滔灶,一...
    開封第一講書人閱讀 51,727評(píng)論 1 305
  • 那天普碎,我揣著相機(jī)與錄音,去河邊找鬼录平。 笑死麻车,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的斗这。 我是一名探鬼主播动猬,決...
    沈念sama閱讀 40,447評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼表箭!你這毒婦竟也來(lái)了赁咙?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,349評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤免钻,失蹤者是張志新(化名)和其女友劉穎彼水,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體极舔,經(jīng)...
    沈念sama閱讀 45,820評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡猿涨,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了姆怪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片叛赚。...
    茶點(diǎn)故事閱讀 40,127評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡澡绩,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出俺附,到底是詐尸還是另有隱情肥卡,我是刑警寧澤,帶...
    沈念sama閱讀 35,812評(píng)論 5 346
  • 正文 年R本政府宣布事镣,位于F島的核電站步鉴,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏璃哟。R本人自食惡果不足惜氛琢,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望随闪。 院中可真熱鬧阳似,春花似錦、人聲如沸铐伴。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,017評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)当宴。三九已至畜吊,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間户矢,已是汗流浹背玲献。 一陣腳步聲響...
    開封第一講書人閱讀 33,142評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留梯浪,地道東北人青自。 一個(gè)月前我還...
    沈念sama閱讀 48,388評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像驱证,于是被迫代替她去往敵國(guó)和親延窜。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容