Adventure項(xiàng)目總結(jié)

一、項(xiàng)目概述

1念祭、成果預(yù)覽

最近回顧了Adventure項(xiàng)目,在此記錄碍侦、總結(jié)分析實(shí)現(xiàn)過(guò)程粱坤。該項(xiàng)目主要任務(wù)是利用python的pandas、numpy包從MySQL數(shù)據(jù)庫(kù)中讀取原始數(shù)據(jù)進(jìn)行加工瓷产、聚合站玄、分析,再利用Power BI進(jìn)行dashboard的搭建拦英。再以聚合后的數(shù)據(jù)為基礎(chǔ)制作PPT蜒什,匯報(bào)分析結(jié)果,為業(yè)務(wù)團(tuán)隊(duì)自主分析提供數(shù)據(jù)支持疤估,改進(jìn)工作灾常。
dashboard預(yù)覽:Dashboard看板鏈接

PPT預(yù)覽

2、背景介紹

1)公司背景

Adventure Works Cycle是國(guó)內(nèi)一家生產(chǎn)和銷(xiāo)售自行車(chē)及和相關(guān)配件的制造公司铃拇。利用每日商品銷(xiāo)售及相關(guān)客戶(hù)信息數(shù)據(jù)钞瀑,獲取商品銷(xiāo)售趨勢(shì)、地域分布情況以及簡(jiǎn)單用戶(hù)畫(huà)像慷荔,進(jìn)行可視化展示雕什,為運(yùn)營(yíng)人員提供自主分析工具。

2)產(chǎn)品介紹

公司主營(yíng)業(yè)務(wù)有自行車(chē)(主要產(chǎn)品)显晶,服裝贷岸,配件

  • 自行車(chē):包括公路自行車(chē)、山地自行車(chē)磷雇、旅游自行車(chē)三大類(lèi)
  • 服裝:包括帽子偿警、手套、襪子唯笙、背心螟蒸、運(yùn)動(dòng)衫等
  • 配件:包括頭盔、擋泥板崩掘、車(chē)架七嫌、清潔工、瓶子和籠子苞慢、車(chē)胎等
    這里主要分析的是自行車(chē)業(yè)務(wù)诵原。

3、數(shù)據(jù)來(lái)源

1)ods_sales_orders 訂單明細(xì)表

2)ods_customer 每日新增用戶(hù)表

3)dim_date_df 日期維度表

二、python處理數(shù)據(jù)

1皮假、生成dw_order_by_day表

導(dǎo)入相關(guān)模塊鞋拟,連接數(shù)據(jù)庫(kù)

step 1:讀取ods_sales_orders(訂單明細(xì)表),生成sum_amount_order(銷(xiāo)量訂單聚合表)惹资,求總銷(xiāo)售金額/客單價(jià)

step2:利用空列表及循環(huán)生成對(duì)應(yīng)隨機(jī)值贺纲,與銷(xiāo)量訂單聚合表合并形成sum_amount_order_goal(銷(xiāo)量訂單聚合目標(biāo)表)

step3:讀取dim_date_df日期維度表

step4:對(duì)數(shù)據(jù)進(jìn)行融合,生成dw_order_by_day表

step5:刪除舊的dw_order_by_day(每日環(huán)比表)褪测,存儲(chǔ)新的dw_order_by_day

2猴誊、生成dw_amount_diff表

step1:讀取dw_order_by_day表

step2:求取各階段的總金額

step3:求取各階段的總訂單數(shù)

step4:求取各階段的總金額、訂單數(shù)的同期對(duì)比數(shù)據(jù)

step5:刪除舊的dw_amount_diff表侮措,存儲(chǔ)新的dw_amount_diff表

3懈叹、生成dw_customer_order表

step1:讀取最新日期的ods_sales_orders(訂單明細(xì)表)

step2:讀取每日新增用戶(hù)表ods_customer

step3:讀取日期維度表dim_date_df

step4:對(duì)數(shù)據(jù)進(jìn)行聚合

step5:存儲(chǔ)數(shù)據(jù)

三、搭建Dashboard

1分扎、可視化看板布置

1)可視化工具:此處使用的可視化圖表有切片器澄成、卡片圖、KPI圖畏吓、環(huán)形圖墨状、子彈圖、表格菲饼、地圖等肾砂;
2)篩選器:用于區(qū)域、日期等字段信息的篩選宏悦;
3)書(shū)簽:將按鈕操作與書(shū)簽相結(jié)合镐确,完成不同頁(yè)面的導(dǎo)航、跳轉(zhuǎn)功能

2饼煞、報(bào)表展示

1)主頁(yè)

  • 展示今日銷(xiāo)售金額及目標(biāo)完成情況源葫、訂單量、客單價(jià)以及同比情況砖瞧;
  • 表格列明詳細(xì)銷(xiāo)售情況
  • 環(huán)形圖展示各個(gè)種類(lèi)產(chǎn)品銷(xiāo)售占比情況- 利用地區(qū)和城市切片可以動(dòng)態(tài)展現(xiàn)不同城市的銷(xiāo)售情況
  • 地圖和氣泡圖結(jié)合展示各個(gè)城市銷(xiāo)售情況



    2)趨勢(shì)詳情頁(yè)

  • 通過(guò)切片器篩選最近一段時(shí)間的銷(xiāo)售變化趨勢(shì)
  • 動(dòng)態(tài)展示最近15天銷(xiāo)售訂單量完成情況
  • 動(dòng)態(tài)展示最近15天銷(xiāo)售金額以及目標(biāo)完成情況
  • 動(dòng)態(tài)展示最近15天客單價(jià)變化趨勢(shì)



    3)城市詳情頁(yè)

  • 切片篩選區(qū)域和城市息堂,動(dòng)態(tài)展示不同地區(qū)銷(xiāo)售情況


四、報(bào)告輸出

1芭届、指標(biāo)搭建

1)目的

  • 優(yōu)化銷(xiāo)售策略,調(diào)整產(chǎn)品結(jié)構(gòu)感耙,才能保持高速增長(zhǎng)褂乍,獲取更多的收益,占領(lǐng)更多市場(chǎng)份額
  • 根據(jù)需求分析2019年11月自行車(chē)銷(xiāo)售情況即硼,為精細(xì)化運(yùn)營(yíng)提供數(shù)據(jù)支持

2)數(shù)據(jù)來(lái)源

dw_customer_order 產(chǎn)品銷(xiāo)售信息表

ods_customer 每天新增客戶(hù)信息表

dim_date_df 日期表

ods_sales_orders 訂單明細(xì)表

3)分析思路

從整體的角度:分析2019.1—2019.11自行車(chē)整體銷(xiāo)售表現(xiàn)

從地域的角度:分析11月每個(gè)區(qū)域銷(xiāo)售量表現(xiàn)逃片、11月TOP10城市銷(xiāo)售量表現(xiàn)

從產(chǎn)品的角度:分析11月類(lèi)別產(chǎn)品銷(xiāo)售量表現(xiàn)、11月細(xì)分產(chǎn)品銷(xiāo)售量表現(xiàn)

從用戶(hù)的角度:分析11月用戶(hù)年齡分布及每個(gè)年齡段產(chǎn)品購(gòu)買(mǎi)喜好、11月男女用戶(hù)分布情況

熱銷(xiāo)產(chǎn)品:分析11月TOP10產(chǎn)品銷(xiāo)量榜褥实、11月TOP10銷(xiāo)量增速榜

2呀狼、python加工數(shù)據(jù)

1)整體銷(xiāo)售表現(xiàn)

讀取數(shù)據(jù)

觀察字段屬性信息

增加月份字段以便于進(jìn)一步分析

篩選自行車(chē)數(shù)據(jù)

用groupby進(jìn)行分組,求出每月訂單量和銷(xiāo)售金額總和损离,并進(jìn)行排序

求每月訂單量環(huán)比

轉(zhuǎn)為dataframe形式

同樣求出每月銷(xiāo)售金額環(huán)比哥艇,并轉(zhuǎn)為dataframe,同時(shí)對(duì)兩個(gè)環(huán)比字段進(jìn)行重命名

存入數(shù)據(jù)庫(kù)

2)地域銷(xiāo)售表現(xiàn)

篩選10月僻澎、11月數(shù)據(jù)后進(jìn)行分組求和

求出不同區(qū)域銷(xiāo)售環(huán)比情況

存入數(shù)據(jù)庫(kù)

按城市分組并篩選銷(xiāo)量前十的城市

篩選10月貌踏、11月數(shù)據(jù)并計(jì)算月銷(xiāo)售金額

計(jì)算環(huán)比

存入數(shù)據(jù)庫(kù)

3)產(chǎn)品銷(xiāo)售表現(xiàn)

求出月銷(xiāo)量并合并表格

計(jì)算細(xì)類(lèi)產(chǎn)品銷(xiāo)售占比情況并重命名

查看自行車(chē)產(chǎn)品種類(lèi)

求出山地自行車(chē)具體型號(hào)銷(xiāo)售數(shù)量以及種類(lèi)月銷(xiāo)量,并進(jìn)行合并

同樣方法對(duì)公路自行車(chē)和旅游自行車(chē)進(jìn)行處理

計(jì)算銷(xiāo)量環(huán)比

計(jì)算累計(jì)銷(xiāo)量

合并表格并存儲(chǔ)

4)用戶(hù)行為分析

讀取信息


用戶(hù)年齡
合并表格窟勃,截取年份信息

計(jì)算用戶(hù)年齡并進(jìn)行分層

計(jì)算年齡比率祖乳,以便統(tǒng)計(jì)各年齡段占比情況

用戶(hù)性別
觀察性別分布情況并進(jìn)行字段關(guān)聯(lián)

5)熱點(diǎn)產(chǎn)品分析

11月產(chǎn)品銷(xiāo)量TOP10產(chǎn)品,銷(xiāo)售數(shù)量及環(huán)比
計(jì)算產(chǎn)品銷(xiāo)量并排序


切片秉氧、篩選信息眷昆,找出本月銷(xiāo)量top10產(chǎn)品

11月增速TOP10產(chǎn)品,銷(xiāo)售數(shù)量及環(huán)比
切片汁咏、篩選信息

合并表格

存儲(chǔ)數(shù)據(jù)

3亚斋、PPT制作

通過(guò)上述加工,將存入MySQL數(shù)據(jù)庫(kù)的數(shù)據(jù)接入Power BI梆暖,繪制圖像伞访,從而完成自行車(chē)業(yè)務(wù)分析報(bào)告


五、嘗試使用Hive和SQL完成ETL過(guò)程

1轰驳、使用sqoop導(dǎo)數(shù)到hive數(shù)據(jù)庫(kù)生成 ods 層數(shù)據(jù)

以生成dim_date_df表為例

ods_sales_orders表厚掷、ods_customer表亦同樣處理

2、使用hive庫(kù)進(jìn)行數(shù)據(jù)匯總加工生成dw層數(shù)據(jù)

以ods.dw_order_day為例進(jìn)行數(shù)據(jù)加工

3级解、sqoop導(dǎo)出分析結(jié)果到mysql

以導(dǎo)出dim_date_df表為例
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末冒黑,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子勤哗,更是在濱河造成了極大的恐慌抡爹,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,820評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件芒划,死亡現(xiàn)場(chǎng)離奇詭異冬竟,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)民逼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門(mén)泵殴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人拼苍,你說(shuō)我怎么就攤上這事笑诅。” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 168,324評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵吆你,是天一觀的道長(zhǎng)弦叶。 經(jīng)常有香客問(wèn)我,道長(zhǎng)妇多,這世上最難降的妖魔是什么伤哺? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 59,714評(píng)論 1 297
  • 正文 為了忘掉前任,我火速辦了婚禮砌梆,結(jié)果婚禮上默责,老公的妹妹穿的比我還像新娘。我一直安慰自己咸包,他們只是感情好桃序,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,724評(píng)論 6 397
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著烂瘫,像睡著了一般媒熊。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上坟比,一...
    開(kāi)封第一講書(shū)人閱讀 52,328評(píng)論 1 310
  • 那天芦鳍,我揣著相機(jī)與錄音,去河邊找鬼葛账。 笑死柠衅,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的籍琳。 我是一名探鬼主播菲宴,決...
    沈念sama閱讀 40,897評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼趋急!你這毒婦竟也來(lái)了喝峦?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 39,804評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤呜达,失蹤者是張志新(化名)和其女友劉穎谣蠢,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體查近,經(jīng)...
    沈念sama閱讀 46,345評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡眉踱,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,431評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了霜威。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片谈喳。...
    茶點(diǎn)故事閱讀 40,561評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖侥祭,靈堂內(nèi)的尸體忽然破棺而出叁执,到底是詐尸還是另有隱情,我是刑警寧澤矮冬,帶...
    沈念sama閱讀 36,238評(píng)論 5 350
  • 正文 年R本政府宣布谈宛,位于F島的核電站,受9級(jí)特大地震影響胎署,放射性物質(zhì)發(fā)生泄漏吆录。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,928評(píng)論 3 334
  • 文/蒙蒙 一琼牧、第九天 我趴在偏房一處隱蔽的房頂上張望恢筝。 院中可真熱鬧,春花似錦巨坊、人聲如沸撬槽。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,417評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)侄柔。三九已至,卻和暖如春占调,著一層夾襖步出監(jiān)牢的瞬間暂题,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,528評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工究珊, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留薪者,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,983評(píng)論 3 376
  • 正文 我出身青樓剿涮,卻偏偏與公主長(zhǎng)得像言津,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子幔虏,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,573評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • 最近剛剛做的adventure項(xiàng)目纺念,接下來(lái)把我做項(xiàng)目的過(guò)程和步驟展示出來(lái),方便大家學(xué)習(xí)理解想括。 以下先展示本次項(xiàng)目的...
    lwj_5b48閱讀 931評(píng)論 0 2
  • 一陷谱、項(xiàng)目背景介紹 Adventure Works Cycles是Adventure Works樣本數(shù)據(jù)庫(kù)所虛構(gòu)的公...
    Helluin92閱讀 308評(píng)論 0 2
  • 分析成果的鏈接 本文目錄:一 項(xiàng)目背景介紹二 數(shù)據(jù)整理和羅列分析指標(biāo)三 使用Python聚合數(shù)據(jù)并實(shí)現(xiàn)自動(dòng)更新四 ...
    胖波波玻璃球閱讀 676評(píng)論 0 1
  • 一、項(xiàng)目概況 1. 成果預(yù)覽 分析概述:本文是對(duì)Adventure項(xiàng)目的總結(jié)瑟蜈,記錄項(xiàng)目分析與實(shí)現(xiàn)過(guò)程烟逊,主要任務(wù)是對(duì)...
    kh辰辰辰閱讀 225評(píng)論 0 0
  • 本文是對(duì)Adventure Bicycle案例的一個(gè)總結(jié),記錄了整個(gè)項(xiàng)目需求分析與實(shí)現(xiàn)的過(guò)程铺根,主要任務(wù)是使用Hiv...
    Bourton閱讀 705評(píng)論 0 3