終于盼來(lái)了不是前言部分的前言厌蔽,相當(dāng)于雜談牵辣,算得上閑扯,我覺(jué)得很多東西都是在閑扯中感悟的奴饮,比如需求這東西纬向,一個(gè)人只有跟自己溝通好了,總結(jié)出某些東西了戴卜,才能更好的和別人去聊逾条,去說(shuō)。
今天這篇寫(xiě)的是明白需求叉瘩,其實(shí)更多的是想和大家聊天膳帕,只有把這個(gè)聊開(kāi)了,后面的東西做起來(lái)才有意義,才有價(jià)值危彩,在聊天中攒磨,思考中發(fā)現(xiàn)價(jià)值(化身為話嘮了?)
有時(shí)候你自以為某些東西很重要汤徽,其實(shí)那只是站在自己的角度覺(jué)得很重要娩缰,更需要的是站在別人,站在市場(chǎng)的角度去思考這個(gè)問(wèn)題谒府,特么的到底重不重要拼坎。
需求我覺(jué)得可以分為兩類:自己主動(dòng)去做的和別人要求你去做的。別人要求你做的完疫,你完成的很快泰鸡,大部分人都是走走腎就能搞定。但是自己主動(dòng)去做的壳鹤,我覺(jué)得沒(méi)人會(huì)只走腎不走心的盛龄。 當(dāng)你真正主動(dòng)去做一件事的時(shí)候,那件事才能帶來(lái)價(jià)值芳誓,不然對(duì)你來(lái)說(shuō)無(wú)非就是浪費(fèi)時(shí)間浪費(fèi)生命浪費(fèi)撩妹的好時(shí)光余舶,可是人生不就是用來(lái)浪費(fèi)的嗎?(好矛盾)
感悟一:做數(shù)據(jù)相關(guān)的工作锹淌,如果只是一味被動(dòng)的去出一些數(shù)據(jù)報(bào)表匿值,完成一些沒(méi)有自己想法的數(shù)據(jù)報(bào)告,不帶有任何感情色彩去做赂摆,不把自己的想法和思維附在那一堆枯燥的數(shù)據(jù)上挟憔,那終究是一件浪費(fèi)時(shí)間浪費(fèi)生命浪費(fèi)撩妹的好時(shí)光的工作。如果給一家企業(yè)這么干活库正,永遠(yuǎn)只會(huì)是人手曲楚,不會(huì)成為人才,最終可能會(huì)發(fā)展成為奇葩褥符。
所以龙誊,對(duì)待需求,不能只走腎喷楣,不走心~ 去挖掘趟大,去發(fā)現(xiàn),去好奇铣焊,去探索逊朽,去嘗試著犯錯(cuò)。主動(dòng)給自己攬活干曲伊,把被動(dòng)變主動(dòng)叽讳,養(yǎng)成了主動(dòng)的習(xí)慣追他,不僅僅只對(duì)你手頭的工作有好處,對(duì)整個(gè)人的思維都是有幫助的岛蚤,這是一輩子的事邑狸。只有去不斷思考了,需求才會(huì)出來(lái)涤妒。
說(shuō)個(gè)真事兒单雾,年初的時(shí)候總監(jiān)讓我出報(bào)表,需求就是:一周起碼要產(chǎn)出5張新數(shù)據(jù)報(bào)表她紫。如果是你硅堆,你會(huì)怎么做呢?
我還真那么去做了贿讹,幾周下來(lái)渐逃,居然好神奇的出了幾十張數(shù)據(jù)報(bào)表,后來(lái)我發(fā)現(xiàn)不對(duì)勁围详,出了這么多數(shù)據(jù)報(bào)表朴乖,意義何在?除了走量助赞,好像然并卵啊。呵呵袁勺,我承認(rèn)我走腎了雹食。
感悟二:搞數(shù)據(jù),最重要的不是你使用什么工具期丰,而是你的數(shù)據(jù)思維群叶,讓手上的數(shù)據(jù)產(chǎn)生價(jià)值。武功再高钝荡,也怕菜刀街立。你用excel 計(jì)算 1+1 和 python 計(jì)算 1+1 ,都是等于2埠通。具體使用什么工具赎离,你得看自己手上的需求和數(shù)據(jù)規(guī)模,幾千上萬(wàn)的數(shù)據(jù)端辱,就別來(lái)問(wèn)用什么工具了梁剔,你玩得溜,用excel照樣切菜舞蔽。
舉個(gè)例子:現(xiàn)在手上有一客戶基本信息數(shù)據(jù)(user表)荣病,給他們按區(qū)域統(tǒng)計(jì)一下人數(shù)。
2W條的量:excel透視表一下渗柿,就行了个盆,你說(shuō)你要搞個(gè)hadoop來(lái)跑2W量的數(shù)據(jù),why not?
10W條的量:用excel就吃力了颊亮,用sql是ok的 (select area as '區(qū)域',count(area) as '人數(shù)' from user group by area)
100W條的量:用python的pandas庫(kù)就好了 (user.area.value_counts())
1000W以上的量:pandas可以做鸡岗,但是分布式的做起來(lái)就更ok了。
所以编兄,別一上來(lái)就是哪個(gè)工具哪個(gè)工具轩性,這個(gè)不是最重要的,最重要的是你怎么讓那堆數(shù)據(jù)對(duì)業(yè)務(wù)產(chǎn)生價(jià)值狠鸳,這才是重中之重揣苏。當(dāng)然咯,并不是說(shuō)會(huì)一種就行了件舵,需要不斷地學(xué)習(xí)卸察。
感悟三:如果你的工作就是數(shù)據(jù)分析,但是領(lǐng)導(dǎo)沒(méi)數(shù)據(jù)這方面意識(shí)铅祸,要不改變他要不就放棄坑质,change or giveup,這和追妹子一個(gè)道理临梗,熱臉貼冷屁股涡扼,沒(méi)意思。
這次寫(xiě)這些文章盟庞,我先把自己需求弄懂了吃沪,決定從(獲取數(shù)據(jù)--讀取數(shù)據(jù)--清洗整理數(shù)據(jù)--統(tǒng)計(jì)分析數(shù)據(jù)--數(shù)據(jù)報(bào)告產(chǎn)出--總結(jié)) 這一條龍過(guò)程中用到的知識(shí)梳理一下,也算來(lái)個(gè)全套咯什猖,嘿嘿嘿票彪。
僅針對(duì)中小企業(yè)日常數(shù)據(jù)統(tǒng)計(jì)分析所涉及的工作內(nèi)容,半桶子水不狮,能力有限降铸,其他級(jí)別的的可以繞行了:
獲取數(shù)據(jù):打算從網(wǎng)上抓取XX金融網(wǎng)站的投資貸款數(shù)據(jù)用來(lái)作為數(shù)據(jù)源,基本上每個(gè)維度每個(gè)格式的數(shù)據(jù)都有摇零,便于后期的操作
讀取數(shù)據(jù):這里我會(huì)把獲取的數(shù)據(jù)分為xls推掸,csv,sql,還有pandas的DataFrame格式的數(shù)據(jù)遂黍,分別進(jìn)行操作终佛,以應(yīng)對(duì)各式的數(shù)據(jù)源格式
清洗整理數(shù)據(jù):excel,sql,python,javascript都會(huì)用到
統(tǒng)計(jì)分析數(shù)據(jù):主用python的pandas 和 sql。
數(shù)據(jù)報(bào)告產(chǎn)出:我會(huì)用到django的web開(kāi)發(fā)用來(lái)做可視化(html,css,javascript)雾家,以及手上現(xiàn)有的報(bào)表系統(tǒng),word,pdf,ppt都是可行的
總結(jié):將用到的方法和遇到的問(wèn)題進(jìn)行概括總結(jié)
明白需求铃彰,再去開(kāi)始你接下來(lái)的任務(wù),走腎是可恥的芯咧。不求贊同牙捉,只求理解竹揍,大家一起進(jìn)步,在工作過(guò)程中任何感觸和問(wèn)題邪铲,都可以一起分享一起討論交流芬位。歡迎大家加我QQ1749061919,一起交流與學(xué)習(xí)带到。