對(duì)于數(shù)據(jù)產(chǎn)品經(jīng)理而言帖族,日常工作是聚焦于一個(gè)研究對(duì)象(一個(gè)產(chǎn)品/業(yè)務(wù)線/業(yè)務(wù)場(chǎng)景),通過(guò)生產(chǎn)逊抡、加工、應(yīng)用數(shù)據(jù)去監(jiān)控去運(yùn)作情況零酪,再通過(guò)數(shù)據(jù)分析方法暴露出長(zhǎng)處和不足冒嫡,從而反饋給研究對(duì)象,使其運(yùn)作得更好蛾娶。
那么一樣的道理:對(duì)于一個(gè)人來(lái)說(shuō)灯谣,他自身就是一個(gè)研究對(duì)象,他的工作生活蛔琅,日常行為都是可以生產(chǎn)數(shù)據(jù)去記錄追蹤胎许、整理分析,然后評(píng)價(jià)反饋的罗售。
所以一個(gè)人想要自律辜窑,就得用數(shù)據(jù)化運(yùn)營(yíng)的方法來(lái)管理自己。
數(shù)據(jù)產(chǎn)品主要的工作流程如下圖寨躁,此文將逐步講解如何構(gòu)建自己的數(shù)據(jù)產(chǎn)品穆碎,以實(shí)現(xiàn)對(duì)自己的數(shù)據(jù)化管理。
生產(chǎn)數(shù)據(jù)
要生產(chǎn)能夠記錄自己日常工作职恳、生活情況的數(shù)據(jù)所禀,得借助一款好用的時(shí)間、日程記錄和管理工具放钦。滴答清單是我在同類產(chǎn)品中用得最為舒適的色徘,因?yàn)閴α淹扑]。
容我先曬(zhuang)成(ge)就(xx)操禀。
這款產(chǎn)品的優(yōu)點(diǎn)有很多褂策,不少文章都有詳盡的分析。但我來(lái)說(shuō),它最能吸引我的點(diǎn)有以下之處:
-
科學(xué)全面的分類體系斤寂。清單體系耿焊、標(biāo)簽體系、時(shí)間體系遍搞、優(yōu)先級(jí)體系罗侯,這些正交的劃分體系基本能將日常大大小小的事情劃分得很清晰,無(wú)論是記錄尾抑,查找還是復(fù)盤歇父,都十分高效,且一目了然
分類體系 -
系統(tǒng)再愈、全面的日歷視圖榜苫,很方便進(jìn)行每日記錄和日程管理
日歷視圖 - 多平臺(tái)同步,無(wú)論是網(wǎng)頁(yè)端翎冲、win/mac的客戶端垂睬、android/ios端,甚至是智能硬件抗悍,都能快速驹饺、準(zhǔn)確同步,十分適合多場(chǎng)景缴渊、碎片化的記錄和寫作
- 簡(jiǎn)約赏壹、優(yōu)美、無(wú)廣告的UI設(shè)計(jì)風(fēng)格
當(dāng)然還有許多其他小的亮點(diǎn)衔沼,構(gòu)成了這款產(chǎn)品盡管小眾但用戶忠誠(chéng)度都比較高的特點(diǎn)蝌借。
如果你喜歡并習(xí)慣使用這個(gè)產(chǎn)品,并且深深地使用它對(duì)于日常事項(xiàng)的管理指蚁、記錄和執(zhí)行菩佑,那么它不僅僅是促進(jìn)你自律的過(guò)程,還產(chǎn)生了自我管理的結(jié)果數(shù)據(jù)凝化。
加工數(shù)據(jù)
有了數(shù)據(jù)之后稍坯,我們得采集到才能構(gòu)建數(shù)據(jù)產(chǎn)品;何況自己生產(chǎn)的數(shù)據(jù)自己應(yīng)當(dāng)擁有搓劫,而不是只放在別人的服務(wù)器上瞧哟。怎么采集,python爬蟲扒瓜颉勤揩!
稍微觀測(cè)一下,就很容易發(fā)現(xiàn)遣疯,滴答清單上的數(shù)據(jù)都以json形式通過(guò)調(diào)API來(lái)獲刃劭伞;這樣就十分容易去采集和解析缠犀。
怎么寫爬蟲代碼数苫,此文就不說(shuō)了。值得一提的是辨液,滴答清單還有一個(gè)優(yōu)點(diǎn)就在于虐急,它只需要登錄一次,cookie壽命很長(zhǎng)滔迈;這樣我們的爬蟲代碼就只用一次登錄過(guò)的cookie止吁,都不用頻繁換了,十分便于數(shù)據(jù)采集燎悍。
然后我們就是通過(guò)爬蟲將自己源源不斷產(chǎn)生的數(shù)據(jù)源源不斷地取回來(lái)存儲(chǔ)在自己的數(shù)據(jù)庫(kù)里敬惦,這里我只爬取已完成的工作項(xiàng);記錄的表結(jié)構(gòu)如下谈山。
CREATE TABLE `dida_done_list` (
`id` BIGINT(20) NOT NULL AUTO_INCREMENT,
`title` VARCHAR(128) DEFAULT NULL,
`createdTime` VARCHAR(64) DEFAULT NULL,
`tags` VARCHAR(256) DEFAULT NULL,
`priority` TINYINT(4) DEFAULT NULL,
`task_status` TINYINT(4) DEFAULT NULL,
`completedTime` VARCHAR(64) DEFAULT NULL,
`content` LONGTEXT,
`scrapyed_time` VARCHAR(64) DEFAULT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `completedTime` (`completedTime` , `title`)
) ENGINE=INNODB AUTO_INCREMENT=31692 DEFAULT CHARSET=UTF8
分析數(shù)據(jù)
在有了全部的滴答清單歷史數(shù)據(jù)之后俄删,就可以很容易地查看自己在某個(gè)時(shí)間點(diǎn)做了什么事——當(dāng)然我們做數(shù)據(jù)產(chǎn)品并不是為了緬懷過(guò)往,而是定期給自己復(fù)盤和總結(jié)奏路。
所以從業(yè)務(wù)(自我管理)的角度來(lái)看畴椰,復(fù)盤時(shí)我主要關(guān)注以下幾個(gè)問(wèn)題:
- 這段時(shí)間的產(chǎn)出如何(任務(wù)完成量)
- 與過(guò)去比起來(lái)如何(跨時(shí)段對(duì)比)
- 哪些方面的產(chǎn)出較為突出,哪些不足(分標(biāo)簽對(duì)比)
- 這段時(shí)間所做事情的關(guān)鍵詞有哪些(中文分詞)
當(dāng)然肯定還有更多的點(diǎn)可以挖掘鸽粉,但你輸入給數(shù)據(jù)產(chǎn)品的不能是過(guò)于主觀斜脂、過(guò)于發(fā)散的問(wèn)題,而是要具體触机、可量化帚戳、可復(fù)用、可程序化計(jì)算威兜。
應(yīng)用數(shù)據(jù)
對(duì)于數(shù)據(jù)分析師來(lái)說(shuō)销斟,業(yè)務(wù)周報(bào)是一項(xiàng)常見的工作。而我們的產(chǎn)品也可以采用周報(bào)的形式椒舵,只不過(guò)不是人來(lái)寫蚂踊,而是程序自動(dòng)發(fā)。(數(shù)據(jù)分析師與數(shù)據(jù)產(chǎn)品經(jīng)理的區(qū)別在于:數(shù)據(jù)分析師必須聚焦于具體的問(wèn)題和場(chǎng)景笔宿,case by case去分析和輸出建議犁钟;而數(shù)據(jù)產(chǎn)品經(jīng)理則關(guān)注可復(fù)用的、擴(kuò)展性和適用性強(qiáng)的泼橘、高效的場(chǎng)景和解決方案)
自動(dòng)發(fā)郵件是一種常見的數(shù)據(jù)產(chǎn)品形式涝动,也廣泛應(yīng)用于各公司的數(shù)據(jù)團(tuán)隊(duì)中。所以一個(gè)比較清晰的流程就是:
- 先爬蟲并寫入數(shù)據(jù)庫(kù)
- 再?gòu)膸?kù)里讀取作數(shù)據(jù)分析炬灭,產(chǎn)生分析報(bào)告
- 最后把分析報(bào)告自動(dòng)發(fā)送至郵箱
說(shuō)起分析報(bào)告醋粟,就不得不提起數(shù)據(jù)可視化。很多業(yè)務(wù)人員覺得可視化只是一種形式,并不影響數(shù)據(jù)和業(yè)務(wù)的本質(zhì)米愿,所以沒(méi)那么重要厦凤。我本來(lái)也是尊重這個(gè)觀點(diǎn)的,可是在這個(gè)case中育苟,也算是得到了一些教訓(xùn)较鼓。
因?yàn)槲也粫?huì)前端技術(shù),也不會(huì)用Python作數(shù)據(jù)可視化(最主要的原因還是沒(méi)啥動(dòng)力學(xué)這些技術(shù))违柏,所以最初發(fā)送至郵件的報(bào)告是很丑的博烂,丑成這樣:
沒(méi)有畫形,甚至表格都對(duì)不齊漱竖,這種報(bào)告可讀性太差禽篱。因?yàn)榭勺x性差,連我自己都逐漸懶得看馍惹;看都不看當(dāng)然更不會(huì)去思考和總結(jié)谆级。可是任務(wù)是我記錄的讼积,數(shù)據(jù)是我采集的肥照,分析也是我做的,代碼都是我自己寫的勤众,如果最后看都不看舆绎,那前面這些工作就沒(méi)多大意義了。
于是轉(zhuǎn)化一下思路:html是保持格式的一種良好的文件格式们颜,也是python自動(dòng)發(fā)郵件程序支持的形式吕朵,所以最好是能直接發(fā)html形式的郵件(就是把html當(dāng)作正文,而不是附件)窥突;自動(dòng)發(fā)郵件程序里輸入的是html源碼努溃,雖然不會(huì)寫html,但是我們可以用更專業(yè)的寫分析報(bào)告的工具r markdown
去生成html文件阻问,然后用python讀取梧税,傳入發(fā)郵件的程序里,就可以直接發(fā)送html格式的郵件了称近!
from send_email_html import *
import os
os.system("e: && cd E:\\R projects\\report_html_email && Rscript -e \"rmarkdown::render('E:/R projects/report_html_email/dida_weekly_report.Rmd',encoding='utf-8',output_dir='E:/Python-Projects/dida_lists')\"")
htmlf=open('dida_weekly_report.html','r',encoding="utf-8")
html=htmlf.read()
send_mail(html,'滴答清單從%s到%s的周報(bào)第队!'%(start_date,end_date),'滴答清單周報(bào)')
通過(guò)以上的代碼,可以在python中調(diào)用shell語(yǔ)句刨秆,去運(yùn)行rmd文件凳谦,生成html文件;然后讀取html文件衡未,將源碼傳入發(fā)郵件函數(shù)中尸执,最后成功發(fā)送郵件家凯。
最后再看看更新之后的郵件自動(dòng)發(fā)送的周報(bào)效果!
現(xiàn)在效果好了很多了如失,就具備了閱讀肆饶、分析、思考和總結(jié)的基礎(chǔ)了岖常!接下來(lái)只需要把爬蟲、分析葫督、發(fā)郵件代碼整合在一起竭鞍,然后上定時(shí)調(diào)度就行(linux上crontab
,windows上schtasks
)橄镜,一般一周采集偎快、分析、報(bào)告一次就行洽胶。
所以在這里晒夹,并沒(méi)有借助多么高大上的軟件產(chǎn)品,而是梳理姊氓、堅(jiān)持一個(gè)清晰丐怯、簡(jiǎn)單、可執(zhí)行翔横、可復(fù)用的流程读跷,并輔以少量的技術(shù),就能構(gòu)建一個(gè)屬于自己禾唁,服務(wù)于自己日常工作生活效览,并有一定指導(dǎo)意義的數(shù)據(jù)產(chǎn)品了。
最后嘛荡短,自律的人生是比較無(wú)趣且疲憊的丐枉,因?yàn)槭裁炊家蓄A(yù)期規(guī)劃,然后去努力執(zhí)行掘托;在這樣的影響之下瘦锹,相對(duì)地就會(huì)有些排斥變故、意外和風(fēng)險(xiǎn)闪盔。不過(guò)人生的大多數(shù)沼本,本來(lái)就是無(wú)趣的;自律有助于自己更加明確锭沟、低方差地朝目標(biāo)前進(jìn)抽兆。然而,正如數(shù)據(jù)本身只能輔助乃至指導(dǎo)業(yè)務(wù)族淮,它只是業(yè)務(wù)的反映辫红,而不是業(yè)務(wù)的本質(zhì)凭涂,業(yè)務(wù)發(fā)展得怎么樣并不直接由數(shù)據(jù)決定。同樣地贴妻,你是一個(gè)什么樣的人(或是崇尚自由多變的切油,或是思維縝密執(zhí)行力強(qiáng)的,或是對(duì)自己足夠狠的名惩,或是做什么都難以堅(jiān)持的)澎胡,也不由一個(gè)產(chǎn)品或一套流程決定的,得由你自己去認(rèn)清并引導(dǎo)好自己的本質(zhì)娩鹉。