在所有的可視化儀表板中,和時間相關的圖表是最常見的。除了最基本的折線圖外烛谊,我們還有很多方式來呈現(xiàn)和分析時間序列的數(shù)據(jù)逐样。
時間序列的模式(Time series patterns)
在開始探查分析前,我們需要先確定時間序列的模式炼列。
常見的模式有:
- 趨勢性(Trend):數(shù)據(jù)隨時間變化的呈整體上升或下降的趨勢。
- 季節(jié)性(Seasonal):數(shù)據(jù)在每年的特定季度、月份刃跛、周、日的數(shù)據(jù)波動苛萎。
- 周期性(Cyclic)數(shù)據(jù)存在不固定頻率的上升和下降時桨昙,表示該序列有周期性,通常與商業(yè)活動有關腌歉。
很多時候時間序列會同時包含趨勢蛙酪、季節(jié)以及周期性。
美國新建房屋銷售額表現(xiàn)出強烈的年度季節(jié)性翘盖,以及周期為6~10年的周期性桂塞。同時數(shù)據(jù)并沒有表現(xiàn)出明顯的趨勢性。
柏林的游客數(shù)據(jù)同時包含了趨勢性與季節(jié)性馍驯,即總的游客數(shù)量是穩(wěn)步上升的阁危,同時又有明顯的季節(jié)性。
為了更清楚的看到季節(jié)性的分布汰瘫,我們可以將多年的數(shù)據(jù)對齊到以月的方式查看欲芹。
時間的粒度/級別
不借助外部儀器,人類的極限反應速度可以到100毫秒吟吝。在科學分析場景菱父,如物理學,時間精度可以更高剑逃。在商業(yè)分析場景浙宜,一般拿到的數(shù)據(jù)粒度會以:年、季度蛹磺、月粟瞬、周、日萤捆、小時 居多裙品。細粒度的時間可以向上聚合到粗粒度的俗批,比如:拿到的是去年每一天的銷售額數(shù)據(jù),但作為年度的總結市怎,只要看每個月的銷售額即可岁忘。
時間的連續(xù)與離散
連續(xù)的時間:
等間距,一個接一個的区匠。如3月1日干像、3月2日、3月3日麻汰、一直到 3月15日每天的數(shù)據(jù)戚篙。如果缺了某幾天的數(shù)據(jù),在時間軸上仍然會保留對應的位置位喂。
離散/序數(shù)的時間:
假設我們想看一周中每天的銷售表現(xiàn)忆某,這時可以從連續(xù)的時間中弃舒,提取出離散的周幾時間來進行分析状原。
在具體分析時颠区,我們一般還會區(qū)分下工作日與周末毕莱,并分別看平均值。
帶著問題去分析
當前相比過去的變化
總結過去,展望未來部服。我們總是希望知道當前相比過去的變化。
以各個地區(qū)在過去幾年銷售額的變化為例奉芦,我們可以看到6個地區(qū)詳細到每個月的銷售額數(shù)據(jù),但當我們想知道相比過去是否有增長或哪個地區(qū)的增長最快時烦却,就沒法看清了减噪。
這個時候车吹,可以通過斜率圖(slopegraphs)來更好的分析與呈現(xiàn),具體做法是只保留頭尾時間的數(shù)據(jù)朝卒,然后用折線圖來呈現(xiàn)抗斤,為了更容易發(fā)現(xiàn)上升下降丈咐,還可以用顏色來區(qū)分棵逊。
某個時間點前后的比較
從假設分析(What-If Analysis)的角度辆影,我們會關心如果在某個時間點做了某個行動所帶來的收益。
以買房為例锯蛀,我們會關心如果我在某個時間點買了房旁涤,那么截止到當前的漲幅變化迫像,以及相比更早的時間的變化侵蒙。
這個是紐約的房價變化圖造虎,如果在2012年買入,那么到了2017時纷闺,會有21%的漲幅份蝴。而如果是在2006年的高點購入,則只有6%的漲幅氓轰。在做這樣的假設分析時,我們一般會允許用戶指定時間參數(shù)署鸡,以更靈活的分析前后的變化案糙。
如何查看排名變化
相比過程本身,人們更容易關注結果靴庆。
假設我們有不同類別的商品在銷售,每年的銷售額穩(wěn)步上升炉抒,除了關心具體的收入外奢讨,我們還想知道各個類別的排名變化焰薄。如果通過顏色來細分各個類別的銷售額拿诸,雖然也可以看出一些排名變化塞茅,但還是會不直觀。
這時我們可以先計算每年的銷售額排名啊掏,然后用排名變化圖(Bump Chart)來呈現(xiàn)。相比銷售額隨時間的大幅波動衰猛,排名變化圖可以讓你更好的聚焦于關心的點娜睛。
不同事件的增長速度
以玩具總動員三部曲為例,這3部電影發(fā)行于不同的年份卦睹,也都獲得了很高的收入畦戒。
如果只看累計的票房收入,我們可以知道第二部的表現(xiàn)最好结序。但如果我們想知道這幾部電影從首映日開始的增長變化或火爆程度就沒法看出了障斋。
從這個圖上我們可以按周看發(fā)生在不同年份的,三部曲的每周票房收入。
更好的方式把時間對齊到一個公共基準點來查看分析垃环,而不是查看一段絕對時間范圍的數(shù)據(jù)邀层。按星期看自首映日開始的總收入,就更容易比較增長曲線了遂庄。
如何分析事件的持續(xù)時間
在項目管理的場景寥院,一個項目會拆分為多個可以并行或有前后依賴關系的任務。
為了查看總的用時涛目,以及同時進行的任務秸谢,我們可以用甘特圖(Gantt charts)來呈現(xiàn)和分析。這兒的205天是整個項目的用時霹肝。如果要算人天成本估蹄,可以把這兒的每個任務的用時加起來,即投入了4個人阿迈,總的人天是:292元媚。