數(shù)據(jù)新聞只是新聞報道中的一種形式,彌補傳統(tǒng)新聞或敘事性新聞無法呈現(xiàn)的效果。數(shù)據(jù)新聞采用可視化的方法將單調(diào)的數(shù)據(jù)用一種直觀撮奏、便于理解和更具說服力的方法呈獻給讀者。數(shù)據(jù)当宴,特別是大量的數(shù)據(jù)比采訪幾十個對象獲取的抽樣信息做出的結(jié)論更客觀畜吊、更容易闡明觀點。從數(shù)據(jù)新聞制作的人才需求開始介紹户矢,闡明技術(shù)要求和制作流程玲献。
人才需求
數(shù)據(jù)新聞團隊一般包含四種角色:記者和編輯、數(shù)據(jù)分析師梯浪、美術(shù)設(shè)計師和程序設(shè)計師捌年。根據(jù)數(shù)據(jù)新聞項目工作量的大小,一個團隊可能有2~3個人挂洛,也可能更多礼预。很多時候一個人需要分飾兩個或多個角色,如一個人既是數(shù)據(jù)分析師虏劲,也是程序設(shè)計師托酸,或者一個記者褒颈,同時也是數(shù)據(jù)分析師。記者和編輯的主要工作是采訪励堡、寫稿谷丸、編稿,以及整理相關(guān)資源念秧,如與新聞相關(guān)的背景資料淤井、圖片、視頻摊趾、音頻和文字等币狠。數(shù)據(jù)分析師的主要工作是收集和分析數(shù)據(jù)。
美術(shù)設(shè)計師的主要工作是設(shè)計圖案砾层,包括手繪圖案漩绵、3D制作、圖片設(shè)計和排版等肛炮。使用的主要工具是Photoshop和Illustrator等止吐。程序設(shè)計師的主要工作是編寫代碼,實現(xiàn)數(shù)據(jù)獲取和分析侨糟、數(shù)據(jù)可視化等碍扔。常見的編程工具有HTML、Python秕重、R不同、SQL和D3.js等。實際上溶耘,除了數(shù)據(jù)新聞團隊四個主要角色的工作外二拐,還有視頻剪輯、音頻剪輯等輔助工作需要完成凳兵。
技術(shù)需要
1.數(shù)據(jù)新聞制作入門級工具
圖片百新、音頻和視頻編輯工具。 數(shù)據(jù)新聞中往往包含多媒體信息庐扫,對新聞圖片處理的常用操作包括裁剪照片饭望;加光和減光,即將照片的局部加黑或增亮形庭;修掉照片上由于洗印杰妓、掃描、打印而產(chǎn)生的污點碘勉;改變照片的反差;對照片的局部進行漂白桩卵、清除刮花痕跡等验靡。圖片編輯最常用的工具是Photoshop倍宾。對新聞音頻的常用操作包括修改采樣率、增強與減弱音量胜嗓、制作淡入和淡出效果高职、降噪、錄音辞州、從視頻中提取音頻素材怔锌、聲音特效、聲音合成和導出等变过。音頻編輯最常用的工具是audacity和Audition埃元,前者免費而且更容易上手。新聞視頻的常用操作包括素材的采集與導入媚狰、編輯素材岛杀、制作簡單特效、添加字幕崭孤、混合音頻类嗤、輸出與生成等。視頻編輯最常用的工具是Premiere和Final Cut Pro辨宠。
數(shù)據(jù)分析工具Excel遗锣。Excel是所有數(shù)據(jù)新聞工作者必須掌握的一個入門級數(shù)據(jù)分析工具。它用于對數(shù)據(jù)做簡單的清理嗤形,如使用函數(shù)精偿、分類匯總清理重復記錄(案例參見本書3.6.1小節(jié)“查找重復記錄”) ,使用函數(shù)刪除多余空格派殷、轉(zhuǎn)換數(shù)據(jù)類型等还最,使用分類匯總、排序毡惜、數(shù)據(jù)透視表等完成初步數(shù)據(jù)分析拓轻。
可視化工具Tableau。Tableau是一個數(shù)據(jù)發(fā)現(xiàn)经伙、數(shù)據(jù)分析和數(shù)據(jù)敘事的數(shù)據(jù)可視化平臺扶叉,是數(shù)據(jù)新聞工作者的入門可視化工具。Tableau將數(shù)據(jù)運算與美觀的圖表完美地結(jié)合在一起帕膜。它方便地實現(xiàn)了數(shù)據(jù)連接枣氧,無需編程就可以創(chuàng)建地圖、條形圖垮刹、散點圖和其他圖形达吞,還可以制作數(shù)據(jù)地圖等。
可視化工具Datawrapper荒典。Datawrapper是一個在線工具酪劫,它可以幫助用戶創(chuàng)建交互式數(shù)據(jù)可視化吞鸭。這是一個開源工具,能在幾分鐘內(nèi)創(chuàng)建可嵌入的圖標覆糟。因為它是開源的刻剥,任何人都可以貢獻代碼,軟件會不斷改進滩字。它還包含一個非常棒的圖表庫造虏,可以查看其他人使用Datawrapper完成的作品。
2.數(shù)據(jù)新聞制作高級工具
爬蟲編寫工具Python麦箍。Python是一種面向?qū)ο罄炫骸⒄Z法簡潔、大小寫敏感的解釋型計算機程序設(shè)計語言内列。它完全免費撵术,簡單易學。如果完成同一個任務话瞧,假設(shè)用C語言要編寫1000行代碼嫩与,用Java可能只需要編寫100行,而用Python可能只需要編寫20行交排。讀者可以到官方網(wǎng)站1下載程序并安裝划滋,有很多文檔資源也可以在官方網(wǎng)站上找到。制作數(shù)據(jù)新聞時經(jīng)常使用Python語言編寫爬蟲程序埃篓,從其他網(wǎng)站抓取數(shù)據(jù)处坪。
數(shù)據(jù)分析工具SPSS。SPSS(Statistical Product and Service Solutions)是世界上最早的統(tǒng)計分析軟件之一架专,它是一個專業(yè)級的統(tǒng)計分析同窘、數(shù)據(jù)挖掘、預測分析和決策支持任務的軟件產(chǎn)品部脚。數(shù)據(jù)新聞制作中經(jīng)常使用SPSS實現(xiàn)專業(yè)級統(tǒng)計分析和統(tǒng)計圖標想邦。有時候獲取的數(shù)據(jù)存在亂碼,導入SPSS中再導出即可完美解決該問題委刘。例如丧没,本書2.5.4小節(jié)“結(jié)構(gòu)化信息表格化”中使用import.io下載抓取CSV的文件有亂碼,就可以用上述方法解決锡移。
數(shù)據(jù)分析工具R語言呕童。R語言是用于統(tǒng)計分析、繪圖的語言和操作環(huán)境淆珊。R語言屬于GNU系統(tǒng)夺饲,是完全免費而且源代碼開放的軟件,數(shù)據(jù)新聞制作時經(jīng)常使用R語言進行統(tǒng)計計算、數(shù)據(jù)分析和統(tǒng)計制圖往声。
數(shù)據(jù)可視化工具D3.js茫蛹。JavaScript是一種直譯式腳本語言,而D3.js是一個JavaScript庫烁挟,可以通過數(shù)據(jù)來操作文檔。D3.js通過使用HTML骨坑、SVG和CSS把數(shù)據(jù)鮮活撼嗓、形象地展現(xiàn)出來。D3.js嚴格遵循Web標準欢唾,所以其開發(fā)的程序兼容主流瀏覽器且警。數(shù)據(jù)新聞制作時經(jīng)常使用D3.js編寫代碼,實現(xiàn)在網(wǎng)絡(luò)上呈現(xiàn)數(shù)據(jù)的可視化效果礁遣,如使用D3.js制作動態(tài)圖表和漂亮的動態(tài)網(wǎng)頁地圖等斑芜。學習D3.js對非IT人士的確是個挑戰(zhàn),但ECharts2完美地解決了這個問題祟霍。ECharts開源來自百度商業(yè)前端數(shù)據(jù)可視化團隊杏头,基于HTML5 Canvas杈笔,是一個純JavaScript圖表庫办龄,提供直觀、生動搁吓、可交互崭添、可個性化定制的數(shù)據(jù)可視化圖表寓娩。
制作流程
傳統(tǒng)新聞制作中更多地體現(xiàn)了記者和編輯、數(shù)據(jù)分析師呼渣、美術(shù)設(shè)計師和程序設(shè)計師的上下游關(guān)系棘伴,常見的制作流程是:記者首先采訪寫稿,然后編輯編稿屁置,美術(shù)設(shè)計師排版配圖焊夸,最后程序設(shè)計師將作品發(fā)布到網(wǎng)站上。整個制作過程中美術(shù)設(shè)計師和程序設(shè)計師的參與感相對較差缰犁,沒有參與開始的選題階段的工作淳地,導致對作品的了解不是非常全面,理解不到位帅容,從某種角度上來說颇象,可能影響了作品的最后呈現(xiàn)效果。
目前各大媒體也都致力于組建自己的數(shù)字新聞團隊并徘。每個團隊制作數(shù)據(jù)新聞的具體流程也各有不同遣钳,但基本流程是一致的。
在數(shù)據(jù)新聞制作中麦乞,記者和編輯蕴茴、數(shù)據(jù)分析師劝评、美術(shù)設(shè)計師和程序設(shè)計師從選題階段開始就組成了一個團隊, 共同從各自的專長探討一個新聞點是否適合做數(shù)據(jù)新聞倦淀、 時間或經(jīng)濟成本是否可行蒋畜。
記者和編輯重點考慮新聞價值。數(shù)據(jù)分析師重點考慮數(shù)據(jù)是否可以獲茸策础姻成;采用何種工具爬取數(shù)據(jù),用Python還是import.io愿棋;數(shù)據(jù)分析采用何種工具科展;數(shù)據(jù)分析的時間成本等。美術(shù)設(shè)計師重點考慮如何手繪圖稿及如何排版等糠雨。程序設(shè)計師重點考慮如何可視化呈現(xiàn)才睹。這種反復的討論,使團隊中的全體成員參與感強甘邀,有成就感琅攘。
大多數(shù)情況下,數(shù)據(jù)新聞制作時采用“項目”的方式鹃答,即一個數(shù)據(jù)新聞制作團隊包含多個項目組乎澄,并不是每位成員專屬于某一個項目組。很多時候测摔,多個數(shù)據(jù)新聞項目同時工作置济,很可能一位成員既屬于A項目組,又屬于B項目組锋八。目前浙于,我國的數(shù)據(jù)新聞制作團隊往往不會包含太多的成員,以財新數(shù)據(jù)可視化實驗室1為例挟纱,團隊成員不足20人羞酗。數(shù)據(jù)新聞在近幾年成為行業(yè)的研究熱點,單個記者通過再學習紊服,掌握相應的技能后檀轨,也可以成為個人數(shù)據(jù)新聞團隊,即通過個人力量收集數(shù)據(jù)欺嗤、分析整理數(shù)據(jù)参萄,可視化呈現(xiàn),完成數(shù)據(jù)新聞作品煎饼。但從時間成本考慮讹挎,多人組成的團隊在數(shù)據(jù)新聞制作中更有競爭力。
數(shù)據(jù)新聞團隊中的四種角色都非常重要,缺一不可筒溃。例如马篮,數(shù)據(jù)新聞的選題也不一定都是記者和編輯提出的,有時候數(shù)據(jù)分析師在對感興趣的數(shù)據(jù)進行分析時怜奖,也會發(fā)現(xiàn)值得做的新聞點浑测。數(shù)據(jù)新聞的選題也不一定均出自團隊內(nèi)部,有時候是根據(jù)其他記者和編輯提出的外包要求歪玲,通過已有的資料實現(xiàn)數(shù)據(jù)可視化尽爆。
數(shù)據(jù)的獲取可能來自于記者和編輯,特別是條線記者读慎,也可能來源于程序設(shè)計師編寫的代碼,如用Python編寫的爬蟲程序槐雾,還可能來自于數(shù)據(jù)分析師的經(jīng)驗(數(shù)據(jù)分析師更容易了解數(shù)據(jù)獲取的網(wǎng)站) 夭委,團隊里的每個角色都可能從不同的平臺、角度獲取到合適的數(shù)據(jù)募强。
數(shù)據(jù)分析工作也不一定完全由數(shù)據(jù)分析師完成株灸,程序設(shè)計師、記者和編輯也可能會幫忙擎值。
美術(shù)設(shè)計工作需要有一定的美學基礎(chǔ)慌烧,其工作具有一定的特殊性,但記者和編輯更容易從受眾的角度給出中肯的設(shè)計建議鸠儿。數(shù)據(jù)分析師也可以從數(shù)據(jù)量的角度提出一些設(shè)計要求屹蚊,如圖片顯示大小等。
數(shù)據(jù)新聞制作團隊的合作精神是非常重要的进每,現(xiàn)在也提倡在團隊中一人分飾多個角色汹粤,降低溝通成本。
(本文節(jié)選于《數(shù)據(jù)新聞實戰(zhàn)》)