數(shù)據(jù)新聞制作之秘笈

數(shù)據(jù)新聞只是新聞報道中的一種形式,彌補傳統(tǒng)新聞或敘事性新聞無法呈現(xiàn)的效果。數(shù)據(jù)新聞采用可視化的方法將單調(diào)的數(shù)據(jù)用一種直觀撮奏、便于理解和更具說服力的方法呈獻給讀者。數(shù)據(jù)当宴,特別是大量的數(shù)據(jù)比采訪幾十個對象獲取的抽樣信息做出的結(jié)論更客觀畜吊、更容易闡明觀點。從數(shù)據(jù)新聞制作的人才需求開始介紹户矢,闡明技術(shù)要求和制作流程玲献。

人才需求

數(shù)據(jù)新聞團隊一般包含四種角色:記者和編輯、數(shù)據(jù)分析師梯浪、美術(shù)設(shè)計師和程序設(shè)計師捌年。根據(jù)數(shù)據(jù)新聞項目工作量的大小,一個團隊可能有2~3個人挂洛,也可能更多礼预。很多時候一個人需要分飾兩個或多個角色,如一個人既是數(shù)據(jù)分析師虏劲,也是程序設(shè)計師托酸,或者一個記者褒颈,同時也是數(shù)據(jù)分析師。記者和編輯的主要工作是采訪励堡、寫稿谷丸、編稿,以及整理相關(guān)資源念秧,如與新聞相關(guān)的背景資料淤井、圖片、視頻摊趾、音頻和文字等币狠。數(shù)據(jù)分析師的主要工作是收集和分析數(shù)據(jù)。

美術(shù)設(shè)計師的主要工作是設(shè)計圖案砾层,包括手繪圖案漩绵、3D制作、圖片設(shè)計和排版等肛炮。使用的主要工具是Photoshop和Illustrator等止吐。程序設(shè)計師的主要工作是編寫代碼,實現(xiàn)數(shù)據(jù)獲取和分析侨糟、數(shù)據(jù)可視化等碍扔。常見的編程工具有HTML、Python秕重、R不同、SQL和D3.js等。實際上溶耘,除了數(shù)據(jù)新聞團隊四個主要角色的工作外二拐,還有視頻剪輯、音頻剪輯等輔助工作需要完成凳兵。

技術(shù)需要

1.數(shù)據(jù)新聞制作入門級工具

圖片百新、音頻和視頻編輯工具。 數(shù)據(jù)新聞中往往包含多媒體信息庐扫,對新聞圖片處理的常用操作包括裁剪照片饭望;加光和減光,即將照片的局部加黑或增亮形庭;修掉照片上由于洗印杰妓、掃描、打印而產(chǎn)生的污點碘勉;改變照片的反差;對照片的局部進行漂白桩卵、清除刮花痕跡等验靡。圖片編輯最常用的工具是Photoshop倍宾。對新聞音頻的常用操作包括修改采樣率、增強與減弱音量胜嗓、制作淡入和淡出效果高职、降噪、錄音辞州、從視頻中提取音頻素材怔锌、聲音特效、聲音合成和導出等变过。音頻編輯最常用的工具是audacity和Audition埃元,前者免費而且更容易上手。新聞視頻的常用操作包括素材的采集與導入媚狰、編輯素材岛杀、制作簡單特效、添加字幕崭孤、混合音頻类嗤、輸出與生成等。視頻編輯最常用的工具是Premiere和Final Cut Pro辨宠。

數(shù)據(jù)分析工具Excel遗锣。Excel是所有數(shù)據(jù)新聞工作者必須掌握的一個入門級數(shù)據(jù)分析工具。它用于對數(shù)據(jù)做簡單的清理嗤形,如使用函數(shù)精偿、分類匯總清理重復記錄(案例參見本書3.6.1小節(jié)“查找重復記錄”) ,使用函數(shù)刪除多余空格派殷、轉(zhuǎn)換數(shù)據(jù)類型等还最,使用分類匯總、排序毡惜、數(shù)據(jù)透視表等完成初步數(shù)據(jù)分析拓轻。

可視化工具Tableau。Tableau是一個數(shù)據(jù)發(fā)現(xiàn)经伙、數(shù)據(jù)分析和數(shù)據(jù)敘事的數(shù)據(jù)可視化平臺扶叉,是數(shù)據(jù)新聞工作者的入門可視化工具。Tableau將數(shù)據(jù)運算與美觀的圖表完美地結(jié)合在一起帕膜。它方便地實現(xiàn)了數(shù)據(jù)連接枣氧,無需編程就可以創(chuàng)建地圖、條形圖垮刹、散點圖和其他圖形达吞,還可以制作數(shù)據(jù)地圖等。

可視化工具Datawrapper荒典。Datawrapper是一個在線工具酪劫,它可以幫助用戶創(chuàng)建交互式數(shù)據(jù)可視化吞鸭。這是一個開源工具,能在幾分鐘內(nèi)創(chuàng)建可嵌入的圖標覆糟。因為它是開源的刻剥,任何人都可以貢獻代碼,軟件會不斷改進滩字。它還包含一個非常棒的圖表庫造虏,可以查看其他人使用Datawrapper完成的作品。

2.數(shù)據(jù)新聞制作高級工具

爬蟲編寫工具Python麦箍。Python是一種面向?qū)ο罄炫骸⒄Z法簡潔、大小寫敏感的解釋型計算機程序設(shè)計語言内列。它完全免費撵术,簡單易學。如果完成同一個任務话瞧,假設(shè)用C語言要編寫1000行代碼嫩与,用Java可能只需要編寫100行,而用Python可能只需要編寫20行交排。讀者可以到官方網(wǎng)站1下載程序并安裝划滋,有很多文檔資源也可以在官方網(wǎng)站上找到。制作數(shù)據(jù)新聞時經(jīng)常使用Python語言編寫爬蟲程序埃篓,從其他網(wǎng)站抓取數(shù)據(jù)处坪。

數(shù)據(jù)分析工具SPSS。SPSS(Statistical Product and Service Solutions)是世界上最早的統(tǒng)計分析軟件之一架专,它是一個專業(yè)級的統(tǒng)計分析同窘、數(shù)據(jù)挖掘、預測分析和決策支持任務的軟件產(chǎn)品部脚。數(shù)據(jù)新聞制作中經(jīng)常使用SPSS實現(xiàn)專業(yè)級統(tǒng)計分析和統(tǒng)計圖標想邦。有時候獲取的數(shù)據(jù)存在亂碼,導入SPSS中再導出即可完美解決該問題委刘。例如丧没,本書2.5.4小節(jié)“結(jié)構(gòu)化信息表格化”中使用import.io下載抓取CSV的文件有亂碼,就可以用上述方法解決锡移。

數(shù)據(jù)分析工具R語言呕童。R語言是用于統(tǒng)計分析、繪圖的語言和操作環(huán)境淆珊。R語言屬于GNU系統(tǒng)夺饲,是完全免費而且源代碼開放的軟件,數(shù)據(jù)新聞制作時經(jīng)常使用R語言進行統(tǒng)計計算、數(shù)據(jù)分析和統(tǒng)計制圖往声。

數(shù)據(jù)可視化工具D3.js茫蛹。JavaScript是一種直譯式腳本語言,而D3.js是一個JavaScript庫烁挟,可以通過數(shù)據(jù)來操作文檔。D3.js通過使用HTML骨坑、SVG和CSS把數(shù)據(jù)鮮活撼嗓、形象地展現(xiàn)出來。D3.js嚴格遵循Web標準欢唾,所以其開發(fā)的程序兼容主流瀏覽器且警。數(shù)據(jù)新聞制作時經(jīng)常使用D3.js編寫代碼,實現(xiàn)在網(wǎng)絡(luò)上呈現(xiàn)數(shù)據(jù)的可視化效果礁遣,如使用D3.js制作動態(tài)圖表和漂亮的動態(tài)網(wǎng)頁地圖等斑芜。學習D3.js對非IT人士的確是個挑戰(zhàn),但ECharts2完美地解決了這個問題祟霍。ECharts開源來自百度商業(yè)前端數(shù)據(jù)可視化團隊杏头,基于HTML5 Canvas杈笔,是一個純JavaScript圖表庫办龄,提供直觀、生動搁吓、可交互崭添、可個性化定制的數(shù)據(jù)可視化圖表寓娩。

制作流程

傳統(tǒng)新聞制作中更多地體現(xiàn)了記者和編輯、數(shù)據(jù)分析師呼渣、美術(shù)設(shè)計師和程序設(shè)計師的上下游關(guān)系棘伴,常見的制作流程是:記者首先采訪寫稿,然后編輯編稿屁置,美術(shù)設(shè)計師排版配圖焊夸,最后程序設(shè)計師將作品發(fā)布到網(wǎng)站上。整個制作過程中美術(shù)設(shè)計師和程序設(shè)計師的參與感相對較差缰犁,沒有參與開始的選題階段的工作淳地,導致對作品的了解不是非常全面,理解不到位帅容,從某種角度上來說颇象,可能影響了作品的最后呈現(xiàn)效果。

目前各大媒體也都致力于組建自己的數(shù)字新聞團隊并徘。每個團隊制作數(shù)據(jù)新聞的具體流程也各有不同遣钳,但基本流程是一致的。

在數(shù)據(jù)新聞制作中麦乞,記者和編輯蕴茴、數(shù)據(jù)分析師劝评、美術(shù)設(shè)計師和程序設(shè)計師從選題階段開始就組成了一個團隊, 共同從各自的專長探討一個新聞點是否適合做數(shù)據(jù)新聞倦淀、 時間或經(jīng)濟成本是否可行蒋畜。

記者和編輯重點考慮新聞價值。數(shù)據(jù)分析師重點考慮數(shù)據(jù)是否可以獲茸策础姻成;采用何種工具爬取數(shù)據(jù),用Python還是import.io愿棋;數(shù)據(jù)分析采用何種工具科展;數(shù)據(jù)分析的時間成本等。美術(shù)設(shè)計師重點考慮如何手繪圖稿及如何排版等糠雨。程序設(shè)計師重點考慮如何可視化呈現(xiàn)才睹。這種反復的討論,使團隊中的全體成員參與感強甘邀,有成就感琅攘。

大多數(shù)情況下,數(shù)據(jù)新聞制作時采用“項目”的方式鹃答,即一個數(shù)據(jù)新聞制作團隊包含多個項目組乎澄,并不是每位成員專屬于某一個項目組。很多時候测摔,多個數(shù)據(jù)新聞項目同時工作置济,很可能一位成員既屬于A項目組,又屬于B項目組锋八。目前浙于,我國的數(shù)據(jù)新聞制作團隊往往不會包含太多的成員,以財新數(shù)據(jù)可視化實驗室1為例挟纱,團隊成員不足20人羞酗。數(shù)據(jù)新聞在近幾年成為行業(yè)的研究熱點,單個記者通過再學習紊服,掌握相應的技能后檀轨,也可以成為個人數(shù)據(jù)新聞團隊,即通過個人力量收集數(shù)據(jù)欺嗤、分析整理數(shù)據(jù)参萄,可視化呈現(xiàn),完成數(shù)據(jù)新聞作品煎饼。但從時間成本考慮讹挎,多人組成的團隊在數(shù)據(jù)新聞制作中更有競爭力。

數(shù)據(jù)新聞團隊中的四種角色都非常重要,缺一不可筒溃。例如马篮,數(shù)據(jù)新聞的選題也不一定都是記者和編輯提出的,有時候數(shù)據(jù)分析師在對感興趣的數(shù)據(jù)進行分析時怜奖,也會發(fā)現(xiàn)值得做的新聞點浑测。數(shù)據(jù)新聞的選題也不一定均出自團隊內(nèi)部,有時候是根據(jù)其他記者和編輯提出的外包要求歪玲,通過已有的資料實現(xiàn)數(shù)據(jù)可視化尽爆。

數(shù)據(jù)的獲取可能來自于記者和編輯,特別是條線記者读慎,也可能來源于程序設(shè)計師編寫的代碼,如用Python編寫的爬蟲程序槐雾,還可能來自于數(shù)據(jù)分析師的經(jīng)驗(數(shù)據(jù)分析師更容易了解數(shù)據(jù)獲取的網(wǎng)站) 夭委,團隊里的每個角色都可能從不同的平臺、角度獲取到合適的數(shù)據(jù)募强。

數(shù)據(jù)分析工作也不一定完全由數(shù)據(jù)分析師完成株灸,程序設(shè)計師、記者和編輯也可能會幫忙擎值。

美術(shù)設(shè)計工作需要有一定的美學基礎(chǔ)慌烧,其工作具有一定的特殊性,但記者和編輯更容易從受眾的角度給出中肯的設(shè)計建議鸠儿。數(shù)據(jù)分析師也可以從數(shù)據(jù)量的角度提出一些設(shè)計要求屹蚊,如圖片顯示大小等。

數(shù)據(jù)新聞制作團隊的合作精神是非常重要的进每,現(xiàn)在也提倡在團隊中一人分飾多個角色汹粤,降低溝通成本。

(本文節(jié)選于《數(shù)據(jù)新聞實戰(zhàn)》)


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末田晚,一起剝皮案震驚了整個濱河市嘱兼,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌贤徒,老刑警劉巖芹壕,帶你破解...
    沈念sama閱讀 216,692評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異接奈,居然都是意外死亡踢涌,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,482評論 3 392
  • 文/潘曉璐 我一進店門鲫趁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來斯嚎,“玉大人,你說我怎么就攤上這事”てВ” “怎么了糠惫?”我有些...
    開封第一講書人閱讀 162,995評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長钉疫。 經(jīng)常有香客問我硼讽,道長,這世上最難降的妖魔是什么牲阁? 我笑而不...
    開封第一講書人閱讀 58,223評論 1 292
  • 正文 為了忘掉前任固阁,我火速辦了婚禮,結(jié)果婚禮上城菊,老公的妹妹穿的比我還像新娘备燃。我一直安慰自己,他們只是感情好凌唬,可當我...
    茶點故事閱讀 67,245評論 6 388
  • 文/花漫 我一把揭開白布并齐。 她就那樣靜靜地躺著,像睡著了一般客税。 火紅的嫁衣襯著肌膚如雪况褪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,208評論 1 299
  • 那天更耻,我揣著相機與錄音测垛,去河邊找鬼。 笑死秧均,一個胖子當著我的面吹牛食侮,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播目胡,決...
    沈念sama閱讀 40,091評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼疙描,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了讶隐?” 一聲冷哼從身側(cè)響起起胰,我...
    開封第一講書人閱讀 38,929評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎巫延,沒想到半個月后效五,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,346評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡炉峰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,570評論 2 333
  • 正文 我和宋清朗相戀三年畏妖,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片疼阔。...
    茶點故事閱讀 39,739評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡戒劫,死狀恐怖半夷,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情迅细,我是刑警寧澤巫橄,帶...
    沈念sama閱讀 35,437評論 5 344
  • 正文 年R本政府宣布,位于F島的核電站茵典,受9級特大地震影響湘换,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜统阿,卻給世界環(huán)境...
    茶點故事閱讀 41,037評論 3 326
  • 文/蒙蒙 一彩倚、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧扶平,春花似錦帆离、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,677評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至概而,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間囱修,已是汗流浹背赎瑰。 一陣腳步聲響...
    開封第一講書人閱讀 32,833評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留破镰,地道東北人餐曼。 一個月前我還...
    沈念sama閱讀 47,760評論 2 369
  • 正文 我出身青樓,卻偏偏與公主長得像鲜漩,于是被迫代替她去往敵國和親源譬。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,647評論 2 354

推薦閱讀更多精彩內(nèi)容