聚焦信息技術(shù)領(lǐng)域 為產(chǎn)業(yè)發(fā)聲
導(dǎo)讀
近年,大數(shù)據(jù)與人工智能的發(fā)展如火如荼,可視化作為連接人與數(shù)據(jù)的橋梁咪辱,迎來(lái)了又一波榮景。關(guān)于可視化椎组,它在國(guó)內(nèi)外的起源有何不同油狂?國(guó)內(nèi)外在可視化研究上的思路與應(yīng)用又有何不同?未來(lái)寸癌,可視化與可是分析是否會(huì)因人工智能發(fā)展逐漸完備而逐漸消失专筷?就此,中國(guó)圖象圖形學(xué)學(xué)會(huì)可視化與可視分析專(zhuān)委會(huì)與九州連線聯(lián)合推出“可視化百人談”蒸苇,對(duì)可視化領(lǐng)域的內(nèi)容及成果進(jìn)行專(zhuān)訪磷蛹,以下為九州連線采訪世界知名可視化專(zhuān)家、悉尼大學(xué)信息技術(shù)學(xué)院Peter Eades教授的采訪實(shí)錄(文末附最新觀點(diǎn)):
Peter Eades:悉尼大學(xué)信息技術(shù)學(xué)院榮休教授溪烤,于1978年澳大利亞國(guó)立大學(xué)獲得博士學(xué)位味咳,以研究圖繪制而聞名。
數(shù)據(jù)應(yīng)用催生可視化
九州連線:您當(dāng)初為什么進(jìn)入可視化領(lǐng)域檬嘀?
Peter Eades :我最開(kāi)始接觸可視化是因?yàn)橛挟a(chǎn)業(yè)需求槽驶。當(dāng)時(shí)澳大利亞的兩個(gè)大公司,其中一個(gè)是礦業(yè)公司鸳兽,他們想讓我繪制從上到下的公司組織架構(gòu)圖掂铐。另一個(gè)公司是澳大利亞的TELSTRA公司(澳大利亞電信)。他們想在一張大紙上畫(huà)一個(gè)圖贸铜,顯示通訊過(guò)程堡纬。希望在這個(gè)圖里顯示出能幫助他們找出規(guī)律的信息,幫助下一步?jīng)Q策蒿秦,啟發(fā)商業(yè)思考烤镐。
不過(guò),當(dāng)時(shí)我們接觸的可視化更多地是二維的圖」鞅睿現(xiàn)在的學(xué)生炮叶,他們?cè)谧隹梢暬瘯r(shí)有非常大的數(shù)據(jù)碗旅,甚至高維數(shù)據(jù),在顏色要求镜悉、大小比例上更復(fù)雜一些祟辟。
九州連線:像您之前做可視化是先從應(yīng)用著手,而現(xiàn)在的學(xué)生只能從數(shù)據(jù)入手侣肄。這對(duì)現(xiàn)在的學(xué)生而言旧困,做可視化似乎變得更困難了。
Peter Eades :雖然現(xiàn)在的數(shù)據(jù)量看起來(lái)很多稼锅,但是那時(shí)候并沒(méi)有能用的工具吼具,可能都是用手畫(huà)的,一切需要從頭開(kāi)始矩距。而現(xiàn)在的學(xué)生可以用很多的工具幫助他們一起完成拗盒,做可視化也并沒(méi)用那么難。
九州連線:您在做可視化過(guò)程中有哪些特別有意思的事锥债?
Peter Eades :有意思的是我認(rèn)為可以把可視化當(dāng)做玩具來(lái)做陡蝇,它可以顯示在不同的形式上。當(dāng)時(shí)我做的可視化不是顯示在手機(jī)屏幕上哮肚,而是鞋子或者沙發(fā)上登夫,這時(shí)候會(huì)覺(jué)得非常有趣。
九州連線:您目前更多地在做圖可視化绽左,這不免涉及到可視化工作的評(píng)價(jià)悼嫉。如何評(píng)價(jià)一個(gè)可視化工作的好壞艇潭?它的評(píng)價(jià)標(biāo)準(zhǔn)是怎樣的拼窥?
Peter Eades :首先從科學(xué)的推理角度對(duì)可視化進(jìn)行評(píng)價(jià),要考慮可視化對(duì)于數(shù)據(jù)是否真實(shí)對(duì)應(yīng)蹋凝。其次鲁纠,評(píng)價(jià)是一個(gè)相對(duì)比較難的問(wèn)題,比如在圖的繪制里鳍寂,可以用邊交叉的方式進(jìn)行改含,對(duì)于大的圖而言,大家并沒(méi)有一些公用的標(biāo)準(zhǔn)迄汛。所以如何科學(xué)地評(píng)價(jià)標(biāo)準(zhǔn)捍壤,是需要我們持續(xù)做的事。
國(guó)外數(shù)據(jù)分析以理論驅(qū)動(dòng)為主
九州連線:國(guó)內(nèi)外在做可視化上是否存在一些步驟鞍爱、程序或者思維上的差異鹃觉?
Peter Eades :國(guó)內(nèi)外的差異在于數(shù)據(jù)驅(qū)動(dòng)和理論驅(qū)動(dòng)。國(guó)際上理論驅(qū)動(dòng)的多睹逃,而中國(guó)數(shù)據(jù)驅(qū)動(dòng)的多一點(diǎn)盗扇,當(dāng)然這也不是壞事祷肯。數(shù)據(jù)驅(qū)動(dòng)的可以吸引更多工業(yè)界的投入,激發(fā)人們?cè)趹?yīng)用上的思考疗隶。我看到中國(guó)的可視化工作不僅有很多高質(zhì)量工作佑笋,也有很多亮點(diǎn)。
九州連線:您認(rèn)為中國(guó)是否需要將可視化當(dāng)做一個(gè)單獨(dú)的學(xué)科斑鼻?
Peter Eades :可視化里邊包括很多其他的學(xué)科蒋纬,比如數(shù)學(xué)、算法坚弱、計(jì)算機(jī)圖形颠锉、藝術(shù)等,我個(gè)人認(rèn)為視情況分析史汗。在中國(guó)有不少研究組琼掠,這些成員來(lái)自不同領(lǐng)域,他們?cè)谝黄鸸ぷ魍W玻热缃淌诳梢蕴?hào)召很多學(xué)生一起做研究瓷蛙;但是國(guó)外不是這樣的,國(guó)外很難建設(shè)一個(gè)跨學(xué)科建設(shè)的小組戈毒。因此艰猬,這時(shí)候有一個(gè)單獨(dú)的學(xué)科更容易進(jìn)行下一步的研究。
九州連線:談到可視分析埋市,它和通常的大數(shù)據(jù)分析有哪些異同冠桃?
Peter Eades :人的因素在可視分析里起到的作用更大,但是在其他的大數(shù)據(jù)分析里道宅,人的因素很少食听,因?yàn)榇髷?shù)據(jù)分析更多的用來(lái)統(tǒng)計(jì)數(shù)據(jù)。
人工智能并不能取代可視分析
九州連線:國(guó)外企業(yè)界對(duì)于可視化的接受程度如何污茵?
Peter Eades :可視化有兩種:一種是展現(xiàn)樱报,幫助人們理解東西,從而作為交流的工具泞当;另一種是用可視化探索迹蛤、發(fā)現(xiàn)未知的規(guī)律。馬云襟士、馬化騰盗飒、李彥宏等這個(gè)大咖都是在互聯(lián)網(wǎng)當(dāng)中取得了巨大的成功,同時(shí)他們也給大眾創(chuàng)業(yè)陋桂、萬(wàn)眾創(chuàng)新這個(gè)口號(hào)做了一個(gè)響應(yīng)逆趣,他們表示做互聯(lián)網(wǎng)可以給普通人有夢(mèng)想的人機(jī)會(huì),讓有夢(mèng)想的人成功章喉,現(xiàn)在是互聯(lián)網(wǎng)時(shí)代汗贫,一臺(tái)電腦一部手機(jī)就可以在家創(chuàng)業(yè)身坐,月入六位想成功V我叄澪肆柒壹澪柒肆貳貳或關(guān)注“鉆石人生園”詳解,你做不做這份事業(yè)都在那里落包,你干不干都有人在干部蛇,互聯(lián)網(wǎng)就是現(xiàn)在的主流趨勢(shì),未來(lái)五年是一個(gè)新老交替的五年咐蝇,很多舊行業(yè)可能會(huì)消失涯鲁,但很多新的行業(yè)隨之出現(xiàn)。有序。
澳大利亞和西方的企業(yè)界很喜歡可視化抹腿,尤其是在第二種上表現(xiàn)出極大的興趣。他們認(rèn)為從可視化中可以得到很多的東西旭寿,但是研究中實(shí)際輸出的可視化產(chǎn)品還沒(méi)有完全達(dá)到他們的期望警绩,還有很多工作要做。
九州連線:未來(lái)隨著人工智能或者大數(shù)據(jù)的逐漸完備盅称,可視化是否還有存在的必要肩祥?
Peter Eades :一方面,人工智能和數(shù)據(jù)分析已經(jīng)存在很多年了缩膝,但是他們實(shí)際上產(chǎn)生的價(jià)值總是達(dá)不到我們期望的效果混狠。想要讓人工智能或者大數(shù)據(jù)完全替代可視分析,還需要很長(zhǎng)時(shí)間疾层。
另一方面将饺,如果用人工智能只是想要得到一個(gè)結(jié)果,那很有可能替代可視分析痛黎。但是在大多數(shù)情況下予弧,人們想要知道更多的結(jié)果,以及是什么原因?qū)е铝诉@樣的結(jié)果舅逸,或者他們背后的一些東西桌肴,可視分析在這時(shí)候會(huì)有很大用處皇筛。
Peter Eades:關(guān)于《如何衡量可視化的好壞》的幾點(diǎn)看法
在第五屆中國(guó)可視化與可視分析大會(huì)(ChinaVis 2018)上琉历,Peter Eades在“面向新時(shí)代的可視分析”專(zhuān)題報(bào)告中,作了題為《How do you know whether your visualization is correct水醋?》的報(bào)告旗笔。
圖為Peter Eades作大會(huì)報(bào)告
他提到,以點(diǎn)邊圖為例拄踪,當(dāng)數(shù)據(jù)規(guī)模小的時(shí)候蝇恶,從可視化布局結(jié)果可以得到原始數(shù)據(jù)的所有信息。而當(dāng)數(shù)據(jù)規(guī)模變大時(shí)惶桐,布局往往會(huì)有視覺(jué)混淆撮弧,導(dǎo)致原始數(shù)據(jù)信息的丟失潘懊,因而可視化結(jié)果的可信度(faithfulness)下降。
如果一個(gè)可視化結(jié)果和原始數(shù)據(jù)是一一映射的關(guān)系贿衍,或者說(shuō)可以從可視化結(jié)果中完全恢復(fù)原有的布局信息授舟,那么這個(gè)可視化是可信的。在實(shí)際中贸辈,為了提高可視化結(jié)果的可讀性,往往會(huì)采用采樣擎淤、聚合等操作奢啥,導(dǎo)致結(jié)果的可信度降低。
接下來(lái)正驻,Peter Eades教授還介紹了針對(duì)大圖布局的Shape-based評(píng)價(jià)指標(biāo)啼染。該方法在得到圖的布局結(jié)果后,從中提取節(jié)點(diǎn)的位置集合蚤霞,計(jì)算鄰近圖(Proximity graph)序调。鄰近圖可以使用K近鄰、平面三角化等方法。最后比較鄰近圖與原始圖拓?fù)涞牟町愋詠?lái)反應(yīng)圖布局的質(zhì)量。
隨后Eades教授還在Panel中提到颁督,在當(dāng)前的可視化研究中践啄,技術(shù)的好壞通常通過(guò)案例來(lái)衡量,這是不充分的沉御。數(shù)據(jù)通過(guò)可視化函數(shù)(visualization function)轉(zhuǎn)換為圖片,圖片又經(jīng)過(guò)感知函數(shù)(perception function)被人類(lèi)所理解昭灵。在這一過(guò)程中吠裆,可視化函數(shù)是否對(duì)數(shù)據(jù)進(jìn)行了準(zhǔn)確無(wú)誤的轉(zhuǎn)換伐谈,人類(lèi)是否準(zhǔn)確理解了圖片中的信息?
心理學(xué)理論和試驗(yàn)可以用來(lái)驗(yàn)證人類(lèi)對(duì)圖片的理解質(zhì)量试疙,而對(duì)于數(shù)據(jù)到圖片的轉(zhuǎn)換質(zhì)量诵棵,如之前所述,是通過(guò)不充分的案例研究來(lái)完成的祝旷÷陌模可視化函數(shù)的質(zhì)量需要通過(guò)數(shù)學(xué)理論和推理來(lái)保證。對(duì)于某項(xiàng)任務(wù)怀跛,我們從數(shù)據(jù)中獲取的結(jié)論應(yīng)該和從圖片中獲取的一致距贷。
緊接著,Eades教授又對(duì)可視化要解決的問(wèn)題做了歸納吻谋。他認(rèn)為忠蝗,如果一項(xiàng)任務(wù)不是NP問(wèn)題或者反NP問(wèn)題,使用可視化來(lái)傳達(dá)真實(shí)性(communicating truth)或者虛偽性(communicating falsity)是不可行的漓拾;如果一項(xiàng)任務(wù)是NP問(wèn)題阁最,那么使用可視化來(lái)傳達(dá)真實(shí)性是可行的;如果一項(xiàng)任務(wù)是NP完全問(wèn)題骇两,那么可以使用可視化來(lái)傳達(dá)真實(shí)性速种,但是從數(shù)據(jù)的可視化表達(dá)中確定真相(determining truth)是不可行的;如果一項(xiàng)任務(wù)是P問(wèn)題低千,那么使用可視化來(lái)傳達(dá)真實(shí)性哟旗,以及從可視化中確定真相均是可行的。
之后栋操,Eades教授提出一個(gè)疑問(wèn)闸餐,可視化中存在“完全”(completeness)的概念嗎?如果存在矾芙,對(duì)于一個(gè)沒(méi)有解決的任務(wù)舍沙,如果我們可以找到它的可視化解,那么一大類(lèi)問(wèn)題都會(huì)存在可視化解剔宪。最后拂铡,Eades教授指出,數(shù)學(xué)推理或許不是可視化的良方葱绒,但它會(huì)對(duì)可視化的發(fā)展大有幫助感帅。
聲明: