這篇文章主要做了以下這些內(nèi)容:
- 收集豆瓣電影排名榜單信息并加以處理成便于調(diào)用的文檔形式烟很。
- 分析榜單中影片相關(guān)的數(shù)據(jù)闪彼,并運(yùn)用了多種不同的圖表展示這些數(shù)據(jù)之間的關(guān)系關(guān)系椿访。
經(jīng)過前幾段的簡(jiǎn)單分析蛋褥,我們可以發(fā)現(xiàn)豆瓣TOP250
榜單對(duì)于國(guó)內(nèi)電影主流文化還是比較契合的
我們都知道世界上沒有一份絕對(duì)公平的榜單鲜滩,世界上的好電影絕對(duì)不止250
部上祈,孰優(yōu)孰劣這種主觀的問題本身就沒有絕對(duì)的答案∠鹋樱現(xiàn)在大量的算法在研究如何做智能算法荸频、個(gè)性化推薦算法、預(yù)測(cè)型算法疚宇,但是算法得到的結(jié)果總是客觀存在的亡鼠,以客觀事物來揣摩人們的主觀內(nèi)心想法始終是一件很難做得面面俱到的事情。
因此我們也不能忽視此類普適的非個(gè)性化推薦算法灰嫉,這份TOP250
榜單以其廣泛的適應(yīng)性拆宛,在缺乏足夠多的數(shù)據(jù)支撐智能算法分析的情況下來說嗓奢,是一個(gè)很好的解決方案讼撒。
有待改進(jìn)的地方
- 對(duì)于評(píng)分相同的影片并不一定代表影片質(zhì)量就相當(dāng),還需要考慮評(píng)分的標(biāo)準(zhǔn)差股耽、不對(duì)稱性等高階數(shù)據(jù)的影響因素根盒。
- 數(shù)據(jù)可視化部分增加更多交互性,比如顯示鼠標(biāo)懸停位置的數(shù)據(jù)詳情顯示物蝙。
- 數(shù)據(jù)源的動(dòng)態(tài)分析炎滞,增加時(shí)間維度的分析。追蹤排行榜的變化诬乞,相應(yīng)的自動(dòng)調(diào)整展示的分析結(jié)果册赛。
- 單一數(shù)據(jù)源局限性較大,增加與其他榜單如
IMDb
的數(shù)據(jù)比較可以更加凸顯其特點(diǎn)震嫉。