智能的數(shù)據(jù)分析服務(wù)

到2021年闷祥,具有智能數(shù)據(jù)探索分析功能的新型BI和分析平臺的用戶數(shù)量將是不具有智能數(shù)據(jù)探索分析功能的產(chǎn)品和平臺的兩倍,并且將創(chuàng)造兩倍的商業(yè)價值凯砍。from 深入解讀《Gartner2017年商業(yè)智能和分析平臺魔力象限報告》**

不在本文的討論范圍之內(nèi)的話題

  • 語音識別相關(guān)的工作悟衩。個人理解語音只是輸入與輸出的一種方式,取代人工的文本輸入座泳;按鈕點擊;閱讀镇防。目前的計算機應(yīng)該還是需要把語音轉(zhuǎn)換成語義才能進行下一步計算潮饱。語音輸入與文本輸入唯一的區(qū)別可能就是語氣,在數(shù)據(jù)服務(wù)中可能僅僅用于調(diào)整請求的優(yōu)先級啦扬。
  • 數(shù)據(jù)服務(wù)的穩(wěn)定性凫碌,實時性,高性能計算瞄摊。個人覺得這些屬于數(shù)據(jù)分析服務(wù)的基礎(chǔ)設(shè)施枉层,與智能無關(guān)赐写。當然這些是智能的前提。
  • 搜索本身揉忘。當然搜索可以是智能服務(wù)的發(fā)起者端铛,搜索也是一種技術(shù)手段。
  • 單一數(shù)據(jù)的分析您朽。比如灰度預(yù)測模型,神經(jīng)網(wǎng)絡(luò)預(yù)測几颜,數(shù)據(jù)的統(tǒng)計學(xué)分析等讯屈。
  • 實現(xiàn)智能的技術(shù)手段。

為什么寫這篇文字

很快自己在杭州的第二個四年即將結(jié)束谆趾,雖然自己對數(shù)據(jù)分析服務(wù)理解并不透徹叛本,不過還是想跟2010年寫本科畢業(yè)論文那會一樣,拼拼湊湊怜跑,加一點想法吠勘,寫點像樣的文字來總結(jié)過去四年對于數(shù)據(jù)服務(wù)的認知。

下面開始是正文植锉。

已有內(nèi)容的探索發(fā)現(xiàn)

本小節(jié)提到的內(nèi)容包括數(shù)據(jù)源峭拘、數(shù)據(jù)集、分析維度(比如時間辉饱,部門等)拣展、指標(又稱度量,如收入姓惑,利潤按脚,人數(shù))、簡單報表唯沮、復(fù)雜報表(又稱儀表盤)、圖表夯缺、數(shù)據(jù)分析報告等甘耿。
具體的場景包括:

  • 用戶打開你的服務(wù),可以根據(jù)用戶相似性推薦他可能感興趣的內(nèi)容

  • 用戶可以根據(jù)關(guān)鍵字來找到對應(yīng)主題的內(nèi)容

  • 用戶添加了數(shù)據(jù)集后捏境,自動推薦使用了對應(yīng)數(shù)據(jù)集的“上層”內(nèi)容

  • 用戶在閱讀某份報告的時候毁葱,向其推薦類似的報告

  • 用戶可以根據(jù)某個可視化的簡圖或者照片來搜索對應(yīng)的報告
    相關(guān)技術(shù):圖像相似性
    場景:用戶記得圖的樣子,但是找不到是具體哪個報告里

  • 基于地理位置來推薦內(nèi)容
    場景:一個會議上筷频,大家同時討論一個對象

已有內(nèi)容的智能排序

不同的時間點前痘,地理位置,數(shù)據(jù)消費者需要根據(jù)不同的報表來進行決策坯癣。

  • 每周一早上例會可能需要一份指定的報告
  • 每天下班前可能需要確認一份數(shù)據(jù)
  • 到門店交流時需要用到一份指定報表

問詢式的數(shù)據(jù)服務(wù)

用戶無需了解是否已經(jīng)存在已有的報表或者圖表最欠,只需要告知引擎他心中的問題,引擎自動去提取合適的分析維度與指標蚜点。結(jié)果可以是一個數(shù)字拌阴,或者一個圖表皮官。

evizasmall.gif

上圖中的例子是用戶想知道某個地區(qū)附近最貴的房子实辑。例子與圖片來自Tableau 2017 - 2020 年的產(chǎn)品規(guī)劃
微軟的Power BI 已經(jīng)提供類似功能摄乒。

PowerBI.png

數(shù)據(jù)的自動可視化呈現(xiàn)與解讀

當數(shù)據(jù)加載完畢馍佑,引擎是否可以知道用戶的下一步意圖呢?有數(shù)據(jù)積累的公司拭荤,比如Google舅世,已經(jīng)可以做到了。在Google Spreadsheet上用戶點擊任意一個Cell(最小數(shù)據(jù)單位)缨硝,頁面右側(cè)便有對應(yīng)的可視化呈現(xiàn)與解讀罢低。可視化是一部分网持,解讀更是重要的一部分功舀。

Google Spreadsheet.png

注:可以點擊查看大圖來閱讀Google對于這些數(shù)據(jù)與圖表給出的解讀。
同一份數(shù)據(jù)遣铝,機器可能更知曉最合適的呈現(xiàn)方式莉擒,是基本餅圖、條形圖填硕、折線圖鹿鳖,還是熱圖、樹圖姻檀、數(shù)據(jù)地圖或者散點圖涝滴。
討論一下技術(shù)實現(xiàn)胶台,如果你有大量的數(shù)據(jù)與匹配的可視化樣本诈唬,你可以拿來做深度學(xué)習(xí)缩麸。但是解讀這部分,你可能需要更多互聯(lián)網(wǎng)上的“經(jīng)驗”愚屁,比如財經(jīng)新聞痕檬,科技報道,咨詢報告丘跌。無疑唁桩,Google在這方面的積累遙遙領(lǐng)先。

異常數(shù)據(jù)的監(jiān)測與自動解釋

對于數(shù)據(jù)消費者报辱,看到一條曲線出現(xiàn)突變单山,你肯定會特別留意并需要找到突變的原因。智能的引擎應(yīng)當能夠監(jiān)測標注并給出解釋昼接。比如某產(chǎn)品銷量的下降可能跟以下因素有關(guān)悴晰,

  • 惡劣天氣、假期
  • 供貨商供貨不及時
  • 另外一款產(chǎn)品進行了促銷活動
alerts_1.png

(圖片來自Tableau Software
監(jiān)測到異常數(shù)據(jù)告警之類的應(yīng)該不屬于智能服務(wù) :)

咨詢服務(wù)

一個App,一家餐飲連鎖棕硫,一家銀行,不同時期需要關(guān)注的數(shù)據(jù)是哪些复凳? 平臺化的數(shù)據(jù)分析服務(wù)提供者有能力提供此類智能的咨詢服務(wù)灶泵,這可能也是最高級的智能服務(wù)赦邻。
微軟的Power BI上提供了一系列的模板幫助消費者快速分析一個對象,比如一個網(wǎng)站的訪問情況(基于Google Analytics 數(shù)據(jù))惶洲,一個軟件工程的狀態(tài)(基于Github數(shù)據(jù))恬吕。


PowerBI_AppSource.png

當然真正值錢的咨詢服務(wù)還是要收費的,預(yù)收費還是后付費的問題渐裂。

數(shù)據(jù)清理

注:本小節(jié)無具體表述钠惩。

其他

我們大刀闊斧地投入人力與財力研發(fā)產(chǎn)品之前篓跛,或許需要思考智能化的服務(wù)可以帶來什么真正的價值,當然帶來商業(yè)價值也是一種價值愧沟。

本文沒有討論技術(shù)手段,但是很多智能都需要基于數(shù)據(jù)與樣本计盒,那么那些服務(wù)部署在企業(yè)私有云上的廠家就要考慮這個問題了芽丹。“借刀殺人”是個不錯的策略咕村。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末懈涛,一起剝皮案震驚了整個濱河市泳猬,隨后出現(xiàn)的幾起案子宇植,更是在濱河造成了極大的恐慌指郁,老刑警劉巖拷呆,帶你破解...
    沈念sama閱讀 216,997評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異腰懂,居然都是意外死亡项秉,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,603評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來贷屎,“玉大人唉侄,你說我怎么就攤上這事∈艋” “怎么了同眯?”我有些...
    開封第一講書人閱讀 163,359評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長硅确。 經(jīng)常有香客問我明肮,道長,這世上最難降的妖魔是什么循未? 我笑而不...
    開封第一講書人閱讀 58,309評論 1 292
  • 正文 為了忘掉前任的妖,我火速辦了婚禮,結(jié)果婚禮上娇未,老公的妹妹穿的比我還像新娘赋元。我一直安慰自己飒房,他們只是感情好,可當我...
    茶點故事閱讀 67,346評論 6 390
  • 文/花漫 我一把揭開白布护糖。 她就那樣靜靜地躺著嫡良,像睡著了一般献酗。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上很澄,一...
    開封第一講書人閱讀 51,258評論 1 300
  • 那天颜及,我揣著相機與錄音俏站,去河邊找鬼。 笑死肄扎,一個胖子當著我的面吹牛犯祠,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播辆雾,決...
    沈念sama閱讀 40,122評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼月劈,長吁一口氣:“原來是場噩夢啊……” “哼藤乙!你這毒婦竟也來了惭墓?” 一聲冷哼從身側(cè)響起腊凶,我...
    開封第一講書人閱讀 38,970評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎褐缠,沒想到半個月后风瘦,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,403評論 1 313
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,596評論 3 334
  • 正文 我和宋清朗相戀三年昧谊,在試婚紗的時候發(fā)現(xiàn)自己被綠了酗捌。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,769評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡馅巷,死狀恐怖草姻,靈堂內(nèi)的尸體忽然破棺而出钓猬,到底是詐尸還是另有隱情,我是刑警寧澤撩独,帶...
    沈念sama閱讀 35,464評論 5 344
  • 正文 年R本政府宣布敞曹,位于F島的核電站,受9級特大地震影響综膀,放射性物質(zhì)發(fā)生泄漏澳迫。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,075評論 3 327
  • 文/蒙蒙 一剧劝、第九天 我趴在偏房一處隱蔽的房頂上張望橄登。 院中可真熱鬧,春花似錦、人聲如沸拢锹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,705評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蹋半。三九已至,卻和暖如春充坑,著一層夾襖步出監(jiān)牢的瞬間减江,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,848評論 1 269
  • 我被黑心中介騙來泰國打工捻爷, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留辈灼,地道東北人。 一個月前我還...
    沈念sama閱讀 47,831評論 2 370
  • 正文 我出身青樓役衡,卻偏偏與公主長得像茵休,于是被迫代替她去往敵國和親薪棒。 傳聞我的和親對象是個殘疾皇子手蝎,可洞房花燭夜當晚...
    茶點故事閱讀 44,678評論 2 354

推薦閱讀更多精彩內(nèi)容