初涉數(shù)據(jù)產(chǎn)品有一段時間吏饿,最近在工作討論中突然有了些許感悟锣光,總結(jié)一下笆怠。恰逢AlphaGo第二次正式參與公開圍棋賽,人機戰(zhàn)誊爹、人機配對戰(zhàn)蹬刷、團體戰(zhàn)進行的高潮迭起。今天所寫雖與人工智能無關(guān)频丘,不過畢竟AlphaGo總體而言也算是在用數(shù)據(jù)做決策(強行蹭熱點)箍铭。
人類應(yīng)用數(shù)據(jù)分析的歷史由來已久。其中椎镣,一類典型就是基于對歷史數(shù)據(jù)的分析來評估未來并指導(dǎo)決策。這基本可看做歸納推理兽赁,不保真状答,所以有風(fēng)險。由于我們只探討企業(yè)生產(chǎn)活動中的數(shù)據(jù)分析刀崖,所以其應(yīng)用必然是決策惊科,像純科學(xué)研究、演繹推理總結(jié)出基本是已知的結(jié)論亮钦,這些就不涉及了馆截。
隨著人類歷史發(fā)展、技術(shù)進步蜂莉,數(shù)據(jù)分析在指導(dǎo)決策上發(fā)揮出越來越大的價值和意義蜡娶。在數(shù)據(jù)爆炸的當(dāng)下,可利用的相關(guān)數(shù)據(jù)越來越多映穗,數(shù)據(jù)中可被挖掘的信息越來越多窖张,并且產(chǎn)生的指導(dǎo)價值越來越大。前些年“大數(shù)據(jù)”概念被炒的神乎其神蚁滋,大家也確實已在諸多領(lǐng)域開展了大量研究宿接、實踐,開發(fā)出了各種新技術(shù)來提升數(shù)據(jù)價值辕录。但是在決策時睦霎,這一切依然不能使其擺脫原理上的不保真風(fēng)險。
在樣本數(shù)據(jù)量巨大的基礎(chǔ)上走诞,由于大量“噪音”被掩蓋副女、平滑,分析得出的宏觀結(jié)論極具信服力蚣旱,風(fēng)險很低肮塞;但隨著分析向低層次襟齿、細粒度下沉,可信度隨之不斷下降枕赵,風(fēng)險逐步上升猜欺。不幸的是,總有很多基礎(chǔ)工作需要在細粒度上著手拷窜。更何況很多時候开皿,囿于底層架構(gòu),我們在源頭上無法得到書本宣傳中那樣豐富篮昧、多維赋荆、干凈、理想的數(shù)據(jù)懊昨。
為了得到結(jié)論窄潭,數(shù)據(jù)總會經(jīng)過一些塑造加工。在此過程中由于一些涉及利益的業(yè)務(wù)特性酵颁,特殊的加工就可能放大數(shù)據(jù)的扭曲失真嫉你。由于各自領(lǐng)域的相對獨特性,總會有各個領(lǐng)域的利益相關(guān)方提出“特權(quán)”的要求躏惋。原本一個整體的解決方案幽污,在此過程中對不同領(lǐng)域的適應(yīng)性增強,但也會不斷碎片化簿姨,管理難度隨之加大距误,到最后可能失控成“誰都不好解釋的地步”。
當(dāng)這一切在后臺運行時扁位,風(fēng)險大體算是可控准潭,問題最多就是增加一些經(jīng)營成本。但當(dāng)我們把數(shù)據(jù)拿到前臺展示時域仇,就有可能引發(fā)人們的質(zhì)疑惋鹅、指責(zé)甚至恐慌。輿論的威力具有毀滅性殉簸,與此同時闰集,對它的恐懼也會鞭策我們。
我的理解是:這時我們只有兩種選擇般卑,要么“溫和”求穩(wěn)使結(jié)論“中庸化”武鲁,這樣會降低決策效率;要么“冷酷”的嚴格計算蝠检,這樣會增大決策的風(fēng)險沐鼠。也許這就是數(shù)據(jù)決策方案設(shè)計的真諦。
所以制定數(shù)據(jù)決策方案的工作就是在把控風(fēng)險的大小。至于如何把控饲梭,過一段時間我再有什么感悟了乘盖,咱們再談不遲。
昨晚完成了本文草稿憔涉,今天看到如下兩篇文章在不同領(lǐng)域订框、不同角度的探討,基本也佐證了我的想法兜叨,感興趣的朋友可做延伸閱讀穿扳。
計算機的偉大與危險之處都在于国旷,它可以把你的奇思妙想變成現(xiàn)實矛物,并且影響他人。一個沖動的想法經(jīng)過計算機編程后跪但,可能會傷害成千上萬的人履羞。
Xtecher:《個性化推薦時代的閱讀之殤:你置身于“回聲室效應(yīng)”卻渾然不覺》
在精準(zhǔn)的用戶畫像里,算法自動過濾了異樣的聲音屡久,同時也杜絕了驚喜的可能忆首。
或許,真正的自由是建立在正反博弈的信息和廣泛的選擇之上涂身。當(dāng)技術(shù)能輕易讓人自絕于他人的意見之時,對技術(shù)的依賴也或許將成為通往自由之路的阻礙搓蚪。