FinTech(5): 結(jié)構(gòu)化一切數(shù)據(jù)

信息技術(shù)最直接的成果就是產(chǎn)生了更快的計(jì)算,以及更大的數(shù)據(jù)儲存能力藤违。這幾乎成為了技術(shù)的本能浪腐,想必所有人身邊都有一兩個喜歡收集一切信息,爬取所有數(shù)據(jù)的技術(shù)人員顿乒。如果說為什么要這么做的話议街,只會有這樣的回答“因?yàn)閿?shù)據(jù)在那里”。

數(shù)據(jù)儲存

數(shù)據(jù)儲存是最早解決的問題璧榄,從早期的KB級儲存單位到現(xiàn)在的TB級儲存單位特漩,已經(jīng)有了長足的進(jìn)步。與之同時(shí)提高的是數(shù)據(jù)的訪問速度骨杂。但盡管如此涂身,對于

數(shù)據(jù)收集

數(shù)據(jù)收集也不是一個老的話題,從早期的人口統(tǒng)計(jì)搓蚪、地形圖繪制開始蛤售,這也是數(shù)據(jù)控所喜歡的活動。在信息技術(shù)時(shí)代的早期妒潭,數(shù)據(jù)收集是通過將社會活動電子化備份進(jìn)行的悴能,比如除了提供紙質(zhì)收據(jù)之外,系統(tǒng)里有一份電子收據(jù)的留存雳灾。在現(xiàn)在漠酿,很多數(shù)據(jù)收集通過信息技術(shù)本身進(jìn)行,比如消費(fèi)記錄谎亩、瀏覽記錄等等炒嘲,這些數(shù)據(jù)都是通過網(wǎng)站數(shù)據(jù)收集進(jìn)行;而現(xiàn)在已經(jīng)開始通過O2O將一部分線下行為也通過互聯(lián)網(wǎng)進(jìn)行匈庭,比如共享單車的使用記錄》蛲梗現(xiàn)在正在探索的是通過物聯(lián)網(wǎng)將更多的線下物理行為和物流轉(zhuǎn)換的數(shù)據(jù)收集起來。

數(shù)據(jù)結(jié)構(gòu)化

僅僅將所有數(shù)據(jù)都存在硬盤里并不能滿足技術(shù)嚎花。技術(shù)還希望能夠?qū)?shù)據(jù)分門別類放好寸痢,我稱之為數(shù)據(jù)的結(jié)構(gòu)化呀洲。這個實(shí)際上的意義是為了方便數(shù)據(jù)的檢索紊选,但根本上的原因恐怕還是為了滿足技術(shù)的美感啼止。分類學(xué)誕生也比信息技術(shù)要早,早在18世紀(jì)林奈就建立比較完善的植物分類學(xué)兵罢。這是一種樹狀的結(jié)構(gòu)∠追常現(xiàn)在知識圖譜、社交網(wǎng)絡(luò)都在建立一個圖狀的結(jié)構(gòu)來將所以實(shí)體連接起來卖词,并希望能夠從中產(chǎn)生出更智能的應(yīng)用巩那。

數(shù)據(jù)檢索

快速的獲取數(shù)據(jù)在數(shù)據(jù)收集之后成為一個問題。第一點(diǎn)困難在于計(jì)算能力不足以快速掃描上億條數(shù)據(jù)此蜈,這一點(diǎn)通過數(shù)據(jù)庫建立索引表可以一定程度解決即横,但這需要明確的查詢腳本來實(shí)現(xiàn)。第二點(diǎn)困難在于處理模糊的查詢裆赵,這是一個介于人工智能的問答系統(tǒng)和明確的查詢腳本之間的問題东囚,通常的解決方案是將模糊的查詢轉(zhuǎn)換為若干明確的查詢腳本,早期的谷歌搜索引擎就是這樣解決這個問題的战授。

應(yīng)用

技術(shù)的這一本能可能是金融最早應(yīng)用页藻,也是收益最多的,可能也是金融的本能之一植兰。這一本能主要是為了提升估值精度份帐,當(dāng)然也提高了專職于這一功能的金融節(jié)點(diǎn)(如審計(jì)、分析師楣导、監(jiān)管)的效率废境。通過收集更多的信息,對標(biāo)的物爷辙、對行業(yè)和公關(guān)經(jīng)濟(jì)的評估都會更準(zhǔn)確彬坏。征信系統(tǒng)本質(zhì)上也是通過對人的各個數(shù)據(jù)進(jìn)行收集,來判斷此人的信用情況膝晾。

技術(shù)方面也有了大量的實(shí)踐栓始,比如電子賬目、商務(wù)智能血当、搜索引擎等幻赚。但這方面依然有大量的可能性。比如Orbital

Insight通過衛(wèi)星獲得地面圖像臊旭,來獲得物流落恼、農(nóng)業(yè)數(shù)據(jù)。對文本也依然停留在檢索階段离熏,尚未進(jìn)入理解階段佳谦。對人流、交通的數(shù)據(jù)剛進(jìn)入采集階段滋戳。對物流钻蔑、電流的數(shù)據(jù)采集還在物聯(lián)網(wǎng)的試驗(yàn)階段啥刻。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市咪笑,隨后出現(xiàn)的幾起案子可帽,更是在濱河造成了極大的恐慌,老刑警劉巖窗怒,帶你破解...
    沈念sama閱讀 217,084評論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件映跟,死亡現(xiàn)場離奇詭異,居然都是意外死亡扬虚,警方通過查閱死者的電腦和手機(jī)努隙,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,623評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來辜昵,“玉大人剃法,你說我怎么就攤上這事÷酚ィ” “怎么了贷洲?”我有些...
    開封第一講書人閱讀 163,450評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長晋柱。 經(jīng)常有香客問我优构,道長,這世上最難降的妖魔是什么雁竞? 我笑而不...
    開封第一講書人閱讀 58,322評論 1 293
  • 正文 為了忘掉前任钦椭,我火速辦了婚禮,結(jié)果婚禮上碑诉,老公的妹妹穿的比我還像新娘彪腔。我一直安慰自己,他們只是感情好进栽,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,370評論 6 390
  • 文/花漫 我一把揭開白布德挣。 她就那樣靜靜地躺著,像睡著了一般快毛。 火紅的嫁衣襯著肌膚如雪格嗅。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,274評論 1 300
  • 那天唠帝,我揣著相機(jī)與錄音屯掖,去河邊找鬼。 笑死襟衰,一個胖子當(dāng)著我的面吹牛贴铜,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 40,126評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼绍坝,長吁一口氣:“原來是場噩夢啊……” “哼赶熟!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起陷嘴,我...
    開封第一講書人閱讀 38,980評論 0 275
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎间坐,沒想到半個月后灾挨,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,414評論 1 313
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡竹宋,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,599評論 3 334
  • 正文 我和宋清朗相戀三年劳澄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蜈七。...
    茶點(diǎn)故事閱讀 39,773評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡秒拔,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出飒硅,到底是詐尸還是另有隱情砂缩,我是刑警寧澤,帶...
    沈念sama閱讀 35,470評論 5 344
  • 正文 年R本政府宣布三娩,位于F島的核電站庵芭,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏雀监。R本人自食惡果不足惜双吆,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,080評論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望会前。 院中可真熱鬧好乐,春花似錦、人聲如沸瓦宜。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,713評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽临庇。三九已至笛坦,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間苔巨,已是汗流浹背版扩。 一陣腳步聲響...
    開封第一講書人閱讀 32,852評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留侄泽,地道東北人礁芦。 一個月前我還...
    沈念sama閱讀 47,865評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親柿扣。 傳聞我的和親對象是個殘疾皇子肖方,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,689評論 2 354

推薦閱讀更多精彩內(nèi)容