PDX公有鏈,旨在打造公共的區(qū)塊鏈生態(tài)體系蚂夕,作為公共的區(qū)塊鏈IaaS迅诬,以強有力的底層專利技術,助力企業(yè)級客戶婿牍、開發(fā)者團體和普通用戶都能享受到區(qū)塊鏈帶來的便利和樂趣。
區(qū)塊鏈惩歉,正在一步步改變我們的生活等脂。
什么是流數(shù)據(jù)?
流數(shù)據(jù)是一組順序撑蚌、大量上遥、快速、連續(xù)到達的數(shù)據(jù)序列,一般情況下,數(shù)據(jù)流可被視為一個隨時間延續(xù)而無限增長的動態(tài)數(shù)據(jù)集合争涌》鄢可應用于網(wǎng)絡監(jiān)控、傳感器網(wǎng)絡亮垫、航空航天模软、氣象測控和金融服務等領域。
流數(shù)據(jù)優(yōu)勢及特點
對于持續(xù)生成動態(tài)新數(shù)據(jù)的大多數(shù)場景饮潦,流數(shù)據(jù)處理方法適用于大多數(shù)行業(yè)和大數(shù)據(jù)使用案例燃异。
流數(shù)據(jù)具有四個特點:
1)數(shù)據(jù)實時到達;
2)數(shù)據(jù)到達次序獨立继蜡,不受應用系統(tǒng)所控制回俐;
3)數(shù)據(jù)規(guī)模宏大且不能預知其最大值;
4)數(shù)據(jù)一經(jīng)處理稀并,除非特意保存仅颇,否則不能被再次取出處理,或者再次提取數(shù)據(jù)代價昂貴碘举。
流數(shù)據(jù)處理系統(tǒng)的查詢處理
內(nèi)存需要:大部分數(shù)據(jù)流是無法預知最終大小的忘瓦;在這種情況下,如果要在數(shù)據(jù)流上計算一個準確的結(jié)果(如累計數(shù))殴俱,需要的存儲空間將無法預知政冻,有可能超過可用的內(nèi)存。為了達到高速的處理數(shù)據(jù)线欲,流數(shù)據(jù)處理一般優(yōu)先采用基于內(nèi)存的數(shù)據(jù)處理算法明场,無須存取磁盤。
近似查詢結(jié)果:在內(nèi)存容量有限的情況下李丰,獲得一個準確的結(jié)果是不太可能的苦锨。很多時候我們并不需要一個準確的答案。在流數(shù)據(jù)處理領域,數(shù)據(jù)流上的查詢研究了一系列的數(shù)據(jù)縮減或者摘要構(gòu)建技術舟舒,如:數(shù)據(jù)輪廓拉庶,隨機采樣,真方圖秃励,小波變換等氏仗。
滑動窗口:從數(shù)據(jù)流上產(chǎn)生近似查詢結(jié)果的一種技術《嵯剩滑動窗口上的查詢處理指的是在數(shù)據(jù)的最近數(shù)據(jù)元素(記錄)上執(zhí)行查詢皆尔,而不是在數(shù)據(jù)流的所有歷史記錄上執(zhí)行查詢”依滑動窗口強調(diào)最近的數(shù)據(jù)慷蠕,即最近的數(shù)據(jù)權重更高。
查詢數(shù)據(jù)流的歷史數(shù)據(jù):在標準的流數(shù)據(jù)處理模式中食呻,當某個數(shù)據(jù)元素處理結(jié)束后流炕,將無法再訪問到。流數(shù)據(jù)允許新提交的即席查詢參考歷史數(shù)據(jù)仅胞。這里所說的歷史數(shù)據(jù)只是一個摘要每辟,或者聚集匯總。這些數(shù)據(jù)摘要有助于為未來的即席查詢計算一個近似的結(jié)果饼问。
多查詢優(yōu)化與查詢計劃的適應性 :在流數(shù)據(jù)處理系統(tǒng)中影兽,大多數(shù)的查詢是長時間運行的持續(xù)查詢。系統(tǒng)同時運行大量的查詢莱革,可以通過多查詢優(yōu)化技術峻堰,提高查詢處理的性能。
堵塞操作:該操作需要看到所有的輸入數(shù)據(jù)以后才能開始產(chǎn)生輸出結(jié)果盅视。排序捐名、Sum、Count闹击、Min镶蹋、Max、Avg等聚集操作都是堵塞操作赏半,因為只有看到所有的輸入數(shù)據(jù)贺归,才能開始產(chǎn)生輸出。讓流數(shù)據(jù)處理系統(tǒng)有效的處理排序断箫、聚集等操作是一個嚴峻的挑戰(zhàn)拂酣。 其中有一種稱為標點(Punctuation,標點就是一個斷言仲义,它規(guī)定在剩下的數(shù)據(jù)流數(shù)據(jù)中婶熬,什么數(shù)據(jù)可出現(xiàn)剑勾,什么數(shù)據(jù)不可出現(xiàn)。)的技術赵颅,來幫助其操作做出決策虽另。
PDX與流數(shù)據(jù)
當我們做交易時,交易的payload中可以存放數(shù)據(jù)饺谬,對于kb級別的數(shù)據(jù)可以直接放到交易payload中捂刺,進行傳輸、執(zhí)行募寨。如果說數(shù)據(jù)的字節(jié)數(shù)是比較大的叠萍,這個時候再放到交易中,進行傳輸執(zhí)行的話绪商,就不太現(xiàn)實了。首先一次網(wǎng)絡傳輸對數(shù)據(jù)量的大小是有限制的辅鲸,其次格郁,交易的執(zhí)行計算gas時,其中會根據(jù)字節(jié)的大小進行計算独悴,大的數(shù)據(jù)消耗的gas也是比較大的例书。
為了實現(xiàn)大數(shù)據(jù)的處理,我們添加了一個數(shù)據(jù)服務器刻炒,當交易需要處理大數(shù)據(jù)時决采,首先把數(shù)據(jù)的具體內(nèi)容存放到數(shù)據(jù)服務器中,服務器返回一個唯一id坟奥,然后我們將這個唯一id放到交易體中树瞭。當交易執(zhí)行時,從交易的參數(shù)中獲取數(shù)據(jù)的唯一id,再通過唯一id從數(shù)據(jù)服務器中將數(shù)據(jù)取出爱谁,進行數(shù)據(jù)的具體處理晒喷。