在近日舉行的2018全球閃存技術峰會上片橡,優(yōu)云數智攜旗下具有“CBA”氣息的存儲系統(tǒng)——UMStor來到武漢東湖之濱的光谷科技會展中心戒悠,向參會者展示PB級數據湖存儲方案實力。
數據流沖擊日益凸顯
100多年前偷仿,“千湖之地”武漢湖泊星羅棋布抵蚊,沙湖、東湖耕赘、白洋湖相通骄蝇,因無人建防水堤,每每水患操骡,所望及盡澤國九火。光緒二十五年,湖廣總督張之洞在長江與東湖之間修建了南北兩段堤防——武金堤和武青堤当娱,至此東湖與沙湖分離吃既,基于堅固地質,面積經幾十年不變跨细,定于33平方公里鹦倚,遂成今東湖。
探究東湖發(fā)展冀惭,人為分治起到很大作用震叙。然而掀鹅,今天人們開始承受另一種“水患之痛”,那就是高速發(fā)展的IoT使大數據面臨PB級海量數據存儲以及上千QPS級并發(fā)請求媒楼,大數據流正瘋狂沖擊著企業(yè)乐尊。
面對全業(yè)務數字化轉型大勢,傳統(tǒng)企業(yè)數據中心的數據存儲級別由原先數十TB向今天動輒PB級的數據存儲量級轉化划址。與此同時扔嵌,圍繞企業(yè)多類型業(yè)務需求,如何解決海量大數據并發(fā)承載夺颤,如何結合AI對存儲大數據挖掘痢缎,并同步通過多協(xié)議訪問高效對外分享等一系列問題,就需建立統(tǒng)一的數據平臺化運營機制世澜。
在數字化轉型的挑戰(zhàn)面前独旷,各種新型技術滲透業(yè)務模式和流程,推動傳統(tǒng)企業(yè)數據存儲變革寥裂。UMStor不僅協(xié)助企業(yè)大數據上云端嵌洼,支持大數據加速,還為人工智能提供快速處理數據接口封恰。
至此麻养,優(yōu)云數智UMStor已擁有諸多數十PB級的統(tǒng)一分布存儲、大數據湖實際案例落地俭驮。
PB級數據湖存儲方案
數據湖的核心關鍵依然在于數字化轉型回溺,包含大數據存儲、處理混萝、共享等數據平臺化運營機制。優(yōu)云數智UMStor多協(xié)議分布式存儲系統(tǒng)在諸多實際案例落地過程中萍恕,演化出一種新的大數據存儲架構——數據湖存儲架構逸嘀。
(圖:UMStor PB級數據湖存儲方案示例)
結合其他軟件應用服務啟示,優(yōu)云數智UMStor通過將計算存儲環(huán)境分離允粤,采用Hadapter直接特定函數調用崭倘,完成數據訪問,避免增加網關IO訪問瓶頸类垫,在保證大數據環(huán)境下的存儲訪問性能同時司光,打破環(huán)境分離帶來的數據調度壁壘。
UMStor協(xié)助企業(yè)存儲數據上云端
傳統(tǒng)大數據的物理機部署模式在應對當下企業(yè)多業(yè)務彈性計算資源需求悉患,以及現有存儲容量擴容增長相差較大的情況下残家,計算、存儲兩者一體部署已無法滿足靈活業(yè)務需求售躁,同時也并非是最優(yōu)性價比方案坞淮。而將存儲數據與計算分離茴晋,獨立上云端,實現兩者各自獨立擴展回窘,正是當下數據存儲的趨勢诺擅。
UMStor作為企業(yè)數據上云端方案,是真正的軟件定義存儲系統(tǒng)(SDS)啡直,采用領先的全分布式全冗余架構烁涌,沒有單點故障,具有高彈性和高可靠性酒觅,性能和容量可以橫向擴展撮执。UMStor可以靈活進行軟件配置與硬件選型,協(xié)助企業(yè)自定義存儲系統(tǒng)的性能阐滩、容量二打、數據保護能力等,在基礎資源利用最大化的同時掂榔,也降低基礎成本投入继效,滿足企業(yè)當前和未來數據存儲戰(zhàn)略需求。
UMStor助力企業(yè)大數據加速
伴隨數字化發(fā)展装获,傳統(tǒng)數據存儲部分問題日益突出瑞信。例如,傳統(tǒng)存儲數據的存取路徑須通過對象服務的網關穴豫,再由網關服務把IO請求遞交給底層的對象存儲設備凡简,這就會導致一系列問題,不僅網關增加了IO訪問路徑的開銷精肃,而且該網關比較容易成為系統(tǒng)的性能瓶頸秤涩。
(圖:Hadapter運行機制)
通過NFS-Ganesha軟件支持多種后臺存儲系統(tǒng)中Ceph對象存儲服務的啟示,優(yōu)云數智打造了一款基于自身存儲系統(tǒng)的Hadoop插件——Hadapter司抱。UMStor通過將計算存儲環(huán)境分離筐眷,采用Hadapter直接調用librados函數庫來請求OSD的方式,避開了數據存取對網關的請求习柠,在保證大數據環(huán)境下存儲訪問性能的同時匀谣,打破環(huán)境分離帶來的數據調度壁壘。
此外资溃,圍繞大數據應用對接武翎,UMStor不僅提供標準S3和Swift對象存儲接口,用于存儲圖片溶锭、文件宝恶、視頻等非結構化數據,而且還提供HDFS接口,大數據應用Hadoop卑惜、Spark膏执、Hive、HBase可以直接與存儲服務器進行通信露久,不需要經過存儲網關和元數據服務器更米,具有很強的橫向擴展能力和吞吐能力。
UMStor推動人工智能AI大數據挖掘
大數據時代毫痕,人工智能同步飛速發(fā)展征峦。智能算法的訓練與推理需要對超大數據集進行處理與分析,而這些數據涵蓋視頻消请、圖片栏笆、文本等非結構化數據。要對來源不同行業(yè)臊泰、組織蛉加、部門、項目的數據進行采集缸逃、存儲针饥、清洗、轉換需频、特征提取等工作丁眼,無疑是一項復雜、漫長的工程昭殉。
UMStor不僅可向人工智能程序提供數據快速收集苞七、處理、分析平臺挪丢,還具備提供高速
帶寬蹂风、海量小文件存取、多協(xié)議互通乾蓬、數據共享的能力硫眨,從而大大加速了數據挖掘、深度學習的過程巢块。
曾經水患肆虐的東湖,如今已成為武漢存儲產業(yè)高科技發(fā)展中心巧号,未來將影響著中國族奢,乃至世界科技產業(yè)的發(fā)展方向。UMStor作為優(yōu)云數智推出的具“CBA”氣息的存儲系統(tǒng)丹鸿,也將為傳統(tǒng)企業(yè)的數字化轉型提供便捷越走、穩(wěn)定的數據云端存儲解決方案。