隨著技術(shù)的積淀,AI正在走出象牙塔和實(shí)驗(yàn)室屈留,步入商業(yè)世界,成為撬動(dòng)社會(huì)發(fā)展和經(jīng)濟(jì)增長(zhǎng)的新杠桿测蘑。人工智能的發(fā)展為世界帶來(lái)了日新月異的變化:社會(huì)行為全面數(shù)字化灌危,政府、商業(yè)公司帮寻、生活?yuàn)蕵?lè)等決策制定全面智能化 乍狐,從機(jī)器為人服務(wù)變成人機(jī)協(xié)同生活,程序的邏輯從 IF-THEN-ELSE 固逗, 轉(zhuǎn)變成 INPUT-LEARN-PREDICT浅蚪;技術(shù)的組織梳理從DAL-BLL-UI藕帜,轉(zhuǎn)變成 DATA-MODEL-ROBOT,同時(shí)降本增效惜傲、政府監(jiān)管需求進(jìn)一步放大更促進(jìn)了社會(huì)向人工智能的轉(zhuǎn)型洽故。
然而,這一進(jìn)程卻并不是一帆風(fēng)順的盗誊,由于AI技術(shù)太新太難也太復(fù)雜时甚,對(duì)于眾多技術(shù)儲(chǔ)備并不豐沛的傳統(tǒng)行業(yè)企業(yè)而言,AI應(yīng)用的落地正面臨技術(shù)門(mén)檻高哈踱、基礎(chǔ)設(shè)施要求高荒适、建設(shè)成本高等一系列難題。在轉(zhuǎn)型AI的時(shí)代开镣,無(wú)論是從IaaS基礎(chǔ)設(shè)施還是PaaS平臺(tái)層面來(lái)說(shuō)刀诬,機(jī)遇與挑戰(zhàn)并存。
面向AI的(IaaS) 體系結(jié)構(gòu)邪财、基礎(chǔ)設(shè)施建設(shè)
數(shù)據(jù)與算力的爆發(fā)為面向AI的IaaS體系結(jié)構(gòu)陕壹、基礎(chǔ)設(shè)施建設(shè)帶來(lái)了新的機(jī)遇,也觸發(fā)了新的挑戰(zhàn)树埠。
隨著數(shù)據(jù)爆發(fā)和算力提升將推動(dòng)AI發(fā)展糠馆,為AI基礎(chǔ)設(shè)施建設(shè)帶來(lái)了重大機(jī)遇,使得智慧城市怎憋,智慧生活成為可能又碌。從數(shù)據(jù)爆發(fā)的角度來(lái)說(shuō),根據(jù)相關(guān)機(jī)構(gòu)預(yù)測(cè)到2025年盛霎,全球數(shù)據(jù)圈將從2018年的33ZB增至2025年的175ZB赠橙。隨著龐大數(shù)據(jù)量不斷增長(zhǎng),人工智能解決問(wèn)題的數(shù)量和質(zhì)量也將增加愤炸,這也使得算法期揪、模型復(fù)雜度進(jìn)一步提升。為了適應(yīng)數(shù)據(jù)爆發(fā)规个,模型變得更寬凤薛、更深、更復(fù)雜诞仓,能夠覆蓋更復(fù)雜的業(yè)務(wù)場(chǎng)景缤苫,支撐物聯(lián)網(wǎng),千人千面等以前不能支撐的精細(xì)化定制化運(yùn)營(yíng)方式墅拭。而從算力的角度來(lái)看活玲,回望過(guò)去20余年,計(jì)算機(jī)的性能成幾何級(jí)數(shù)增長(zhǎng),2015年的計(jì)算性能相比1993年約為50萬(wàn)倍舒憾。算力的發(fā)展镀钓,使得使用AI硬件體系結(jié)構(gòu)、定制化加速硬件镀迂、計(jì)算芯片丁溅,進(jìn)一步釋放機(jī)器學(xué)習(xí)算法的潛力、提升海量規(guī)模數(shù)據(jù)的利用成為可能探遵。
而機(jī)遇總是伴隨著挑戰(zhàn)窟赏。一方面,超高維的機(jī)器學(xué)習(xí)能力箱季,能夠大幅提高企業(yè)數(shù)據(jù)模型維度涯穷,帶動(dòng)機(jī)器學(xué)習(xí)效果的提升,增益數(shù)據(jù)價(jià)值藏雏;另一方面求豫,通過(guò)AutoML等技術(shù)的引入,它也能有效降低AI的使用成本和門(mén)檻诉稍,讓更多傳統(tǒng)行業(yè)企業(yè)有能力將AI應(yīng)用部署到更多業(yè)務(wù)場(chǎng)景中去。而圍繞專家構(gòu)建AI超高維系統(tǒng)最疆,圍繞AutoML技術(shù)構(gòu)建應(yīng)用系統(tǒng)杯巨,都將帶來(lái)算力的巨大需求。傳統(tǒng)的大數(shù)據(jù)基礎(chǔ)架構(gòu)+AI算法的拼接努酸,面臨機(jī)器規(guī)模激增服爷、新業(yè)務(wù)探索投入產(chǎn)出比差、聯(lián)機(jī)業(yè)務(wù)運(yùn)維成本高昂等問(wèn)題获诈。
面對(duì)這樣的機(jī)遇與挑戰(zhàn)仍源,我們不難發(fā)現(xiàn),AI基礎(chǔ)設(shè)施建設(shè)是系統(tǒng)性工程舔涎,不是簡(jiǎn)單的CPU笼踩、GPU硬件堆砌。它需要業(yè)務(wù)+算法+平臺(tái) + 數(shù)據(jù) +算力的統(tǒng)籌優(yōu)化亡嫌,需要為企業(yè)支撐有核心競(jìng)爭(zhēng)力的AI PaaS平臺(tái)嚎于。 而為企業(yè)支撐有核心競(jìng)爭(zhēng)力的AI PaaS平臺(tái)同樣也是機(jī)遇與挑戰(zhàn)共存。
面向AI的(PaaS) 平臺(tái)
隨著AI落地應(yīng)用的場(chǎng)景越來(lái)越多挟冠,一方面來(lái)說(shuō)于购,小范圍探索性的AI場(chǎng)景驗(yàn)證,已經(jīng)轉(zhuǎn)變成廣泛大規(guī)模的AI生產(chǎn)上線知染,AI落地的業(yè)務(wù)價(jià)值在各行各業(yè)各場(chǎng)景下得到體現(xiàn)肋僧。另一方面,AI數(shù)據(jù)計(jì)算的管理和匯集,以中心樞紐的形式支持著跨行嫌吠、跨國(guó)止潘、跨領(lǐng)域的AI協(xié)同合作。這些條件使得面向AI的PaaS平臺(tái)建設(shè)成為強(qiáng)需求居兆。
然而面向AI的PaaS平臺(tái)建設(shè)并非易事覆山,一個(gè)企業(yè)級(jí)的AI PaaS平臺(tái)面臨著諸多挑戰(zhàn)。這些挑戰(zhàn)主要分為集中性泥栖,安全性簇宽,靈活性和可擴(kuò)展性四個(gè)方面。首先吧享,集中性意味不僅要求數(shù)據(jù)資產(chǎn)魏割、模型資產(chǎn)的統(tǒng)一積累和管理,還對(duì)硬件資源的統(tǒng)一調(diào)度和租戶管理提出了要求钢颂。第二钞它,安全性則包括了審計(jì)功能和代碼安全的統(tǒng)一化頁(yè),國(guó)產(chǎn)化與知識(shí)產(chǎn)權(quán)保護(hù)背景下(開(kāi)源License殊鞭、國(guó)內(nèi)外商業(yè)軟件授權(quán)控制)的監(jiān)管和來(lái)自國(guó)家金融監(jiān)管科技的標(biāo)準(zhǔn)和要求遭垛。第三,從靈活性的角度來(lái)說(shuō)操灿,AI的PaaS平臺(tái)不僅要求資源的靈活分配與調(diào)度锯仪,還要求擴(kuò)容與縮容應(yīng)用程序開(kāi)發(fā)接口的開(kāi)放性以支撐多類型業(yè)務(wù)。最后趾盐,可擴(kuò)展性也是AI的PaaS平臺(tái)必不可少的特點(diǎn)庶喜。因?yàn)殡S著人工智能技術(shù)算法與技術(shù)架構(gòu)的發(fā)展,必須能夠在保持系統(tǒng)安全穩(wěn)定運(yùn)行的情況下及時(shí)升級(jí)救鲤,才能維持技術(shù)水平領(lǐng)先久窟。
綜上所述,充分釋放AI時(shí)代的業(yè)務(wù)潛能本缠,需要強(qiáng)大的IaaS斥扛、PaaS支撐。支撐全球領(lǐng)先的用戶群體+數(shù)據(jù)規(guī)模+場(chǎng)景服務(wù)搓茬,可以考慮構(gòu)建完全國(guó)產(chǎn)化的犹赖、集中性和可擴(kuò)展性統(tǒng)一的IaaS和PaaS能力,打造AI閉環(huán)的核心競(jìng)爭(zhēng)力卷仑。AI競(jìng)爭(zhēng)的背后是算力的競(jìng)爭(zhēng)峻村,更高的算力意味著更快速的落地、更高效的投入產(chǎn)出锡凝。
面向AI的應(yīng)用層面建設(shè)
傳統(tǒng)應(yīng)用的加速AI化粘昨,以及視覺(jué)、語(yǔ)音、NLP等源生AI應(yīng)用的探索和落地张肾,將對(duì)計(jì)算基礎(chǔ)設(shè)施提出前所未有的巨大需求芭析。源生的感知類AI應(yīng)用將經(jīng)歷早期、發(fā)展到成熟三個(gè)時(shí)期吞瞪。決策類AI應(yīng)用將從25%逐步發(fā)展到100%馁启。
【圖】
從AI建設(shè)最上層的應(yīng)用層面來(lái)看,AI應(yīng)用離不開(kāi)場(chǎng)景芍秆。大量AI算法負(fù)載和AI場(chǎng)景應(yīng)用負(fù)載產(chǎn)生了巨大算力需求惯疙。作為AI應(yīng)用負(fù)載的對(duì)基礎(chǔ)設(shè)施的要求和已有的傳統(tǒng)IT基礎(chǔ)設(shè)施有著顯著不同。
將傳統(tǒng)IT基礎(chǔ)設(shè)施所提供的特性和AI應(yīng)用負(fù)載所要求的特性進(jìn)行對(duì)比妖啥,我們可以發(fā)現(xiàn):傳統(tǒng)IT基礎(chǔ)設(shè)施是為Web/Mobile/數(shù)據(jù)庫(kù)/大數(shù)據(jù)應(yīng)用而建霉颠,將Scale-up 和 Scale-out進(jìn)行了區(qū)分。從芯片角度來(lái)說(shuō)荆虱,傳統(tǒng)IT基礎(chǔ)設(shè)施使用通用服務(wù)器和芯片蒿偎,單顆芯片性能有限;從存儲(chǔ)角度來(lái)說(shuō)怀读,傳統(tǒng)IT基礎(chǔ)設(shè)施使用中低配內(nèi)存加上大容量低速存儲(chǔ)诉位;從網(wǎng)絡(luò)角度來(lái)說(shuō),傳統(tǒng)IT基礎(chǔ)設(shè)施以縱向流量為主的Spine Leaf網(wǎng)絡(luò)拓?fù)洳思希械退倬W(wǎng)絡(luò)為主不从;而從供電散熱角度來(lái)說(shuō),傳統(tǒng)IT基礎(chǔ)設(shè)施以標(biāo)準(zhǔn)電流供應(yīng)為主犁跪,采用傳統(tǒng)風(fēng)冷散熱技術(shù)。
而AI應(yīng)用負(fù)載歹袁,場(chǎng)景主要是實(shí)行高維分布式機(jī)器學(xué)習(xí)/深度學(xué)習(xí)訓(xùn)練坷衍,在業(yè)務(wù)場(chǎng)景中實(shí)時(shí)決策和感知。AI場(chǎng)景中數(shù)據(jù)量和模型復(fù)雜度極高条舔,復(fù)雜稀疏矩陣運(yùn)算多的情況枫耳,AI應(yīng)用負(fù)載所要求的IT基礎(chǔ)設(shè)施需要適應(yīng)這些場(chǎng)景的需求。并且AI應(yīng)用負(fù)載具有計(jì)算密集孟抗、訪存密集的特點(diǎn)迁杨,產(chǎn)生大量中間結(jié)果用于模型迭代,高維稀疏模型需要大容量存儲(chǔ)空間凄硼,集群內(nèi)頻繁大規(guī)模數(shù)據(jù)交換铅协,AutoML算法需要更多算力支撐,比傳統(tǒng)應(yīng)用需要更高功率摊沉。
AI的應(yīng)用普及先行一步狐史,而基礎(chǔ)設(shè)施如果沒(méi)有跟上步伐,其中帶來(lái)的問(wèn)題顯而易見(jiàn)。AI應(yīng)用負(fù)載運(yùn)行在傳統(tǒng)IT基礎(chǔ)設(shè)施上骏全,導(dǎo)致模型訓(xùn)練不充分苍柏、模型效果打折扣,AI應(yīng)用性能無(wú)法滿足業(yè)務(wù)需求姜贡,新系統(tǒng)上線周期長(zhǎng)试吁,機(jī)架數(shù)量制約算力擴(kuò)容,和供電楼咳、散熱等成本占比偏高熄捍,并業(yè)務(wù)增長(zhǎng)/變化的速度受制約,Performance/dollar不理想爬橡,AI系統(tǒng)建設(shè)TCO居高不下治唤。
異構(gòu)計(jì)算加速AI全流程
為了不要讓基礎(chǔ)設(shè)施制約業(yè)務(wù)增長(zhǎng),使用異構(gòu)計(jì)算加速AI全流程是一個(gè)很好的思路糙申。
關(guān)于異構(gòu)計(jì)算加速AI全流程的方法一般可以為分別兩個(gè)部分宾添。第一個(gè)部分是:芯片級(jí)異構(gòu)。這包括四種類型: 第一 柜裸,CPU:Cascade Lake AP,單處理器最大48core,更多內(nèi)存通道,更高訪存帶寬和EPYC處理器缕陕,Vega 7nm技術(shù);第二疙挺,GPU:Tesla V100 訓(xùn)練歹颓,Tesla P4/T4 推理,CUDA編程框架和Tesla V100 訓(xùn)練命满,Tesla P4/T4 推理蚁署,CUDA編程框架;第三搀暑,F(xiàn)PGA:用于AI訓(xùn)練/推理加速,硬件級(jí)計(jì)算加速,OpenCL,更低每瓦特性能,更高的加速性能和更低設(shè)備間互聯(lián)延遲沥阳;第四,其他:TPU/NPU,ASIC專用芯片,邊緣計(jì)算芯片,國(guó)產(chǎn)芯片自点,海光/沸騰,光芯片,神經(jīng)芯片和量子計(jì)算桐罕。
第二個(gè)部分是:系統(tǒng)級(jí)異構(gòu)。這其中包括三個(gè)部分桂敛。第一功炮。高密度節(jié)點(diǎn):Intel 9200 Walker Pass,2U2N / 2U4N术唬,Up to 8 x Cascade Lake AP薪伏,Up to 384 Core,有更高的單位面積計(jì)算密度和更低的TCO粗仓;第二毅该,GPU集成系統(tǒng):Nvidia HGX / DGX博秫,4U8卡 / 10U16卡,Tesla V100加速卡和NVLink加速CPU/GPU通信眶掌;第三挡育,水冷技術(shù):On-chip冷卻,Direct-to-node冷卻朴爬,Rack冷卻和大幅節(jié)省功耗即寒,PUE小于1.1。
如何解決AI建設(shè)各層面痛點(diǎn)
第四范式提供的解決方案將會(huì)從I/O召噩,網(wǎng)絡(luò)母赵,計(jì)算三個(gè)方面來(lái)解決AI基礎(chǔ)建設(shè)的痛點(diǎn)。
高性能閃存具滴,全面解決AI計(jì)算的I/O瓶頸問(wèn)題
首先凹嘲,針對(duì)AI時(shí)代I/O訪存瓶頸,第四范式使用高性能閃存构韵,全面解決AI計(jì)算的I/O瓶頸問(wèn)題周蹭。目前高維AI訓(xùn)練/推理過(guò)程遭遇四大I/O瓶頸。第一是高維稀疏模型大小GB~TB量級(jí)疲恢,需要分片分節(jié)點(diǎn)存儲(chǔ)凶朗;第二,訪存頻繁显拳,CPU性能受限于訪存帶寬棚愤;第三,產(chǎn)生大量中間結(jié)果用于模型迭代杂数,落盤(pán)速度制約訓(xùn)練效率宛畦;第四,在線實(shí)時(shí)復(fù)雜特征計(jì)算揍移,需要高性能緩存支撐刃永;為了給AI工作負(fù)載提供高性能、高性價(jià)比的存儲(chǔ)環(huán)境羊精,第四范式做了開(kāi)創(chuàng)式三大創(chuàng)新。第一囚玫,NVMe/3Dx Point閃存技術(shù)喧锦;第二,Intel全新Optane SSD抓督,擴(kuò)展virtual memory空間燃少,削減CAPEX和高性價(jià)比SSD用于離線;第三铃在,在線計(jì)算cache阵具,大幅提升AI運(yùn)算速度碍遍。
高帶寬&低延時(shí)網(wǎng)絡(luò),強(qiáng)化東西向吞吐阳液,提升AI訓(xùn)練性能
現(xiàn)存Spine Leaf網(wǎng)絡(luò)拓?fù)浣鉀Q南北向流量問(wèn)題怕敬,但大規(guī)模AI訓(xùn)練負(fù)載造成東西向“流量風(fēng)暴”有網(wǎng)絡(luò)密集型通信,大量的數(shù)據(jù)分布在不同的計(jì)算節(jié)點(diǎn)中帘皿,訓(xùn)練引擎需要不斷計(jì)算模型權(quán)重东跪,并和其它節(jié)點(diǎn)同步優(yōu)化結(jié)果,從而協(xié)同計(jì)算鹰溜,同步成為性能瓶頸虽填,模型規(guī)模增長(zhǎng),需要更高帶寬曹动,高維模型造成權(quán)重的數(shù)量呈指數(shù)增長(zhǎng)和計(jì)算是同步的斋日,所以通信表現(xiàn)為網(wǎng)絡(luò)突發(fā)流量。高帶寬&低延時(shí)網(wǎng)絡(luò)墓陈,強(qiáng)化東西向吞吐恶守,提升AI訓(xùn)練性能有:第一,帶寬從千兆/萬(wàn)兆升級(jí)到100G/200G甚至更高跛蛋;第二熬的,從銅纜升級(jí)到光纖;第三赊级,RDMA技術(shù)運(yùn)用押框,提升跨節(jié)點(diǎn)間數(shù)據(jù)交換效率;第四理逊,InfiniBand網(wǎng)絡(luò)橡伞,最小化通信延遲;第五晋被,通過(guò)強(qiáng)化網(wǎng)卡計(jì)算能力兑徘,降低CPU負(fù)載,提升通信效率羡洛。
高性能計(jì)算:一體化集成系統(tǒng)帶來(lái)更大AI業(yè)務(wù)價(jià)值
一體化集成系統(tǒng)是集算法挂脑,數(shù)據(jù)和計(jì)算基礎(chǔ)設(shè)施為一體的高性能AI集成系統(tǒng)。而松耦合軟硬件是通用處理器欲侮,加速卡崭闲,存儲(chǔ),硬件提供商威蕉,大數(shù)據(jù)平臺(tái)和開(kāi)源AI框架的松散集合刁俭。一體化集成系統(tǒng)涵蓋三大特點(diǎn):第一,端到端優(yōu)化適配韧涨,最大限度發(fā)揮軟硬件效能牍戚,大幅提升性能表現(xiàn)侮繁;第二,整機(jī)柜交付如孝,將交付周期從人/月級(jí)縮短至人/天級(jí)宪哩;第三,一站式解決AI應(yīng)用的軟硬件兼容問(wèn)題暑竟,提升系統(tǒng)穩(wěn)定性斋射,顯著降低運(yùn)維成本。這樣的基礎(chǔ)設(shè)施擁有更好性能/價(jià)格比但荤,更低算力/功耗比罗岖,更少計(jì)算面積,更低總擁有成本腹躁。因而使得業(yè)務(wù)應(yīng)用擁有更敏捷的業(yè)務(wù)響應(yīng)桑包,更低的運(yùn)營(yíng)成本,更精準(zhǔn)的實(shí)時(shí)決策纺非,更穩(wěn)定的業(yè)務(wù)表現(xiàn)哑了。綜上所述,一體化集成系統(tǒng)烧颖,意味著更高效的基礎(chǔ)設(shè)施弱左,從而意味著更大的AI業(yè)務(wù)價(jià)值。
一體化集成系統(tǒng)為AI場(chǎng)景帶來(lái)質(zhì)的飛躍
通過(guò)與AI行業(yè)核心基礎(chǔ)設(shè)施技術(shù)提供商 英特爾公司的深度合作炕淮,第四范式AIO引入Intel Cascade拆火,Optane 固態(tài)硬盤(pán)等技術(shù),擁有了更充沛的算力涂圆,進(jìn)一步加速了企業(yè)實(shí)施AI應(yīng)用的進(jìn)程们镜。
在AI數(shù)據(jù)處理能力上,結(jié)合英特爾Cascade Lake CPU润歉,與第四范式軟硬一體的優(yōu)化模狭,先知AI平臺(tái)分布式模型訓(xùn)練框架訓(xùn)練速度獲得飛躍。在TB級(jí)數(shù)據(jù)規(guī)模下踩衩,“第四范式先知”平臺(tái)的模型訓(xùn)練速度可達(dá)Spark的數(shù)千倍嚼鹉。同時(shí),平臺(tái)將常用驱富、有效的數(shù)據(jù)處理過(guò)程進(jìn)行了產(chǎn)品化封裝锚赤,用戶只需簡(jiǎn)單配置即可對(duì)原始數(shù)據(jù)表進(jìn)行復(fù)雜計(jì)算與處理,使數(shù)據(jù)處理工作量減少80%
英特爾 Optane 固態(tài)盤(pán)則是“第四范式先知”平臺(tái)引入的另一項(xiàng)英特爾 “殺手锏”萌朱,其革命性的3D XPoint? 技術(shù),正在打破內(nèi)存和固態(tài)盤(pán)之間的邊界策菜。它對(duì)于高吞吐量晶疼、低延遲酒贬、高服務(wù)質(zhì)量、高耐用性和非易性特性的融合翠霍,使得它成為第四范式構(gòu)建高效分布式多級(jí)存儲(chǔ)系統(tǒng)的基石锭吨,該系統(tǒng)讓“第四范式先知”平臺(tái)獲得了更高效的存儲(chǔ)和查詢能力。 高性能實(shí)時(shí)特征數(shù)據(jù)庫(kù)也因?yàn)橐隣ptane寒匙,打造了5G-ready的超低延時(shí)零如,以及持久化存儲(chǔ)的能力。
目前锄弱,軟硬一體支撐的核心AI算法已經(jīng)廣泛應(yīng)用到業(yè)務(wù)場(chǎng)景中考蕾。
在金融反欺詐領(lǐng)域,金融機(jī)構(gòu)的傳統(tǒng)做法是通過(guò)專家系統(tǒng)來(lái)辨識(shí)欺詐風(fēng)險(xiǎn)会宪,但這一系統(tǒng)窮盡人力和經(jīng)驗(yàn)肖卧,也只能總結(jié)出數(shù)千條專家規(guī)則,要用來(lái)應(yīng)對(duì)日趨智能化掸鹅、高頻化和精準(zhǔn)化的金融欺詐塞帐,明顯力不從心。AI形成超高維的機(jī)器學(xué)習(xí)能力來(lái)應(yīng)對(duì)這一挑戰(zhàn)巍沙。在數(shù)據(jù)預(yù)處理環(huán)節(jié)葵姥,該平臺(tái)采用全量樣本進(jìn)行數(shù)據(jù)建模。在特征工程階段句携,平臺(tái)抽取交易報(bào)文榔幸、用戶信息等基本信息,再結(jié)合客戶在業(yè)務(wù)中的歷史行為等多樣化特征务甥,利用超高維的機(jī)器學(xué)習(xí)算法牡辽,以及端到端軟硬一體AI基礎(chǔ)設(shè)施的強(qiáng)悍算力,通過(guò)將交易報(bào)文中的原始字段進(jìn)行超高維組合和衍生敞临,最終形成總量超過(guò)25億維的特征集态辛。這些創(chuàng)新幫助其提升信用卡交易反欺詐識(shí)別準(zhǔn)確率達(dá)7倍以上。同時(shí)挺尿,在端到端軟硬一體AI基礎(chǔ)設(shè)施強(qiáng)勁計(jì)算能力的支持下奏黑,平臺(tái)能夠在20毫秒內(nèi)就完成從線上數(shù)據(jù)集成到提供最終欺詐評(píng)分的全過(guò)程,從而實(shí)現(xiàn)“事中反欺詐”编矾。不僅如此熟史,通過(guò)對(duì)英特爾架構(gòu)服務(wù)器進(jìn)行橫向擴(kuò)展, 該平臺(tái)更能實(shí)現(xiàn)每秒數(shù)十萬(wàn)筆交易的吞吐量,使金融反欺詐系統(tǒng)真正實(shí)現(xiàn)了實(shí)時(shí)化窄俏。
在金融產(chǎn)品推薦領(lǐng)域蹂匹,軟硬一體支撐的核心AI算法將個(gè)性化金融產(chǎn)品推薦場(chǎng)景的點(diǎn)擊率107%~574%倍,將規(guī)則從1,000條人工專家規(guī)則增加至2,500,000,000條機(jī)器+人工規(guī)則凹蜈。該軟硬一體基礎(chǔ)設(shè)施正在為中國(guó)金融行業(yè)總資產(chǎn)的半數(shù)以上金融資產(chǎn)提供個(gè)性化金融服務(wù)推薦限寞,反欺詐忍啸,反洗錢(qián)等服務(wù)。
在個(gè)性化內(nèi)容分發(fā)領(lǐng)域履植,軟硬一體支撐的核心AI算法將點(diǎn)擊率提升30%~35%计雌,將業(yè)務(wù)規(guī)則從100條規(guī)則到1,000,000,000條規(guī)則,幫助1000多家客戶搭建基于AI的先進(jìn)推薦系統(tǒng)玫霎。
在糖尿病檢測(cè)等領(lǐng)域凿滤,軟硬一體支撐的核心AI算法幫助醫(yī)療客戶將預(yù)測(cè)準(zhǔn)確率提升2—3倍,將業(yè)務(wù)規(guī)則從10條規(guī)則到500庶近,000條規(guī)則翁脆,全面精準(zhǔn)預(yù)測(cè),提前治療和預(yù)防拦盹。
第四范式也在幫助信貸風(fēng)控鹃祖、供應(yīng)鏈金融、智能獲客廣告投放普舆、智能客服等眾多行業(yè)和領(lǐng)域的企業(yè)用戶實(shí)現(xiàn)AI應(yīng)用的落地恬口。
“第四范式先知”平臺(tái)定位于企業(yè)級(jí)AI核心系統(tǒng),由數(shù)據(jù)核心沼侣、算法核心祖能、生產(chǎn)核心三大模塊組成。通過(guò)與英特爾領(lǐng)先硬件產(chǎn)品與技術(shù)的深度結(jié)合蛾洛,該平臺(tái)不僅覆蓋了AI在生產(chǎn)中的各個(gè)應(yīng)用環(huán)節(jié)养铸,同時(shí)也顯著降低了AI的應(yīng)用門(mén)檻,讓傳統(tǒng)企業(yè)應(yīng)用AI變得更為簡(jiǎn)單高效轧膘,并能幫助企業(yè)實(shí)施從戰(zhàn)略钞螟、策略到執(zhí)行的全面智能化。
?
高維數(shù)據(jù)模型突破機(jī)器學(xué)習(xí)效果瓶頸??
著名科幻著作《三體》*曾勾勒出一種高維空間谎碍,可實(shí)現(xiàn)許多低維空間不可能完成的事情鳞滨。在“第四范式先知”平臺(tái)上,工程師們也巧妙地將數(shù)據(jù)“升維”, 通過(guò)平臺(tái)內(nèi)置的高維模型算法和特征工程算法蟆淀,結(jié)合英特爾高性能硬件產(chǎn)品提供的強(qiáng)大算力拯啦,在萬(wàn)億級(jí)大數(shù)據(jù)和海量特征場(chǎng)景下,平臺(tái)也能表現(xiàn)出出色的計(jì)算性能熔任,得到令人滿意的評(píng)估效果褒链。
數(shù)據(jù)是企業(yè)構(gòu)建AI應(yīng)用的本源,如今企業(yè)的業(yè)務(wù)會(huì)產(chǎn)出TB級(jí)疑苔,乃至PB級(jí)的海量數(shù)據(jù)甫匹。在早期系統(tǒng)中,囿于人力的局限,或者對(duì)非結(jié)構(gòu)化兵迅、非數(shù)字化數(shù)據(jù)處理能力的不足哀墓,企業(yè)對(duì)海量數(shù)據(jù)的利用,往往處于低維度狀態(tài)喷兼,從而無(wú)法深度發(fā)掘數(shù)據(jù)內(nèi)蘊(yùn)含的巨大價(jià)值。
在機(jī)器學(xué)習(xí)中后雷,數(shù)據(jù)的維度越高季惯、數(shù)據(jù)處理速度能力越強(qiáng),學(xué)習(xí)效果就越佳臀突。在數(shù)據(jù)處理能力上勉抓,第四范式自主研發(fā)的分布式模型訓(xùn)練框架也讓訓(xùn)練速度獲得飛躍。在TB級(jí)數(shù)據(jù)規(guī)模下候学,“第四范式先知”平臺(tái)的模型訓(xùn)練速度可達(dá)Spark*的數(shù)百倍1藕筋。同時(shí),平臺(tái)將常用梳码、有效的數(shù)據(jù)處理過(guò)程進(jìn)行了產(chǎn)品化封裝隐圾,用戶只需簡(jiǎn)單配置即可對(duì)原始數(shù)據(jù)表進(jìn)行復(fù)雜計(jì)算與處理,使數(shù)據(jù)處理工作量減少80%2掰茶。