百度
百度的圖數(shù)據(jù)庫產(chǎn)品有2個。
1. BGraph?:?BGraph是面向商業(yè)的圖數(shù)據(jù)庫產(chǎn)品,基本百度多年的知識圖譜技術(shù)沉淀欺缘,自研了圖存儲和圖計算引擎,并針對檢索和深度連接分析做了深入優(yōu)化挤安,整體通用C++ 實現(xiàn)谚殊,具有毫秒級查詢響應(yīng),并能支持?jǐn)?shù)萬的QPS蛤铜。BGraph能支持?jǐn)?shù)億級頂點的圖數(shù)據(jù)嫩絮,能通過分片和副本分布式可擴展,滿足業(yè)務(wù)的快速增長围肥;支持多實例副本剿干,具有實時容錯能力,單實例的故障不會影響查詢服務(wù)穆刻,旨在提供超過 99.99% 的可用性怨愤;支持業(yè)界流行的 Property Graph 數(shù)據(jù)模型和 Gremlin查詢語言,并對Gremlin進行擴展蛹批,支持特色的高性能圖算法撰洗。
體驗地址:https://ai.baidu.com/tech/kg/bgraph
2. HugeGraph:HugeGraph是百度安全部開源的一款開源圖數(shù)據(jù)庫產(chǎn)品篮愉。HugeGraph是一款面向分析型,支持批量操作的圖數(shù)據(jù)庫系統(tǒng)差导,它能夠與大數(shù)據(jù)平臺無縫集成试躏,有效解決海量圖數(shù)據(jù)的存儲、查詢和關(guān)聯(lián)分析需求设褐。HugeGraph支持HBase和Cassandra等常見的分布式系統(tǒng)作為其存儲引擎來實現(xiàn)水平擴展颠蕴。HugeGraph可以與Spark GraphX進行鏈接,借助Spark GraphX圖分析算法(如PageRank助析、Connected Components犀被、Triangle Count等)對HugeGraph的數(shù)據(jù)進行分析挖掘。
詳細(xì)介紹:https://zhuanlan.zhihu.com/p/41240429
?阿里云
1. GDB:GDB(Graph Database)是阿里云上一款標(biāo)準(zhǔn)圖數(shù)據(jù)產(chǎn)品外冀,目前正在公測中寡键,官網(wǎng)提示正式商業(yè)化時間是2019年12月31日。GDB是一種支持屬性圖模型雪隧,用于處理高度連接數(shù)據(jù)查詢與存儲的實時可靠的在線數(shù)據(jù)庫西轩,支持 TinkerPop Gremlin 查詢語言;高度優(yōu)化的自研圖計算層和存儲層脑沿,云盤多副本保障數(shù)據(jù)超高可靠藕畔,支持ACID事務(wù);支持高可用實例庄拇,節(jié)點故障迅速轉(zhuǎn)移注服,保障業(yè)務(wù)連續(xù)性;提供備份恢復(fù)措近,自動升級溶弟,監(jiān)控告警,故障切換等豐富的運維功能熄诡,大幅降低運維成本可很。
體驗地址:https://www.aliyun.com/product/gdb
2.?GraphDB:GraphDB是阿里云更早起發(fā)布的一款圖數(shù)據(jù)庫產(chǎn)品,包含在HBase 2.0版本中凰浮,用戶在購買云上HBase數(shù)據(jù)庫服務(wù)時我抠,可以選擇GraphDB作為其圖數(shù)據(jù)引擎。GraphDB引擎本身并不額外收費袜茧,對于需要使用圖數(shù)據(jù)功能的用戶而言菜拓,將大幅降低應(yīng)用和開發(fā)成本。現(xiàn)階段主打OLTP能力笛厦,可以使用spark graphframes拓展圖分析能力纳鼎。您可以在數(shù)據(jù)庫中創(chuàng)建,查詢和修改許多圖形。GraphDB基于Apache Tinkerpop棧構(gòu)建贱鄙,并使用Gremlin語言進行遍歷劝贸,更新和查詢。
更多請參考:阿里云圖數(shù)據(jù)庫GraphDB上線 業(yè)務(wù)場景全解析
螞蟻金服
GeaBase:GeaBase(Graph Exploration and Analytics Database)是我剛進入圖數(shù)據(jù)庫領(lǐng)域時最早聽聞的國產(chǎn)圖數(shù)據(jù)庫逗宁,主打中國首個實時金融級分布式圖數(shù)據(jù)庫映九。實時和金融級2個前綴彰顯了GeaBase的技術(shù)底蘊。首先瞎颗,GeaBase支持海量的數(shù)據(jù)蹈胡。目前咱揍,GeaBase支撐著螞蟻金服的多個關(guān)鍵應(yīng)用場景,包括風(fēng)控關(guān)系網(wǎng)絡(luò)礼华、資金關(guān)系網(wǎng)絡(luò)翩伪,都達(dá)到百億個節(jié)點春塌、千億條邊的海量數(shù)據(jù)規(guī)模凳忙,其計算查詢能力達(dá)到了非常高的水準(zhǔn)疫赎。其次,GeaBase擁有非常強悍的在線查詢性能僻孝,支持高并發(fā)导帝,且具備毫秒級的低延時能力守谓。通過與Titan的對比穿铆,可以看到無論是延時還是吞吐量,GeaBase的查詢性能都領(lǐng)先許多斋荞。GeaBase還具備高可用的特性荞雏。其配置了多種容錯機制,引入了多集群和多方位的監(jiān)控體系平酿,并配備了分布式架構(gòu)的容災(zāi)方案凤优,這一切都是為了保證高可用性。螞蟻金服還為GeaBase研發(fā)了靈活且可擴展的查詢語言蜈彼。另外筑辨,為了和開源結(jié)合,GeaBase還將支持Gremlin圖遍歷語言幸逆。
參考:http://www.reibang.com/p/dbd1d9526a39
體驗地址:https://tech.antfin.com/products/GEABASE
費馬科技
費馬科技是一個專注圖數(shù)據(jù)庫和圖計算的創(chuàng)業(yè)公司棍辕,主打:快如閃電的高性能圖數(shù)據(jù)存儲及分析平臺,已經(jīng)在京東金融部署还绘。
LightGraph 是費馬科技自主研發(fā)的圖數(shù)據(jù)庫產(chǎn)品楚昭。其主要特點是單機大數(shù)據(jù)量,高吞吐率拍顷,以及靈活的 API抚太,同時支持高效的在線事務(wù)處理(OLTP)和在線分析處理(OLAP)。LightGraph支持 TB 級大容量存儲,可以輕松支持十億級別頂點和百億級別的邊尿贫。使用無鎖設(shè)計电媳,從而大大提高了高負(fù)載下的吞吐率,可以達(dá)到千萬頂點/秒的高吞吐率庆亡。除了強大的事務(wù)處理能力匆背,還具備豐富和可擴展的分析處理功能,能夠高效身冀、在線地進行 PageRank钝尸、連通分量等復(fù)雜的圖計算過程,省去了用戶需要另行搭建并將數(shù)據(jù)導(dǎo)出搂根、轉(zhuǎn)換珍促、再導(dǎo)入到專門的分析系統(tǒng)的麻煩。另外LightGraph還支持高可用剩愧,具有嚴(yán)格的ACID支持和高效靈活的API猪叙。
PandaGraph是一個運行在linux系統(tǒng)上的內(nèi)存圖計算系統(tǒng),其雙模式引擎會自動地在“ 稀疏”和“稠密”模式間切換仁卷,來優(yōu)化圖狀結(jié)構(gòu)數(shù)據(jù)上的迭代式并行計算穴翩。在對文件系統(tǒng)的支持上,PandaGraph可以自動處理hdfs文件系統(tǒng)上的文件锦积,用戶無需任何配置即可使用PandaGraph對hdfs文件進行處理芒帕。此外,PandaGraph中還內(nèi)置了幾十種常見的圖計算應(yīng)用程序丰介,用戶可以用符合格式的圖數(shù)據(jù)背蟆,直接使用這些程序進行計算。
體驗地址:https://fma-ai.cn/product
知乎官方賬號:https://www.zhihu.com/org/fei-ma-ke-ji/activities
創(chuàng)鄰科技
創(chuàng)鄰科技也是一個專注圖數(shù)據(jù)庫和圖計算領(lǐng)域的創(chuàng)業(yè)公司哮幢。目前具有分布式圖數(shù)據(jù)庫带膀、分布式圖計算平臺、可視化分析引擎三款產(chǎn)品橙垢。分布式圖數(shù)據(jù)庫Galaxybase獲得了世界上第一個也是目前唯一一個關(guān)于分布式圖數(shù)據(jù)庫和圖計算系統(tǒng)的專利垛叨,具有自主知識產(chǎn)權(quán)。
Galaxybase的數(shù)據(jù)關(guān)聯(lián)查詢性能較目前國際同類技術(shù)服務(wù)商快數(shù)十倍柜某,較傳統(tǒng)關(guān)系型數(shù)據(jù)庫技術(shù)快數(shù)千倍嗽元;海量數(shù)據(jù)擴展性能承載千億節(jié)點的超級大圖;提供銀行級別的事務(wù)支持莺琳。分布式圖計算平臺还棱,采用第三代高性能分布式運算技術(shù),實現(xiàn)分布式圖數(shù)據(jù)的“存儲+運算”一體化惭等,支撐海量數(shù)據(jù)的高并發(fā)實時讀寫珍手、查詢、運算及分析×找可視化分析引擎自動將人寡具、事、物等多元信息精準(zhǔn)組織成領(lǐng)域知識圖譜稚补,通過可視化圖形界面簡易部署算法童叠、構(gòu)架模型、實時計算并展示結(jié)果课幕,實現(xiàn)數(shù)據(jù)關(guān)聯(lián)挖掘厦坛、異常關(guān)聯(lián)監(jiān)控。
創(chuàng)鄰科技斬獲“2019互聯(lián)網(wǎng)+知識圖譜深度挖掘認(rèn)知領(lǐng)域影響力企業(yè)”和“2019互聯(lián)網(wǎng)+圖數(shù)據(jù)存儲優(yōu)秀解決方案企業(yè)”雙項大獎乍惊。
體驗地址:http://www.chuanglintech.cn/#/home
歐若數(shù)網(wǎng)
Nebula Graph是世界上唯一能夠容納千億個頂點和萬億條邊杜秸,并提供毫秒級查詢延時的圖數(shù)據(jù)庫解決方案,適用于需要快速遍歷多關(guān)系的任何案例润绎,如社交網(wǎng)絡(luò)撬碟,知識圖譜,欺詐檢測等領(lǐng)域莉撇。Nebula Graph 的目標(biāo)是為超大規(guī)模圖數(shù)據(jù)提供高并發(fā)呢蛤,低延時的讀、寫及計算棍郎。Nebula Graph 的具有全對稱分布式架構(gòu)其障、可擴展、高可用坝撑、數(shù)據(jù)強一致静秆、類 SQL 查詢語言粮揉、用戶鑒權(quán)巡李、支持多存儲后端等功能,同時具備高度的安全性扶认。Nebula Graph是開源的侨拦,使用Apache 2.0許可證,可以免費下載辐宾,修改以及部署源代碼狱从。
Nebula 在設(shè)計存儲時,采用 share-nothing 的分布式架構(gòu)叠纹,本質(zhì)上存儲節(jié)點間沒有數(shù)據(jù)共享季研,也就是整個分布式結(jié)構(gòu)無中心節(jié)點。這樣的好處在于誉察,第一与涡,容易做水平拓展;第二,即使部分機器 Crash驼卖,通過數(shù)據(jù)強一致性—— Raft 協(xié)議能保證整個系統(tǒng)的可用性氨肌,不會丟失數(shù)據(jù)。整個的核心代碼都是 C++ 寫的酌畜,這樣保證了執(zhí)行效率怎囚。其次,做了很多并行和異步執(zhí)行的優(yōu)化桥胞。第三個是計算下推恳守。在分布式系統(tǒng)里面,硬件上網(wǎng)絡(luò)對整體性能的影響最大贩虾,所以數(shù)據(jù)搬遷是一個很低效的動作井誉。有些開源圖數(shù)據(jù)庫產(chǎn)品,比如 JanusGraph整胃,它的存儲層在 HBase颗圣,上面有個單獨的計算層,當(dāng)計算層需要數(shù)據(jù)的時候屁使,會到 HBase 里面拉回大量的數(shù)據(jù)在岂,再做過濾和計算。舉個例子蛮寂,1 萬條數(shù)據(jù)里面最終過濾出 100 條蔽午,那相當(dāng)于 99% 的網(wǎng)絡(luò)傳輸都浪費了。所以 Nebula 的設(shè)計方案是移動計算酬蹋,而不是數(shù)據(jù)及老,計算下推到存儲層,像前面這個例子范抓,直接在存儲層做完過濾再回傳計算層骄恶,這樣可以有 100 倍的加速
Nebula Graph的文檔非常豐富,還提供docker鏡像匕垫。極其到位的體驗僧鲁,高效發(fā)布4個迭代版本。
項目地址:https://github.com/vesoft-inc/nebula/blob/master/README-CN.md
知乎官方賬號:https://www.zhihu.com/org/nebulagraph/activities
北京大學(xué)王選計算機研究所
gStore大規(guī)模圖數(shù)據(jù)庫管理系統(tǒng)是北京大學(xué)王選計算機研究所鄒磊教授研究團隊自主研發(fā)的具有完全自主知識產(chǎn)權(quán)的開源圖數(shù)據(jù)庫系統(tǒng)象泵。大量的基準(zhǔn)知識圖譜數(shù)據(jù)的評測結(jié)果和第三方的評測報告顯示gStore系統(tǒng)在圖譜數(shù)據(jù)量大寞秃、查詢復(fù)雜等環(huán)境下其性能要明顯優(yōu)于現(xiàn)有的工業(yè)圖數(shù)據(jù)庫系統(tǒng)。該項目發(fā)表了數(shù)據(jù)庫領(lǐng)域國際頂級期刊和會議論文(包括SIGMOD偶惠,VLDB)等30余篇春寿,被國內(nèi)外學(xué)術(shù)同行引用超過2000次,前期理論研究成果獲得教育部自然科學(xué)二等獎(獲獎項目名稱:“大規(guī)模圖結(jié)構(gòu)數(shù)據(jù)管理”)忽孽。有一篇文章《開源圖數(shù)據(jù)庫項目gStore的應(yīng)用與合作介紹》做了非常詳細(xì)的講解绑改。