圖數(shù)據(jù)庫選型前調(diào)

百度

百度的圖數(shù)據(jù)庫產(chǎn)品有2個。

1. BGraph?:?BGraph是面向商業(yè)的圖數(shù)據(jù)庫產(chǎn)品，基本百度多年的知識圖譜技術(shù)沉淀欺缘，自研了圖存儲和圖計算引擎，并針對檢索和深度連接分析做了深入優(yōu)化挤安，整體通用C++ 實現(xiàn)谚殊，具有毫秒級查詢響應(yīng)，并能支持?jǐn)?shù)萬的QPS蛤铜。BGraph能支持?jǐn)?shù)億級頂點的圖數(shù)據(jù)嫩絮，能通過分片和副本分布式可擴展，滿足業(yè)務(wù)的快速增長围肥；支持多實例副本剿干，具有實時容錯能力，單實例的故障不會影響查詢服務(wù)穆刻，旨在提供超過 99.99％的可用性怨愤；支持業(yè)界流行的 Property Graph 數(shù)據(jù)模型和 Gremlin查詢語言，并對Gremlin進行擴展蛹批，支持特色的高性能圖算法撰洗。

體驗地址：https://ai.baidu.com/tech/kg/bgraph

2. HugeGraph：HugeGraph是百度安全部開源的一款開源圖數(shù)據(jù)庫產(chǎn)品篮愉。HugeGraph是一款面向分析型，支持批量操作的圖數(shù)據(jù)庫系統(tǒng)差导，它能夠與大數(shù)據(jù)平臺無縫集成试躏，有效解決海量圖數(shù)據(jù)的存儲、查詢和關(guān)聯(lián)分析需求设褐。HugeGraph支持HBase和Cassandra等常見的分布式系統(tǒng)作為其存儲引擎來實現(xiàn)水平擴展颠蕴。HugeGraph可以與Spark GraphX進行鏈接，借助Spark GraphX圖分析算法（如PageRank助析、Connected Components犀被、Triangle Count等）對HugeGraph的數(shù)據(jù)進行分析挖掘。

詳細(xì)介紹：https://zhuanlan.zhihu.com/p/41240429

?阿里云

1. GDB：GDB（Graph Database）是阿里云上一款標(biāo)準(zhǔn)圖數(shù)據(jù)產(chǎn)品外冀，目前正在公測中寡键，官網(wǎng)提示正式商業(yè)化時間是2019年12月31日。GDB是一種支持屬性圖模型雪隧，用于處理高度連接數(shù)據(jù)查詢與存儲的實時可靠的在線數(shù)據(jù)庫西轩，支持 TinkerPop Gremlin 查詢語言；高度優(yōu)化的自研圖計算層和存儲層脑沿，云盤多副本保障數(shù)據(jù)超高可靠藕畔，支持ACID事務(wù)；支持高可用實例庄拇，節(jié)點故障迅速轉(zhuǎn)移注服，保障業(yè)務(wù)連續(xù)性；提供備份恢復(fù)措近，自動升級溶弟，監(jiān)控告警，故障切換等豐富的運維功能熄诡，大幅降低運維成本可很。

體驗地址：https://www.aliyun.com/product/gdb

2.?GraphDB：GraphDB是阿里云更早起發(fā)布的一款圖數(shù)據(jù)庫產(chǎn)品，包含在HBase 2.0版本中凰浮，用戶在購買云上HBase數(shù)據(jù)庫服務(wù)時我抠，可以選擇GraphDB作為其圖數(shù)據(jù)引擎。GraphDB引擎本身并不額外收費袜茧，對于需要使用圖數(shù)據(jù)功能的用戶而言菜拓，將大幅降低應(yīng)用和開發(fā)成本。現(xiàn)階段主打OLTP能力笛厦，可以使用spark graphframes拓展圖分析能力纳鼎。您可以在數(shù)據(jù)庫中創(chuàng)建，查詢和修改許多圖形。GraphDB基于Apache Tinkerpop棧構(gòu)建贱鄙，并使用Gremlin語言進行遍歷劝贸，更新和查詢。

螞蟻金服

GeaBase：GeaBase（Graph Exploration and Analytics Database）是我剛進入圖數(shù)據(jù)庫領(lǐng)域時最早聽聞的國產(chǎn)圖數(shù)據(jù)庫逗宁，主打中國首個實時金融級分布式圖數(shù)據(jù)庫映九。實時和金融級2個前綴彰顯了GeaBase的技術(shù)底蘊。首先瞎颗，GeaBase支持海量的數(shù)據(jù)蹈胡。目前咱揍，GeaBase支撐著螞蟻金服的多個關(guān)鍵應(yīng)用場景，包括風(fēng)控關(guān)系網(wǎng)絡(luò)礼华、資金關(guān)系網(wǎng)絡(luò)翩伪，都達(dá)到百億個節(jié)點春塌、千億條邊的海量數(shù)據(jù)規(guī)模凳忙，其計算查詢能力達(dá)到了非常高的水準(zhǔn)疫赎。其次，GeaBase擁有非常強悍的在線查詢性能僻孝，支持高并發(fā)导帝，且具備毫秒級的低延時能力守谓。通過與Titan的對比穿铆，可以看到無論是延時還是吞吐量，GeaBase的查詢性能都領(lǐng)先許多斋荞。GeaBase還具備高可用的特性荞雏。其配置了多種容錯機制，引入了多集群和多方位的監(jiān)控體系平酿，并配備了分布式架構(gòu)的容災(zāi)方案凤优，這一切都是為了保證高可用性。螞蟻金服還為GeaBase研發(fā)了靈活且可擴展的查詢語言蜈彼。另外筑辨，為了和開源結(jié)合，GeaBase還將支持Gremlin圖遍歷語言幸逆。

參考：http://www.reibang.com/p/dbd1d9526a39

體驗地址：https://tech.antfin.com/products/GEABASE

費馬科技

費馬科技是一個專注圖數(shù)據(jù)庫和圖計算的創(chuàng)業(yè)公司棍辕，主打：快如閃電的高性能圖數(shù)據(jù)存儲及分析平臺，已經(jīng)在京東金融部署还绘。

LightGraph 是費馬科技自主研發(fā)的圖數(shù)據(jù)庫產(chǎn)品楚昭。其主要特點是單機大數(shù)據(jù)量，高吞吐率拍顷，以及靈活的 API抚太，同時支持高效的在線事務(wù)處理（OLTP）和在線分析處理（OLAP）。LightGraph支持 TB 級大容量存儲，可以輕松支持十億級別頂點和百億級別的邊尿贫。使用無鎖設(shè)計电媳，從而大大提高了高負(fù)載下的吞吐率，可以達(dá)到千萬頂點/秒的高吞吐率庆亡。除了強大的事務(wù)處理能力匆背，還具備豐富和可擴展的分析處理功能，能夠高效身冀、在線地進行 PageRank钝尸、連通分量等復(fù)雜的圖計算過程，省去了用戶需要另行搭建并將數(shù)據(jù)導(dǎo)出搂根、轉(zhuǎn)換珍促、再導(dǎo)入到專門的分析系統(tǒng)的麻煩。另外LightGraph還支持高可用剩愧，具有嚴(yán)格的ACID支持和高效靈活的API猪叙。

PandaGraph是一個運行在linux系統(tǒng)上的內(nèi)存圖計算系統(tǒng)，其雙模式引擎會自動地在“ 稀疏”和“稠密”模式間切換仁卷，來優(yōu)化圖狀結(jié)構(gòu)數(shù)據(jù)上的迭代式并行計算穴翩。在對文件系統(tǒng)的支持上，PandaGraph可以自動處理hdfs文件系統(tǒng)上的文件锦积，用戶無需任何配置即可使用PandaGraph對hdfs文件進行處理芒帕。此外，PandaGraph中還內(nèi)置了幾十種常見的圖計算應(yīng)用程序丰介，用戶可以用符合格式的圖數(shù)據(jù)背蟆，直接使用這些程序進行計算。

體驗地址：https://fma-ai.cn/product

知乎官方賬號：https://www.zhihu.com/org/fei-ma-ke-ji/activities

創(chuàng)鄰科技

創(chuàng)鄰科技也是一個專注圖數(shù)據(jù)庫和圖計算領(lǐng)域的創(chuàng)業(yè)公司哮幢。目前具有分布式圖數(shù)據(jù)庫带膀、分布式圖計算平臺、可視化分析引擎三款產(chǎn)品橙垢。分布式圖數(shù)據(jù)庫Galaxybase獲得了世界上第一個也是目前唯一一個關(guān)于分布式圖數(shù)據(jù)庫和圖計算系統(tǒng)的專利垛叨，具有自主知識產(chǎn)權(quán)。

Galaxybase的數(shù)據(jù)關(guān)聯(lián)查詢性能較目前國際同類技術(shù)服務(wù)商快數(shù)十倍柜某，較傳統(tǒng)關(guān)系型數(shù)據(jù)庫技術(shù)快數(shù)千倍嗽元；海量數(shù)據(jù)擴展性能承載千億節(jié)點的超級大圖；提供銀行級別的事務(wù)支持莺琳。分布式圖計算平臺还棱，采用第三代高性能分布式運算技術(shù)，實現(xiàn)分布式圖數(shù)據(jù)的“存儲+運算”一體化惭等，支撐海量數(shù)據(jù)的高并發(fā)實時讀寫珍手、查詢、運算及分析×找可視化分析引擎自動將人寡具、事、物等多元信息精準(zhǔn)組織成領(lǐng)域知識圖譜稚补，通過可視化圖形界面簡易部署算法童叠、構(gòu)架模型、實時計算并展示結(jié)果课幕，實現(xiàn)數(shù)據(jù)關(guān)聯(lián)挖掘厦坛、異常關(guān)聯(lián)監(jiān)控。

創(chuàng)鄰科技斬獲“2019互聯(lián)網(wǎng)+知識圖譜深度挖掘認(rèn)知領(lǐng)域影響力企業(yè)”和“2019互聯(lián)網(wǎng)+圖數(shù)據(jù)存儲優(yōu)秀解決方案企業(yè)”雙項大獎乍惊。

體驗地址：http://www.chuanglintech.cn/#/home

歐若數(shù)網(wǎng)

Nebula Graph是世界上唯一能夠容納千億個頂點和萬億條邊杜秸，并提供毫秒級查詢延時的圖數(shù)據(jù)庫解決方案，適用于需要快速遍歷多關(guān)系的任何案例润绎，如社交網(wǎng)絡(luò)撬碟，知識圖譜，欺詐檢測等領(lǐng)域莉撇。Nebula Graph 的目標(biāo)是為超大規(guī)模圖數(shù)據(jù)提供高并發(fā)呢蛤，低延時的讀、寫及計算棍郎。Nebula Graph 的具有全對稱分布式架構(gòu)其障、可擴展、高可用坝撑、數(shù)據(jù)強一致静秆、類 SQL 查詢語言粮揉、用戶鑒權(quán)巡李、支持多存儲后端等功能，同時具備高度的安全性扶认。Nebula Graph是開源的侨拦，使用Apache 2.0許可證，可以免費下載辐宾，修改以及部署源代碼狱从。

Nebula 在設(shè)計存儲時，采用 share-nothing 的分布式架構(gòu)叠纹，本質(zhì)上存儲節(jié)點間沒有數(shù)據(jù)共享季研，也就是整個分布式結(jié)構(gòu)無中心節(jié)點。這樣的好處在于誉察，第一与涡，容易做水平拓展；第二，即使部分機器 Crash驼卖，通過數(shù)據(jù)強一致性—— Raft 協(xié)議能保證整個系統(tǒng)的可用性氨肌，不會丟失數(shù)據(jù)。整個的核心代碼都是 C++ 寫的酌畜，這樣保證了執(zhí)行效率怎囚。其次，做了很多并行和異步執(zhí)行的優(yōu)化桥胞。第三個是計算下推恳守。在分布式系統(tǒng)里面，硬件上網(wǎng)絡(luò)對整體性能的影響最大贩虾，所以數(shù)據(jù)搬遷是一個很低效的動作井誉。有些開源圖數(shù)據(jù)庫產(chǎn)品，比如 JanusGraph整胃，它的存儲層在 HBase颗圣，上面有個單獨的計算層，當(dāng)計算層需要數(shù)據(jù)的時候屁使，會到 HBase 里面拉回大量的數(shù)據(jù)在岂，再做過濾和計算。舉個例子蛮寂，1 萬條數(shù)據(jù)里面最終過濾出 100 條蔽午，那相當(dāng)于 99% 的網(wǎng)絡(luò)傳輸都浪費了。所以 Nebula 的設(shè)計方案是移動計算酬蹋，而不是數(shù)據(jù)及老，計算下推到存儲層，像前面這個例子范抓，直接在存儲層做完過濾再回傳計算層骄恶，這樣可以有 100 倍的加速

Nebula Graph的文檔非常豐富，還提供docker鏡像匕垫。極其到位的體驗僧鲁，高效發(fā)布4個迭代版本。

項目地址：https://github.com/vesoft-inc/nebula/blob/master/README-CN.md

知乎官方賬號：https://www.zhihu.com/org/nebulagraph/activities

北京大學(xué)王選計算機研究所

gStore大規(guī)模圖數(shù)據(jù)庫管理系統(tǒng)是北京大學(xué)王選計算機研究所鄒磊教授研究團隊自主研發(fā)的具有完全自主知識產(chǎn)權(quán)的開源圖數(shù)據(jù)庫系統(tǒng)象泵。大量的基準(zhǔn)知識圖譜數(shù)據(jù)的評測結(jié)果和第三方的評測報告顯示gStore系統(tǒng)在圖譜數(shù)據(jù)量大寞秃、查詢復(fù)雜等環(huán)境下其性能要明顯優(yōu)于現(xiàn)有的工業(yè)圖數(shù)據(jù)庫系統(tǒng)。該項目發(fā)表了數(shù)據(jù)庫領(lǐng)域國際頂級期刊和會議論文（包括SIGMOD偶惠，VLDB）等30余篇春寿，被國內(nèi)外學(xué)術(shù)同行引用超過2000次，前期理論研究成果獲得教育部自然科學(xué)二等獎（獲獎項目名稱：“大規(guī)模圖結(jié)構(gòu)數(shù)據(jù)管理”）忽孽。有一篇文章《開源圖數(shù)據(jù)庫項目gStore的應(yīng)用與合作介紹》做了非常詳細(xì)的講解绑改。