圖數(shù)據(jù)庫(kù)中讨跟，用點(diǎn)還是用屬性來(lái)存儲(chǔ)屬性的權(quán)衡問(wèn)題

在圖數(shù)據(jù)庫(kù)里，有時(shí)候會(huì)碰到一個(gè)看起來(lái)要做出一些取舍的地方鄙煤，那就是：很多元素都有的晾匠，且重復(fù)值很多的一個(gè)屬性，是應(yīng)該將其作為頂點(diǎn)的屬性來(lái)存儲(chǔ)梯刚，還是當(dāng)做一個(gè)頂點(diǎn)凉馆，然后用邊來(lái)將元素指向該頂點(diǎn)來(lái)表示一個(gè)屬性？例如以下的例子：

在我們的圖中需要存儲(chǔ)用戶(hù)注冊(cè)時(shí)的phone段和ip段。這兩個(gè)屬性是所有的用戶(hù)頂點(diǎn)都需要的屬性澜共，而且這兩個(gè)屬性的重復(fù)度比較高向叉，也就是很多很多頂點(diǎn)都有相同的phone段或者ip段。此時(shí)我們有兩種不同的思路來(lái)解決這個(gè)問(wèn)題：

思路1：將phone和ip當(dāng)做用戶(hù)頂點(diǎn)的屬性嗦董。根據(jù)我們需要的讀取模式母谎，給phone和ip創(chuàng)建索引來(lái)加快查詢(xún)效率。

思路2：phone和ip不作為屬性京革，而是將不同的phone和ip段當(dāng)做頂點(diǎn)保存在圖數(shù)據(jù)庫(kù)中奇唤，用戶(hù)的ip和phone的值通過(guò)邊指向不同的代表phone的頂點(diǎn)和ip的頂點(diǎn)，通過(guò)這種方式來(lái)實(shí)現(xiàn)保存其屬性匹摇。

表面看起來(lái)這兩種方式都可以實(shí)現(xiàn)功能咬扇，實(shí)際上他們之間還是有很多不同的。我們需要分析其各自不同的利弊廊勃，從而在不同的情形下選用不同的模型來(lái)解決問(wèn)題懈贺。

用屬性存儲(chǔ)的方式的優(yōu)點(diǎn)：

這種思路更直觀(guān)一些，也更符合我們一般對(duì)頂點(diǎn)和屬性的理解坡垫。

對(duì)與頂點(diǎn)屬性本身的查詢(xún)效率更高一些梭灿，因?yàn)椴簧婕绊旤c(diǎn)的traversal。如果使用頂點(diǎn)的方式存儲(chǔ)葛虐，則涉及到邊的向外遍歷胎源。尤其是如果我們要一次獲取多個(gè)屬性時(shí)，這種方式直接在頂點(diǎn)內(nèi)就可以獲取屿脐，而第二種方式則需要遍歷n條邊來(lái)獲取n個(gè)屬性涕蚤。

存儲(chǔ)需要的空間小一些，不需要在storage backend中使用額外的記錄來(lái)存儲(chǔ)這些保存屬性的點(diǎn)以及指向這些代表屬性的點(diǎn)的邊的诵。

圖的schema會(huì)簡(jiǎn)單一些万栅。不需要額外定義多個(gè)vertex label和edge label。

在導(dǎo)入頂點(diǎn)時(shí)速度會(huì)快一些西疤，尤其是在開(kāi)啟了bulk loading模式時(shí)烦粒。因?yàn)檫@種方式在添加一個(gè)用戶(hù)頂點(diǎn)時(shí)，只需要添加一個(gè)頂點(diǎn)和其對(duì)應(yīng)的屬性即可代赁。而第二種方式里扰她，我們除了需要添加用戶(hù)頂點(diǎn)本身，還要在添加用戶(hù)頂點(diǎn)之前先把屬性頂點(diǎn)添加到庫(kù)里（而在數(shù)據(jù)準(zhǔn)備階段芭碍，還需要將這些屬性的數(shù)據(jù)單獨(dú)剝離出來(lái)徒役，并去掉其重復(fù)值），并在添加用戶(hù)頂點(diǎn)時(shí)從庫(kù)中查詢(xún)已經(jīng)添加的屬性頂點(diǎn)窖壕，并添加指向這些頂點(diǎn)的邊忧勿。這會(huì)導(dǎo)致圖的準(zhǔn)備階段多浪費(fèi)大量的時(shí)間杉女。

用頂點(diǎn)存儲(chǔ)的方式的優(yōu)點(diǎn)：

以上的屬性存儲(chǔ)的方式的優(yōu)點(diǎn)也恰恰是頂點(diǎn)存儲(chǔ)的方式的缺點(diǎn)。這種方式并不直觀(guān)鸳吸，對(duì)頂點(diǎn)屬性值的查詢(xún)效率也不高熏挎，而且會(huì)增加額外的記錄來(lái)保存點(diǎn)和邊。另外會(huì)導(dǎo)致schema變得復(fù)雜晌砾，也會(huì)在導(dǎo)入數(shù)據(jù)時(shí)額外浪費(fèi)時(shí)間花在屬性頂點(diǎn)的查詢(xún)上坎拐。

但這種方式也有其優(yōu)點(diǎn)，那就是將屬性的由點(diǎn)及面變得簡(jiǎn)單贡羔，尤其是在一個(gè)分析中涉及多個(gè)由點(diǎn)及面的情形時(shí)廉白，這種方式的優(yōu)點(diǎn)就能展現(xiàn)出來(lái)。而這也常常是圖數(shù)據(jù)庫(kù)需要做的東西乖寒，尤其在涉及社群分析時(shí)。

我們這里的由點(diǎn)及面代表的含義是：我們需要找出所有的跟某個(gè)或者某幾個(gè)頂點(diǎn)的某些屬性相同的全部頂點(diǎn)院溺。

以以下的要求為例：當(dāng)我們需要找到跟張三和李四使用同一個(gè)電話(huà)段或者ip段的用戶(hù)使用的phone和ip的分組情況楣嘁。

如果我們的圖的schema是基于第一種情況存儲(chǔ)的，這就變成了一個(gè)比較棘手的問(wèn)題珍逸。我們需要首先找到張三和李四的電話(huà)作為phoneSet逐虚，然后找到張三和李四的ip作為ipSet，然后查詢(xún)電話(huà)和ip與集合中的值相同的記錄谆膳。

這種需求叭爱，如果放在普通的數(shù)據(jù)庫(kù)中，實(shí)際上就是根據(jù)屬性的join操作漱病。這種看似簡(jiǎn)單的操作在圖數(shù)據(jù)庫(kù)中要實(shí)現(xiàn)確面臨比較大的困難买雾，原因在于：圖數(shù)據(jù)庫(kù)中解決連接的操作是通過(guò)邊來(lái)實(shí)現(xiàn)的，且沒(méi)有別的解決方式杨帽。換句話(huà)說(shuō)漓穿，圖數(shù)據(jù)庫(kù)中，相同屬性之間的點(diǎn)是沒(méi)有東西能夠?qū)⑵淇焖龠B接起來(lái)的注盈。

這也就是第二種方式最大的意義所在晃危。以該題為例，我們通過(guò)gremlin可以很容易的實(shí)現(xiàn)（假設(shè)張三的頂點(diǎn)是v3老客，李四頂點(diǎn)是v4）：

g.V(v3, v4).out("ip", "phone").in("ip", "phone").values().groupCount()

總結(jié)：如果屬性重復(fù)度很低僚饭，或者屬性不涉及連接操作，則使用屬性存儲(chǔ)是更好也更直觀(guān)的方式胧砰。但如果涉及屬性的連接操作鳍鸵，而且屬性的重復(fù)度很高，則可以考慮用點(diǎn)來(lái)存儲(chǔ)屬性朴则。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末权纤，一起剝皮案震驚了整個(gè)濱河市钓简，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌汹想，老刑警劉巖外邓，帶你破解...
沈念sama閱讀 217,277評(píng)論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異古掏，居然都是意外死亡损话，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,689評(píng)論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)槽唾，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)丧枪，“玉大人，你說(shuō)我怎么就攤上這事庞萍∨》常” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 163,624評(píng)論 0贊 353
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵钝计，是天一觀(guān)的道長(zhǎng)恋博。經(jīng)常有香客問(wèn)我，道長(zhǎng)私恬，這世上最難降的妖魔是什么债沮？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,356評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮本鸣，結(jié)果婚禮上疫衩，老公的妹妹穿的比我還像新娘。我一直安慰自己荣德，他們只是感情好闷煤，可當(dāng)我...
茶點(diǎn)故事閱讀 67,402評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著命爬，像睡著了一般曹傀。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上饲宛，一...
開(kāi)封第一講書(shū)人閱讀 51,292評(píng)論 1贊 301
城市分裂傳說(shuō)
那天皆愉，我揣著相機(jī)與錄音，去河邊找鬼艇抠。笑死幕庐，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的家淤。我是一名探鬼主播异剥，決...
沈念sama閱讀 40,135評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼絮重！你這毒婦竟也來(lái)了冤寿？” 一聲冷哼從身側(cè)響起歹苦，我...
開(kāi)封第一講書(shū)人閱讀 38,992評(píng)論 0贊 275
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎督怜，沒(méi)想到半個(gè)月后殴瘦，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,429評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡号杠，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,636評(píng)論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年蚪腋，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片姨蟋。...
茶點(diǎn)故事閱讀 39,785評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡屉凯，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出眼溶，到底是詐尸還是另有隱情悠砚，我是刑警寧澤，帶...
沈念sama閱讀 35,492評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布偷仿，位于F島的核電站哩簿，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏酝静。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,092評(píng)論 3贊 328
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一羡玛、第九天我趴在偏房一處隱蔽的房頂上張望别智。院中可真熱鬧，春花似錦稼稿、人聲如沸薄榛。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,723評(píng)論 0贊 22
一樁弒父案让歼，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)敞恋。三九已至，卻和暖如春谋右，著一層夾襖步出監(jiān)牢的瞬間硬猫，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,858評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工改执，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留啸蜜，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,891評(píng)論 2贊 370
代替公主和親
正文我出身青樓辈挂，卻偏偏與公主長(zhǎng)得像衬横，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子终蒂，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,713評(píng)論 2贊 354

圖數(shù)據(jù)庫(kù)中巾陕，用點(diǎn)還是用屬性來(lái)存儲(chǔ)屬性的權(quán)衡問(wèn)題

圖數(shù)據(jù)庫(kù)中讨跟，用點(diǎn)還是用屬性來(lái)存儲(chǔ)屬性的權(quán)衡問(wèn)題

用屬性存儲(chǔ)的方式的優(yōu)點(diǎn)：

用頂點(diǎn)存儲(chǔ)的方式的優(yōu)點(diǎn)：

推薦閱讀更多精彩內(nèi)容