寫在前面
關(guān)于什么是索引以及唯一索引這里就不做說明了,不清楚的可以自行谷歌或者百度搬俊。是什么引起我寫這篇文章呢紊扬,這來自于之前項目中的一個問題。
我們用的是MongoDB數(shù)據(jù)存儲用戶信息唉擂,用戶表中曾經(jīng)用戶注冊是通過手機號注冊的餐屎,所以很理所當(dāng)然的給手機號加上了唯一索引(Unique),這是沒有什么毛病玩祟。后期腹缩,我們需求改了。你也可以想到變成了既可以手機號注冊又可以郵箱注冊空扎,這個時候由于手機號加了Unique索引藏鹊,事實上這時候是會出現(xiàn)問題的。
func init() {
phoneIndex := mgo.Index{
Key: []string{"phone"},
Unique: true,
}
col := db.Collection(&User{})
col.EnsureIndex(phoneIndex)
}
當(dāng)然這問題其實也容易想到转锈,當(dāng)用戶通過郵箱注冊此時手機號填空的時候盘寡,第一次沒什么問題,下個用戶再以這種方式注冊的時候便會提示建立在phone上的索引值重復(fù)撮慨,很正常嘛竿痰,因為插入了兩個空值,注意這里是空字符串砌溺,而不是null影涉。
于是我們嘗試修改,由于MongoDB是文檔型靈活的數(shù)據(jù)庫规伐,少插多插一兩個字段不受影響蟹倾,所以我們嘗試修改User實體Phone字段的入口,當(dāng)phone是空字符串的時候,不讓插入此字段党觅。于是笆包,我們便在phone字段中加入了omitempty標(biāo)簽(我們微服務(wù)用Go語言寫的)。下面展示User一部分內(nèi)容:
type User struct {
Email string `bson:"email"`
Salt string `bson:"salt"`
Phone string `bson:"phone,omitempty"`
IDCard string `bson:"idcard"`
RealName string `bson:"realname"`
AuthStatus int `bson:"auth_status"`
}
可以看到phone字段后加了omitempty標(biāo)簽岔留,表示當(dāng)該字段為空的時候不插入。這還是會出現(xiàn)問題检柬,那么既然還是會出問題為什么會想到這么解決呢献联?這源于對Mysql的使用經(jīng)驗,習(xí)慣性的以為MongoDB和Mysql那樣何址,對null的值會不做其索引里逆。也就是說,在Mysql中用爪,若在多條記錄中Phone值為Null是被允許的原押。
上面那種做法,還是會報錯偎血,提示插入了重復(fù)的值诸衔,只不過這時不是空字符串盯漂,而是null。所以有時候就不要把Mysql那套拿來了笨农,Mysql是可以的就缆,但Mongo不行。mongo還是會對該條記錄索引谒亦,即使該字段為被插入竭宰。
我喜歡看官方文檔,下面給出MongoDB官方文檔說明:
If a document does not have a value for the indexed field in a unique index, the index will store a null value for this document. Because of the unique constraint, MongoDB will only permit one document that lacks the indexed field. If there is more than one document without a value for the indexed field or is missing the indexed field, the index build will fail with a duplicate key error.
其實已經(jīng)說得很清楚了份招,稍微會點英語應(yīng)該都能看懂切揭,下面還是給出翻譯版:
如果文檔沒有唯一索引中索引字段的值,則索引將為此文檔存儲null值锁摔。由于唯一約束廓旬,MongoDB只允許一個缺少索引字段的文檔。如果有多個文檔沒有索引字段的值或缺少索引字段鄙漏,則索引構(gòu)建將失敗并出現(xiàn)重復(fù)鍵錯誤嗤谚。
也就是說這個字段哪怕在文檔中沒有,那么該字段將會存null值怔蚌,該字段上也不能同時出現(xiàn)兩個null值巩步,這就是為什么上面那種做法還是行不通的原因,其實上面那種做法也打破了數(shù)據(jù)結(jié)構(gòu)桦踊,雖然手機號未填椅野,但數(shù)據(jù)庫中也不應(yīng)該缺少這個字段,盡管是非關(guān)系數(shù)據(jù)庫籍胯,畢竟還得考慮下業(yè)務(wù)設(shè)計竟闪。
解決方式
是不是就沒有解決方式了呢?當(dāng)然有杖狼,Mongo提供了Sparse Index炼蛤,被翻譯為稀疏索引。下面是創(chuàng)建稀疏索引的例子:
db.getCollection("test").createIndex( { "phone": 1 }, { sparse: true })
執(zhí)行上面的語句后蝶涩,不會去索引不存在phone字段的文檔理朋。也就是說存在才對其索引,那么此時和Unique索引結(jié)合起來就可以派上用場了绿聘。Unqiue是唯一嗽上,Sparse是存在才索引。所以熄攘,當(dāng)phone或email為空的時候我們可以不將其插入這是可以實現(xiàn)的兽愤。
db.getCollection("test").createIndex( { "phone": 1 }, { sparse: true,unique: true } )
上面是是mongo shell語法,通常我們一般通過代碼中建立索引,修改如下(當(dāng)然User結(jié)構(gòu)體中Phone字段omitempty標(biāo)簽還是要有的):
func init() {
phoneIndex := mgo.Index{
Key: []string{"phone"},
Unique: true,
Sparse: true,
}
col := db.Collection(&User{})
col.EnsureIndex(phoneIndex)
}
但是這又正如我們前面說的那樣浅萧,打破了數(shù)據(jù)原有的數(shù)據(jù)結(jié)構(gòu)逐沙。哎,有得有得惯殊。當(dāng)然我們還可以從業(yè)務(wù)層面去解決酱吝,比如注冊時對其查詢等操作,當(dāng)然會耗一定性能土思,不管你是那空間換時間,還是拿時間換空間總得付出一個忆嗜,別做一個太貪心的人己儒。