今天采集數(shù)據(jù)時(shí)候 偶然發(fā)現(xiàn)了一個(gè)問題赖淤,當(dāng)采集的數(shù)據(jù)包含 emoji表情時(shí)蜀漆,例如:??,數(shù)據(jù)只保存了部分咱旱,存在缺失問題确丢,最開始我懷疑的采集時(shí)正則匹配不到的問題,網(wǎng)上搜了一下吐限,也沒我要的答案鲜侥,后來還是博學(xué)的碧老師給點(diǎn)出,這是utf8mb4編碼毯盈。
關(guān)于這個(gè)編碼 大概就是兼容utf-8比utf-8包含字符更多剃毒,而那些emoji表情utf-8中并沒有編碼,改一下表的編碼和數(shù)據(jù)庫(kù)連接編碼搂赋,問題就這么解決了赘阀。