表情符號(hào)是象形文字(圖形符號(hào))笛匙,通常以彩色卡通形式呈現(xiàn)并在文本中內(nèi)嵌使用。它們代表諸如面孔犀变、天氣妹孙、車輛和建筑物、食物和飲料弛作、動(dòng)物和植物或代表情感涕蜂、感覺或活動(dòng)的圖標(biāo)等事物。
表情符號(hào)這個(gè)詞來(lái)自日語(yǔ):絵(e?圖片)文字(moji?文字)映琳。
表情符號(hào)可以在內(nèi)部表示為圖形机隙,也可以通過(guò)像其他字符一樣以字體編碼的普通字形表示蜘拉。為清楚起見,后者被稱為表情符號(hào)字符有鹿。一些 Unicode 字符通常顯示為表情符號(hào)旭旭;有些通常顯示為普通文本,有些可以雙向顯示葱跋。
表情符號(hào)于 1999 年在日本手機(jī)上可用持寄。早在 2000 年就提出了將 DoCoMo 表情符號(hào)編碼為 Unicode 標(biāo)準(zhǔn)的提議。當(dāng)時(shí)還不清楚這些字符是否會(huì)被廣泛使用——而且日本手機(jī)運(yùn)營(yíng)商也不支持將它們添加到 Unicode 中——因此沒有采取任何行動(dòng)娱俺。
表情符號(hào)在日本非常流行稍味,但每個(gè)手機(jī)運(yùn)營(yíng)商都開發(fā)了不同(但部分重疊)的集合,每個(gè)手機(jī)供應(yīng)商都使用自己的文本編碼擴(kuò)展荠卷,這些擴(kuò)展互不兼容模庐。供應(yīng)商開發(fā)了交叉映射表,以允許表情符號(hào)字符與其他供應(yīng)商的手機(jī)(包括電子郵件)進(jìn)行有限的交換油宜。其他平臺(tái)無(wú)法顯示的字符用〓(U+3013 GETA MARK)表示掂碱,但字符很容易損壞或掉線。
當(dāng)非日本電子郵件和手機(jī)供應(yīng)商開始支持與日本運(yùn)營(yíng)商的電子郵件交換時(shí)慎冤,他們遇到了這些問(wèn)題疼燥。此外,沒有辦法用 Unicode 來(lái)表示這些字符蚁堤,而 Unicode 是所有現(xiàn)代程序中文本的基礎(chǔ)醉者。2006 年,Google 開始著手將日文表情符號(hào)轉(zhuǎn)換為 Unicode 私人使用代碼披诗,從而在2007 年
開發(fā)了內(nèi)部映射表湃交,以通過(guò) Unicode 字符支持運(yùn)營(yíng)商表情符號(hào)。
然而藤巢,私有使用方法存在許多問(wèn)題,因此向 Unicode 聯(lián)盟提出了一項(xiàng)建議息罗,以擴(kuò)大符號(hào)的范圍以包含表情符號(hào)掂咒。該提案于 2007 年 5 月獲得批準(zhǔn),導(dǎo)致符號(hào)小組委員會(huì)的成立迈喉,2007 年 8 月绍刮,技術(shù)委員會(huì)同意根據(jù)小組委員會(huì)制定的一套原則支持 Unicode 中的表情符號(hào)編碼。以下是一些跟蹤 Unicode 表情符號(hào)字符進(jìn)程的文檔挨摸。
日期文件號(hào)標(biāo)題作者
2000-04-26L2/00-152NTT DoCoMo 象形文字格雷厄姆·阿舍(Symbian)
2006-11-01L2/06-369符號(hào)(范圍擴(kuò)展)馬克戴維斯(谷歌)
2007-08-03L2/07-257編碼表情符號(hào)的工作草案提案Kat Momoi孩革、Mark Davis、Markus Scherer(谷歌)
2007-08-09L2/07-274R符號(hào)決議草案馬克戴維斯(谷歌)
2007-09-18L2/07-391日本電視符號(hào) (ARIB)米歇爾·蘇格納德(微軟)
2009-01-30L2/09-026為新編碼提出的表情符號(hào)Markus Scherer得运、Mark Davis膝蜈、Kat Momoi锅移、Darick Tong(谷歌);
Yasuo Kida, Peter Edberg (Apple)
2009-03-05L2/09-025R2對(duì)表情符號(hào)進(jìn)行編碼的建議
2010-04-27L2/10-132表情符號(hào):背景數(shù)據(jù)
2011-02-15L2/11-052RWingdings 和 Webdings 符號(hào)米歇爾·蘇格納德
要查找此表中的文檔饱搏,請(qǐng)參閱UTC 文檔非剃。
2009 年,第一個(gè)明確用作表情符號(hào)的 Unicode 字符被添加到 Unicode 5.2 中推沸,以實(shí)現(xiàn)與 ARIB(無(wú)線電工業(yè)和商業(yè)協(xié)會(huì))集的互操作性备绽。一組 722 個(gè)字符被定義為日本手機(jī)運(yùn)營(yíng)商使用的表情符號(hào)字符的聯(lián)合:其中 114 個(gè)字符已經(jīng)在 Unicode 5.2 中。2010 年鬓催,剩下的 608 個(gè)表情符號(hào)字符與其他一些表情符號(hào)字符一起被添加到 Unicode 6.0肺素。2012 年,更多的表情符號(hào)被添加到 Unicode 6.1宇驾,2014 年更多的表情符號(hào)被添加到 Unicode 7.0倍靡。從那時(shí)起,根據(jù)提交 Unicode 表情符號(hào)提案指南中的選擇因素飞苇,添加了其他字符菌瘫。?
以下是用作表情符號(hào)的一些主要象形文字來(lái)源何時(shí)以 Unicode 編碼的摘要。每個(gè)來(lái)源可能包含除表情符號(hào)之外的其他字符布卡,Unicode 字符可以對(duì)應(yīng)多個(gè)來(lái)源雨让。L 列包含用于圖表 [emoji-charts] 和數(shù)據(jù)文件 [emoji-data] 的各種來(lái)源的單字母縮寫。不對(duì)應(yīng)任何這些來(lái)源的字符可以用其他 (x) 標(biāo)記忿等。
資源縮寫大號(hào)開發(fā)栖忠。
開始
發(fā)布統(tǒng)一碼版本樣本字符
黑白顏色代碼CLDR 短名稱
Zapf DingbatsZDingsz19891991-101.0U+270F鉛筆
阿里布阿里布一種2007年2008-10-015.2U+2614帶雨滴的雨傘
日本運(yùn)營(yíng)商JCarrierj2007年2010-10-116.0U+1F60E帶著太陽(yáng)鏡的笑臉
翼和織帶WDingsw20102014-06-167.0U+1F336辣椒
有關(guān)何時(shí)將各種表情符號(hào)源集添加到 Unicode 的詳細(xì)視圖,請(qǐng)參閱表情符號(hào)版本源[emoji-charts]贸街。數(shù)據(jù)文件 [JSources] 顯示了與原始日本運(yùn)營(yíng)商符號(hào)的對(duì)應(yīng)關(guān)系庵寞。
人們經(jīng)常問(wèn) Unicode 標(biāo)準(zhǔn)中有多少個(gè)表情符號(hào)。這個(gè)問(wèn)題沒有一個(gè)簡(jiǎn)單的答案薛匪,因?yàn)闆]有明確的界限來(lái)區(qū)分哪些象形字符應(yīng)該以典型的表情符號(hào)樣式顯示捐川。有關(guān)完整圖片,請(qǐng)參閱哪些字符是表情符號(hào)逸尖。
本文檔中使用的彩色圖像和相關(guān)圖表 [emoji-charts] 僅用于說(shuō)明古沥。它們沒有出現(xiàn)在只有黑白圖像的 Unicode 標(biāo)準(zhǔn)中。它們要么由各自的供應(yīng)商提供以供在本文檔中使用娇跟,要么被認(rèn)為可用于非商業(yè)用途岩齿。使用供應(yīng)商圖像的許可查詢應(yīng)直接發(fā)送給這些供應(yīng)商,而不是 Unicode 聯(lián)盟苞俘。有關(guān)更多信息盹沈,請(qǐng)參閱表情符號(hào)圖像的權(quán)利。
定義
以下提供了本文檔中使用的一些術(shù)語(yǔ)的更正式的定義吃谣。對(duì)文檔的其他功能更感興趣的讀者可以選擇從第 2 節(jié)乞封,設(shè)計(jì)指南繼續(xù)惧浴。
ED-1爽锥。emoji— 一種彩色象形文字蜘渣,可以在文本中內(nèi)聯(lián)使用疾就。在內(nèi)部,表示是(a)圖像陷揪,(b)編碼字符或(c)編碼字符序列惋鸥。
對(duì)于 (a)?,本文檔中使用了術(shù)語(yǔ)emoji 圖像悍缠。也可以使用術(shù)語(yǔ)貼紙卦绣。?
對(duì)于 (b)而言,為了清楚起見飞蚓,在必要時(shí)使用了表情符號(hào)字符這一術(shù)語(yǔ)滤港。?
對(duì)于 (c),為了清楚起見趴拧,使用了術(shù)語(yǔ)emoji 序列溅漾。
ED-2。emoticon— (1) 一系列文本字符(通常是標(biāo)點(diǎn)符號(hào)或符號(hào))著榴,用于表示面部表情或手勢(shì)添履,例如 ;-) 和 (2) 在更廣泛的意義上,還包括用于面部表情和手勢(shì)的表情符號(hào)脑又。
? 表情符號(hào)
ED-3暮胧。emoji character— 具有Emoji屬性的字符。
emoji_character := \p{Emoji}
建議將這些字符用作表情符號(hào)问麸。
ED-4往衷。extended pictographic character??— 具有Extended_Pictographic屬性的字符。
這些字符是象形的严卖,或者在其他方面與具有 Emoji 屬性的字符相似席舍。
?Extended_Pictographic屬性用于自定義分割(如 [UAX29] 和 [UAX14] 中所述),以便將來(lái)可能的 emoji zwj 序列不會(huì)破壞字素簇哮笆、單詞或線條俺亮。在某些塊中具有 Line_Break=ID 的未分配代碼點(diǎn)也被分配了Extended_Pictographic屬性。這些塊用于將來(lái)分配表情符號(hào)字符疟呐。
ED-5。emoji component?— 具有Emoji_Component屬性的字符东且。
這些字符在表情符號(hào)序列中使用启具,但通常不會(huì)作為單獨(dú)的選項(xiàng)出現(xiàn)在表情符號(hào)鍵盤上,例如鍵帽基本字符或區(qū)域指示符字符珊泳。
一些emoji components?是?emoji characters鲁冯,而其他(例如標(biāo)簽字符和ZWJ)不是拷沸。
有關(guān)詳細(xì)信息,請(qǐng)參閱第 3 節(jié)薯演,哪些字符是表情符號(hào)撞芍。有關(guān)定義表情符號(hào)屬性的數(shù)據(jù)文件的信息,請(qǐng)參閱附件 A:表情符號(hào)屬性和數(shù)據(jù)文件跨扮。
表情符號(hào)展示
ED-6序无。default emoji presentation character- 默認(rèn)情況下,應(yīng)與表情符號(hào)演示而不是文本演示一起出現(xiàn)的字符衡创。
default_emoji_presentation_character := \p{Emoji_Presentation}
這些字符具有Emoji_Presentation屬性帝嗡。請(qǐng)參閱附件 A:表情符號(hào)屬性和數(shù)據(jù)文件。
ED-7璃氢。default text presentation character— 默認(rèn)情況下應(yīng)與文本演示一起出現(xiàn)的字符哟玷,而不是表情符號(hào)演示。
default_text_presentation_character := \P{Emoji_Presentation}
這些字符沒有Emoji_Presentation屬性一也;也就是說(shuō)巢寡,它們的Emoji_Presentation屬性值為No。請(qǐng)參閱附件 A:表情符號(hào)屬性和數(shù)據(jù)文件椰苟。
有關(guān)表情符號(hào)和文本演示的更多詳細(xì)信息抑月,請(qǐng)參閱第 2 節(jié),設(shè)計(jì)指南和第 4 節(jié)尊剔,演示樣式爪幻。
表情符號(hào)和文本呈現(xiàn)序列
ED-8。text presentation selector?- 字符 U+FE0E VARIATION SELECTOR-15 (VS15)须误,用于請(qǐng)求表情符號(hào)字符的文本呈現(xiàn)挨稿。?(在本規(guī)范的先前版本中?也稱為文本變體選擇器?
text_presentation_selector := \x{FE0E}
ED-8a。text presentation sequence?由一個(gè)emoji character和一個(gè)text presentation selector京痢。
text_presentation_sequence := emoji_character text_presentation_selector
唯一有效的文本呈現(xiàn)序列是?emoji-variation-sequences.txt[emoji-data]?中列出的那些奶甘。
ED-9。emoji presentation selector?- 字符 U+FE0F VARIATION SELECTOR-16 (VS16)祭椰,用于請(qǐng)求表情符號(hào)字符的表情符號(hào)演示臭家。?(在本規(guī)范的先前版本中?也稱為表情符號(hào)變體選擇器?
emoji_presentation_selector := \x{FE0F}
ED-9a。emoji presentation sequence— 由一個(gè)emoji character?一個(gè)?emoji presentation selector.方淤。
emoji_presentation_sequence := emoji_character emoji_presentation_selector
唯一有效的表情符號(hào)呈現(xiàn)序列是?emoji-variation-sequences.txt[emoji-data]中列出的那些钉赁。
表情符號(hào)修飾符
ED-11。emoji?modifier— 可用于修改emoji 修飾符序列中前面的 emoji 外觀的字符携茂。
emoji_modifier := \p{Emoji_Modifier}
這些字符具有Emoji_Modifier屬性你踩。請(qǐng)參閱附件 A:表情符號(hào)屬性和數(shù)據(jù)文件。
ED-12。emoji modifier base— 一個(gè)字符带膜,其外觀可以由emoji 修飾符序列中的后續(xù) emoji 修飾符修改吩谦。
emoji_modifier_base := \p{Emoji_Modifier_Base}
這些字符具有Emoji_Modifier_Base屬性。請(qǐng)參閱附件 A:表情符號(hào)屬性和數(shù)據(jù)文件膝藕。
它們也列在受表情符號(hào)修飾符的字符中式廷。
ED-13。emoji?modifier sequence— 以下形式的序列:
emoji_modifier_sequence :=
emoji_modifier_base emoji_modifier
有關(guān)表情符號(hào)修飾符的更多詳細(xì)信息芭挽,請(qǐng)參閱第 2.4 節(jié)滑废,多樣性。
表情符號(hào)序列
ED-14览绿。emoji flag sequence- 兩個(gè)區(qū)域指示符字符的序列策严,其中對(duì)應(yīng)的 ASCII 字符是[CLDRUnicode 區(qū)域子標(biāo)簽指定的有效區(qū)域序列?,idStatus="regular" 或 "deprecated"饿敲。另請(qǐng)參閱附件 B:有效的表情符號(hào)標(biāo)志序列妻导。??
emoji_flag_sequence :=
regional_indicator regional_indicator
regional_indicator := \p{Regional_Indicator}
單例區(qū)域指示符字符不是格式良好的emoji flag sequence。
ED-14a怀各。emoji tag sequence (ETS)— 以下形式的序列:
emoji_tag_sequence := tag_base tag_spec tag_end
tag_base???????????:= emoji_character
| emoji_modifier_sequence
| emoji_presentation_sequence
tag_spec???????????:= [\x{E0020}-\x{E007E}]+
tag_end????????????:= \x{E007F}
?tag_spec由從 U+E0020 TAG SPACE 到 U+E007E TAG TILDE 的所有字符組成倔韭。每個(gè)都tag_spec定義了一個(gè)特定的視覺變體,以應(yīng)用于tag_base字符瓢对。雖然tag_spec包括值 U+E0041 TAG LATIN CAPITAL LETTER A .. U+E005A TAG LATIN CAPITAL LETTER Z寿酌,但它們目前不使用,保留用于將來(lái)的擴(kuò)展硕蛹。
由tag_end字符 U+E007F CANCEL TAG 組成醇疼,必須用于終止序列。
不屬于 an 的標(biāo)簽字符序列emoji_tag_sequence不是格式良好的emoji tag sequence.
?表情符號(hào)標(biāo)簽序列的含義和有效性標(biāo)準(zhǔn)以及 a 的預(yù)期視覺變體tag_spec由附件 C:有效表情符號(hào)標(biāo)簽序列確定法焰。
ED-14c秧荆。emoji keycap sequence— 以下形式的序列:
emoji_keycap_sequence := [0-9#*] \x{FE0F 20E3}
這些序列位于type_fieldEmoji_Keycap_Sequence下列出的emoji-sequences.txt文件中?
ED-15。emoji core sequence?— 以下形式的序列:
emoji_core_sequence :=
emoji_character
| emoji_presentation_sequence
| emoji_keycap_sequence
| emoji_modifier_sequence
| emoji_flag_sequence
ED-15a埃仪。emoji zwj element— 可以在 emoji ZWJ 序列中使用的更有限的元素乙濒,如下所示:
emoji_zwj_element :=
emoji_character
| emoji_presentation_sequence
| emoji_modifier_sequence
ED-16。emoji zwj sequence?— 具有至少一個(gè)連接符的 emoji 序列卵蛉。
emoji_zwj_sequence :=
emoji_zwj_element ( ZWJ emoji_zwj_element )+
ZWJ := \x{200d}
ED-17颁股。emoji sequence— 核心序列、標(biāo)簽序列或 ZWJ 序列傻丝,如下所示:
emoji_sequence :=
emoji_core_sequence
| emoji_zwj_sequence
| emoji_tag_sequence
ED-17a甘有。qualified emoji character- 字符串中的表情符號(hào)字符 (a) 具有默認(rèn)表情符號(hào)表示或 (b) 是表情符號(hào)修飾符序列中的第一個(gè)字符或 (c) 不是默認(rèn)表情符號(hào)表示字符,但是第一個(gè)字符表情符號(hào)演示序列葡缰。
ED-18亏掀。fully-qualified emoji?— 限定的 emoji 字符允睹,或每個(gè) emoji 字符都限定的 emoji 序列。
ED-18a幌氮。minimally-qualified emoji— 一個(gè) emoji 序列,其中第一個(gè)字符是限定的胁澳,但序列不是完全限定的该互。
ED-19。unqualified emoji——既不是完全合格也不是最低限度合格的表情符號(hào)韭畸。
有關(guān)在表情符號(hào)序列中使用變體選擇器的建議宇智,請(qǐng)參閱第 2.7 節(jié),表情符號(hào)實(shí)現(xiàn)說(shuō)明胰丁。
表情符號(hào)集
以下集合是根據(jù)附件 A 中描述的數(shù)據(jù)文件和屬性定義的:表情符號(hào)屬性和數(shù)據(jù)文件随橘。這些集合的組成可能會(huì)從一個(gè)版本更改為下一個(gè)版本。
這些集合中的每一個(gè)都可以被認(rèn)為是一個(gè)二元屬性锦庸。它們是字符串的屬性机蔗。有關(guān)更多討論,請(qǐng)參閱UTS #18:Unicode 正則表達(dá)式[UTS18] 和UTR #23:Unicode 字符屬性模型[UTR23]甘萧。
ED-20萝嘁。basic emoji set— type_field Basic_Emojiemoji-data]中列出的表情符號(hào)字符集和表情符號(hào)呈現(xiàn)序列。??
這是一組用于通用輸入的表情符號(hào)扬卷。
該集合不包括所有不用于獨(dú)立直接輸入的表情符號(hào)組件實(shí)例牙言。?實(shí)現(xiàn)應(yīng)支持此集中表情符號(hào)組件的獨(dú)立顯示,即使它們不可用于直接輸入怪得。
膚色修改器和頭發(fā)組件甚至應(yīng)該單獨(dú)顯示咱枉,但它們不應(yīng)該(通常)出現(xiàn)在鍵盤面板上。這些包含在 Basic_Emoji 中徒恋。
其他組件(U+20E3 COMBINING ENCLOSING KEYCAP蚕断、區(qū)域指示符、標(biāo)簽字符因谎、ZWJ 和 VS16)不應(yīng)該單獨(dú)出現(xiàn)表情符號(hào)基括,而是作為表情符號(hào)序列的一部分出現(xiàn)。這些不包含在 Basic_Emoji 中财岔。
否則风皿,此集合包括??屬性值為Emoji_Presentation = Yes 的表情符號(hào)字符的所有實(shí)例以及?其基本字符具有屬性值Emoji_Presentation= No?的有效?表情符號(hào)表示序列的所有實(shí)例。??????
ED-21匠璧。emoji keycap sequence set—emoji-sequences.txt文件 [emoji-data] 中 type_fieldEmoji_Keycap_Sequence 下列桐款。
這是所有有效表情符號(hào)鍵帽序列的集合。
注意:以下定義使用首字母縮略詞“RGI?”來(lái)表示“推薦用于一般交換”夷恍,指的是旨在跨多個(gè)平臺(tái)廣泛支持的某個(gè)較大集合的子集魔眨。
ED-22。RGI emoji modifier sequence set?—emoji-sequences.txt文件 [emoji-data] 中 type_fieldRGI_Emoji_Modifier_Sequence 下列。
這是推薦用于一般交換的所有有效表情符號(hào)修飾符序列的子集遏暴。???
ED-23侄刽。RGI emoji flag sequence set???— emoji-sequences.txt文件 [emoji-data] 中 type_fieldRGI_Emoji_Flag_Sequence中列出的特定表情符號(hào)序列。
這是推薦用于一般交換的所有有效表情符號(hào)標(biāo)志序列的子集朋凉。請(qǐng)參閱附件 B:有效的表情符號(hào)標(biāo)志序列??
ED-24州丹。RGI emoji tag sequence set?—emoji-sequences.txt文件 [emoji-data] 中 type_fieldRGI_Emoji_Tag_Sequence 下列。
這是推薦用于一般交換的所有有效表情符號(hào)標(biāo)簽序列的子集杂彭。請(qǐng)參閱附件 C:有效的表情符號(hào)標(biāo)簽序列墓毒。???
ED-25。RGI emoji ZWJ sequence set— 在RGI_Emoji_ZWJ_Sequenceemoji-zwj-sequences.txt文件 [emoji-data]亲怠。??
這是推薦用于一般交換的所有有效表情符號(hào) zwj 序列的子集所计。???
ED-27主胧。RGI emoji set?—ED-20、ED-21徙垫、ED-22讥裤、ED-23、ED-24和ED-25涵蓋的所有表情符號(hào)(字符和序列)的集合?姻报。
這是推薦用于一般交換的所有有效表情符號(hào)(字符和序列)的子集己英。
這對(duì)應(yīng)于RGI_Emoji屬性。
1.4.7符號(hào)
全部大寫的字符名稱是正式的 Unicode 名稱屬性值吴旋,例如 U+1F473 MAN WITH TURBAN损肛。正式名稱是不可變的內(nèi)部標(biāo)識(shí)符,但通常不能反映當(dāng)前解釋字符的做法荣瑟。
現(xiàn)有字符或序列的小寫字符名稱是 CLDR 短名稱治拿,例如 U+1F473person wear turban。
1.4.8 性能穩(wěn)定性
表情符號(hào)屬性對(duì)于每個(gè)版本的數(shù)據(jù)都是穩(wěn)定的——它們不會(huì)因那個(gè)版本而改變笆焰。但是劫谅,它們可能會(huì)在該版本和后續(xù)版本之間發(fā)生變化。例如,對(duì)于 Emoji 版本 5.0,isEmoji(?)=false宰译,但對(duì)于版本 11.0,則為 true贯城。
某些表情符號(hào)屬性未針對(duì)某些字符串操作關(guān)閉。例如:
isEmoji(toLowercase(X)) ≠ isEmoji(X) 對(duì)于 X=?? 的情況霹娄,因?yàn)椋?/p>
isEmoji(??) = true
toLowercase(??) = ?
isEmoji(?) = false
套管操作可能會(huì)產(chǎn)生無(wú)效的變化序列能犯。雖然以下字符串形成了一個(gè)大小寫對(duì)鲫骗,但emoji presentation selector?沒有為 ? 定義,因此對(duì)其呈現(xiàn)沒有影響:
?? = <U+24C2 帶圓圈的拉丁大寫字母 M, U+FE0F VS16>有效變化序列
? = <U+24DC 帶圓圈的拉丁小寫字母 M, U+FE0F VS16>無(wú)效的變化序列
1.4.9EBNF 和正則表達(dá)式
以下 EBNF 可用于快速掃描可能的表情符號(hào)踩晶。然后可以在必要時(shí)通過(guò)根據(jù)定義執(zhí)行有效性測(cè)試或檢查RGI 表情符號(hào)集來(lái)驗(yàn)證這些可能的表情符號(hào)执泰。它比當(dāng)前定義中的表達(dá)式要簡(jiǎn)單得多。它包括一個(gè)表情符號(hào)的超集渡蜻,作為這種簡(jiǎn)單性的副產(chǎn)品坦胶,但可以通過(guò)有效性測(cè)試清除額外的表情符號(hào)。
EBNF筆記
可能的表情符號(hào):=
flag_sequence
| zwj_element (\x{200D} zwj_element)*
\x{200D} = 零寬度連接符
flag_sequence :=
? \p{RI} \p{RI}
\p{RI} = 區(qū)域指標(biāo)
zwj_element :=
? \p{Emoji} emoji_modification?
emoji_modification :=
? \p{EMod}
| \x{FE0F} \x{20E3}晴楔?
\p{EMod} = Emoji_Modifier
\x{FE0F} = emoji VS
\x{20E3} = 封閉鍵帽
tag_modifier :=
[\x{E0020}-\x{E007E}]+ \x{E007F}
\x{E00xx} 是標(biāo)簽
\x{E007F} = TERM 標(biāo)簽
?從這些 EBNF 規(guī)則可以生成一個(gè)正則表達(dá)式,如下所示峭咒。雖然這個(gè)正則表達(dá)式可能看起來(lái)很復(fù)雜税弃,但它比定義的結(jié)果要簡(jiǎn)單得多。直接使用定義會(huì)導(dǎo)致正則表達(dá)式復(fù)雜很多倍凑队,但仍需要通過(guò)有效性測(cè)試進(jìn)行驗(yàn)證则果。
正則表達(dá)式
\p{RI} \p{RI}
| \p{表情符號(hào)}
? ( \p{EMod}
? | \x{FE0F} \x{20E3}?
? | [\x{E0020}-\x{E007E}]+ \x{E007F} )?
? (\x{200D} \p{Emoji}
? ? ( \p{EMod}
? ? | \x{FE0F} \x{20E3}?
? ? | [\x{E0020}-\x{E007E}]+ \x{E007F} ) ?
? )*
實(shí)現(xiàn)
實(shí)現(xiàn)可以將表情符號(hào)修飾符作為輸入調(diào)色板中的單獨(dú)字符呈現(xiàn),或使用長(zhǎng)按等機(jī)制呈現(xiàn)組合字符漩氨。
表情符號(hào)修飾符不適用于與任意表情符號(hào)字符組合西壮。相反,它們僅限于表情符號(hào)修飾符基本字符:其他字符不得與表情符號(hào)修飾符組合叫惊。隨著本文檔的后續(xù)版本款青,該集合可能會(huì)隨著時(shí)間而改變。要查找每個(gè)版本的表情符號(hào)修飾符庫(kù)的確切列表霍狰,請(qǐng)使用 Emoji_Modifier_Base 字符屬性抡草,如附件 A:表情符號(hào)屬性和數(shù)據(jù)文件中所述。
下圖顯示了帶有表情符號(hào)修飾符的預(yù)期顯示蔗坯,具體取決于前面的字符和對(duì)表情符號(hào)修飾符的支持級(jí)別康震。“不支持”行顯示字符通常如何出現(xiàn)在沒有包含該字符的字體的系統(tǒng)上:缺少字形指示符宾濒。在某些情況下腿短,應(yīng)禁止在 Emoji_Modifier_Base 字符之后顯示表情符號(hào)修飾符:
如果 emoji 修飾符基礎(chǔ)在特定系統(tǒng)上沒有可見的皮膚,則應(yīng)禁止任何后續(xù) emoji 修飾符绘梦。
在其他情況下橘忱,可能會(huì)抑制在 Emoji_Modifier_Base 字符之后顯示表情符號(hào)修飾符:
如果特定 emoji 修飾符基使用與用于其他 Emoji_Modifier_Base 字符的默認(rèn)膚色不同的非真實(shí)膚色,則可能會(huì)抑制任何后續(xù) emoji 修飾符谚咬。例如鹦付,假設(shè)吸血鬼在特定實(shí)現(xiàn)中顯示為灰色皮膚,而其他 Emoji_Modifier_Base 字符在沒有表情符號(hào)修飾符的情況下顯示為霓虹黃色皮膚择卦;吸血鬼之后的任何表情符號(hào)修飾符都可能被抑制敲长。
支持水平表情符號(hào)修飾符基礎(chǔ)順序展示
完全支持是的+
是的+
是的郎嫁,但看不到皮膚+
是,但不尋常的默認(rèn)膚色+
不+
倒退是的+
不+
不支持是的+
不+
如上所述祈噪,在第 2.4 節(jié)的末尾泽铛,多樣性,表情符號(hào)表示選擇器既不需要也不推薦用于表情符號(hào)修飾符序列辑鲤。見ED-13盔腔。表情符號(hào)修飾符序列。但是月褥,較舊的數(shù)據(jù)可能包含有缺陷的表情符號(hào)修飾符序列弛随,其中確實(shí)包含表情符號(hào)表示選擇器。
2.5Emoji ZWJ 序列
U+200D ZERO WIDTH JOINER (ZWJ) 可用于字符序列的元素之間宁赤,以指示應(yīng)顯示單個(gè)字形(如果可用)舀透。實(shí)現(xiàn)可以使用這種機(jī)制來(lái)處理這樣的 emoji zwj 序列作為單個(gè)字形,使用調(diào)色板或鍵盤為所示字形生成適當(dāng)?shù)男蛄芯鲎蟆?duì)于這樣一個(gè)系統(tǒng)的用戶來(lái)說(shuō)愕够,這些行為就像單個(gè)表情符號(hào)字符,即使它們?cè)趦?nèi)部是序列佛猛。
當(dāng) emoji zwj 序列被發(fā)送到?jīng)]有對(duì)應(yīng)的單個(gè)字形的系統(tǒng)時(shí)惑芭,ZWJ 字符將被忽略并顯示單獨(dú)的 emoji 的后備序列。因此继找,一個(gè) emoji zwj 序列只應(yīng)由回退序列對(duì)接收者也有意義的實(shí)現(xiàn)來(lái)定義和支持遂跟。
例如,以下是可能的顯示:
順序展示組合字形婴渡?
是的
不
2.5Emoji ZWJ 序列
U+200D ZERO WIDTH JOINER (ZWJ) 可用于字符序列的元素之間漩勤,以指示應(yīng)顯示單個(gè)字形(如果可用)。實(shí)現(xiàn)可以使用這種機(jī)制來(lái)處理這樣的 emoji zwj 序列作為單個(gè)字形缩搅,使用調(diào)色板或鍵盤為所示字形生成適當(dāng)?shù)男蛄性桨堋?duì)于這樣一個(gè)系統(tǒng)的用戶來(lái)說(shuō),這些行為就像單個(gè)表情符號(hào)字符硼瓣,即使它們?cè)趦?nèi)部是序列究飞。
當(dāng) emoji zwj 序列被發(fā)送到?jīng)]有對(duì)應(yīng)的單個(gè)字形的系統(tǒng)時(shí),ZWJ 字符將被忽略并顯示單獨(dú)的 emoji 的后備序列堂鲤。因此亿傅,一個(gè) emoji zwj 序列只應(yīng)由回退序列對(duì)接收者也有意義的實(shí)現(xiàn)來(lái)定義和支持。
例如瘟栖,以下是可能的顯示:
順序展示組合字形葵擎?
是的
不
2.6多人分組
有幾種表情符號(hào)描繪了不止一個(gè)人的互動(dòng)。如果這些要通過(guò)選擇或性別或膚色來(lái)實(shí)施半哟,則可能需要根據(jù)具體情況進(jìn)行特殊處理酬滤。下面列出了這些表情符號(hào):
十六進(jìn)制字符CLDR 名稱
U+1F91D握手
U+1F46F有兔耳朵的人
U+1F93C人們摔跤
U+1F46B手牽手的女人和男人
U+1F46C手牽手的男人
U+1F46D手牽手的婦女
U+1F48F吻
U+1F491有心的情侶
U+1F46A家庭
還有一些其他表情符號(hào)可以共享相同的性別和膚色签餐,例如雙手合十。就性別和膚色而言盯串,這些行為就像一個(gè)人一樣氯檐,因此不需要特殊處理。其他示例包括:
對(duì)于 U+1F486接受按摩的人体捏,提供按摩的人的手應(yīng)該被描繪成沒有膚色顯示冠摄,也許戴著手套。
對(duì)于以下 emoji 及其膚色變體几缭,嬰兒應(yīng)被描繪為不顯示膚色河泳,可能被毯子覆蓋,以便將 emoji 視為一個(gè)人以進(jìn)行膚色修改:
U+1F931母乳喂養(yǎng)
U+1F469 U+200D U+1F37C女人喂奶
U+1F468 U+200D U+1F37C男人喂奶
U+1F9D1 U+200D U+1F37C人喂奶
2.6.1多人性別
多人分組的表情符號(hào)具有未指定的性別(除非修改)年栓,但牽手的三個(gè)字符除外乔询。握手本身并沒有提供性別差異。
通過(guò)使用包含 MAN韵洋、WOMAN、ADULT黄锤、BOY搪缨、GIRL 和 CHILD 的 ZWJ 序列,將 Gender 應(yīng)用于 KISS鸵熟、COUPLE WITH HEART 和 FAMILY副编。數(shù)據(jù)文件列出了這些的 RGI 版本,如下所示:
U+1F469 U+200D U+2764 U+FE0F U+200D U+1F48B U+200D U+1F468吻:女人流强,男人
使用 ZWJ 序列將性別應(yīng)用于具有兔耳朵的人和摔跤的人痹届,如下所示。
描述內(nèi)部代表
有兔耳朵的人
兔耳朵的男人
兔耳朵的女人
人們摔跤
男子摔跤
女子摔跤
2.6.2多人膚色
與性別一樣打月,膚色可以以類似的方式應(yīng)用于多人分組队腐。由序列內(nèi)部表示的表情符號(hào)可能會(huì)在每個(gè)使用它們的字符(帶有 Emoji_Modifier_Base 的字符)之后添加膚色修飾符(Emoji_Modifier字符)。這通過(guò)下面的表使用序列進(jìn)行多人分組的膚色進(jìn)行了說(shuō)明奏篙。???
不應(yīng)生成混合沒有膚色的人物角色和有膚色的人物角色的多人序列柴淘。也就是說(shuō),對(duì)于輸入系統(tǒng)秘通,如果多人表情符號(hào)序列中的一個(gè)人物角色具有膚色修飾符为严,那么該序列中的所有人物角色都應(yīng)該具有膚色修飾符。
在 Emoji 12.0 中肺稀,更新了 Emoji_Modifier_Base 屬性第股、表情修飾符序列和RGI ZWJ 序列,添加了 25 種男女手拉手的膚色組合话原,以及女性手拉手夕吻、男性手拉手和人手拉手的各 15 種組合诲锹。這些序列顯示為 70 個(gè)不同的圖像。
在 Emoji 12.1 中梭冠,女性手拉手辕狰、男性手拉手和人們手拉手的 RGI ZWJ 序列進(jìn)一步更新,分別增加了 10 個(gè)序列控漠,因此它們的序列對(duì)應(yīng)于女性和男性手拉手的序列蔓倍。新序列適用于不同膚色的人,但在序列后期而不是較早時(shí)膚色較深盐捷。例如:
表情符號(hào) 12.0 序列: 1F4681F3FD200D 1F91D 200D 1F4681F3FB偶翅;手拉手的男士:中等膚色,淺膚色
表情符號(hào) 12.1 新增:1F4681F3FB200D 1F91D 200D 1F4681F3FD碉渡;手牽手的男士:淺膚色聚谁,中等膚色
上述序列之間的唯一區(qū)別是,中等膚色男人和淺膚色男人的推斷位置是左右互換的滞诺。
實(shí)現(xiàn)可以為兩個(gè)序列使用相同的圖像形导。對(duì)于多人表情符號(hào),實(shí)現(xiàn)不需要僅根據(jù)位置為相同性別的人提供不同的圖像习霹。是否這樣做的選擇可能取決于特定于特定供應(yīng)商圖像的設(shè)計(jì)考慮朵耕。
其他不同膚色組合的多人組可以表示為有效序列,但還不是RGI淋叶;例如阎曹,為家庭添加混合膚色會(huì)添加 4,225 個(gè)表情符號(hào)序列。
描述內(nèi)部代表
手牽手的女性:
中等煞檩、深色的膚色
手牽手的人:
中等处嫌、深色的膚色
家庭:女人,女人斟湃,女孩熏迹,女孩:
中等,黑暗凝赛。淺色癣缅,中等膚色
膚色修飾符可以應(yīng)用于多人分組表中列出的九個(gè)角色中的每一個(gè);下表說(shuō)明了其中一些字符的示例哄酝。這使組中的所有人都具有相同的膚色友存,這類似于性別標(biāo)記的工作方式。
但是陶衅,在 Emoji 14.0 中屡立,此類 emoji 修飾符序列僅對(duì) 9 個(gè)字符中的 6 個(gè)具有 RGI 狀態(tài):親吻、帶心的情侶、牽手的男女膨俐、牽手的男人勇皇、牽手的女人和握手。
描述內(nèi)部代表
握手:
中等膚色
兔耳朵的人:
中等膚色
兔耳女性:
中等膚色
手牽手的男女:
中等膚色
家庭:
中等膚色
2.7.1Emoji and Text Presentation Selectors
This section describes where the emoji presentation selectors can be used. The text presentation selector only occurs in text presentation sequences, which are not displayed as emoji.
CharactersVariation / Behavior
emoji charactermayhave an emoji or text presentation selector added if the result is a validemoji presentation sequenceortext presentation sequence
shouldhave an emoji presentation selector added if Emoji_Presentation=No whenever an emoji presentation is desired
emoji flag sequencedoes notcontain an emoji or text presentation selector
shouldbe displayed with an emoji presentation by default
emoji modifier sequencedoes notcontain an emoji or text presentation selector
shouldbe displayed with an emoji presentation by default, whether or not the modifier base has Emoji_Presentation=Yes
Implementationsmaychoose to support old data that containsdefectiveemoji_modifier_sequences, that is, having emoji presentation selectors.
emoji zwj sequencemay havean emoji presentation selector
The recommended behavior is:
User Input:
onlyfully-qualified emojizwj sequences should be generated by keyboards and other user input devices.
Processing and Display:
fully-qualified emojizwj sequences should be handled appropriately in processing, such as display, editing, segmentation, and so on.
minimally-qualifiedorunqualifiedemoji zwj sequences may be handled in the same way as their fully-qualified forms; the choice is up to the implementation.
A text presentation selector breaks an emoji zwj sequence, preventing characters on either side from displaying as a single image. The two partial sequences should be displayed as separate images, each with presentation style as specified by any presentation selectors present, or by default style for those emoji that do not have any variation selectors.
2.8頭發(fā)成分
Emoji 版本 11.0 引入了頭發(fā)組件焚刺,可以在 ZWJ 序列中使用來(lái)指示頭發(fā)顏色或樣式敛摘。推薦用于通用交換 (RGI) 的序列列在數(shù)據(jù)文件中。組件包括:
紅發(fā)(姜)
卷發(fā)
白發(fā)
禿
頭發(fā)顏色和發(fā)型有數(shù)百種可能的區(qū)別乳愉,但為了限制組合的數(shù)量——而且因?yàn)楸砬榉?hào)是用“卡通”風(fēng)格呈現(xiàn)的——頭發(fā)成分的數(shù)量很少兄淫。請(qǐng)注意,金發(fā)男子/女人/人物表情符號(hào)已經(jīng)提供了金色的頭發(fā)顏色蔓姚。棕色/黑色頭發(fā)已經(jīng)是人形表情符號(hào)中頭發(fā)顏色的典型默認(rèn)設(shè)置捕虽。
2.9顏色
ZWJ 序列中可以使用九個(gè)大的彩色方形表情符號(hào),以指示如果可能的話坡脐,應(yīng)該以該顏色顯示基本表情符號(hào)泄私。結(jié)果圖像的顏色可能與顏色方塊不完全相同。用于此目的的顏色方塊是:
U+2B1B黑色大方
U+2B1C 白色大方
U+1F7E5 大紅色正方形 ... U+1F7EB 大棕色正方形
如果實(shí)現(xiàn)不提供該顏色的單個(gè)表情符號(hào)圖像备闲,用戶應(yīng)該看到顯示所需顏色指示的后備外觀晌端。如果支持顏色 ZWJ 序列并且基本表情符號(hào)已經(jīng)具有該顏色,則應(yīng)忽略顏色方塊恬砂。
?內(nèi)部代表樣品
展示
后備
外觀
黑貓
U+1F408U+200DU+2B1B
橘貓
U+1F408U+200DU+1F7E7
方格需要 ZWJ咧纠;它們的行為不像Emoji Modifiers中列出的五個(gè)膚色修飾符。
?白色方形表情符號(hào)通常呈現(xiàn)為淺灰色觉既,以將其與白色背景區(qū)分開來(lái)。
2.10表情符號(hào)字形朝向
根據(jù)供應(yīng)商的做法乳幸,帶有面向右側(cè)或左側(cè)的字形的表情符號(hào)可能面向任一方向瞪讼。但是,在跨平臺(tái)交換文本時(shí)粹断,這種不一致可能會(huì)導(dǎo)致含義發(fā)生變化符欠。以下 ZWJ 機(jī)制可用于明確指示方向。如果沒有面向該方向的基本表情符號(hào)圖像瓶埋,用戶應(yīng)該會(huì)看到顯示所需方向指示的后備外觀希柿。如果支持方向 ZWJ 序列并且基本表情符號(hào)已經(jīng)面向該方向,則應(yīng)忽略方向表情符號(hào)养筒。
內(nèi)部代表預(yù)期
顯示
后備
外觀
U+1F3C3U+200DU+2B05 U+FE0F
U+1F3C3U+200DU+27A1 U+FE0F
在 Emoji 版本 14.0 中沒有這種形式的 RGI emoji ZWJ 序列曾撤。
2.11Emoji ZWJ 序列的順序
為個(gè)人表示 emoji ZWJ 序列時(shí),應(yīng)使用以下順序:
命令類別部分
1根據(jù)第 1.4.1 節(jié)表情符號(hào)字符
2表情符號(hào)修飾符或表情符號(hào)演示選擇器第 2.4 節(jié)多樣性
3頭發(fā)成分第 2.8 節(jié)頭發(fā)組件
4顏色第 2.9 節(jié)晕粪,顏色
5性別標(biāo)志或?qū)ο?i>第 2.3.1 節(jié)挤悉,中性表情符號(hào)
6方向指示器第 2.10 節(jié),表情符號(hào)字形朝向
有多種方法可以計(jì)算 Unicode 中的表情符號(hào)巫湘,特別是因?yàn)楸砬榉?hào)序列可能顯示為單個(gè)表情符號(hào)圖像装悲。以下概述了計(jì)算表情符號(hào)的方法昏鹃;它可以是(例如):
可以在 emoji 中使用的代碼點(diǎn)的數(shù)量,盡管這包括一些僅用作序列的一部分并且本身沒有表情符號(hào)外觀的代碼點(diǎn)诀诊;
?可以顯示為單個(gè)字形的一個(gè)或多個(gè)字符的所有序列(可能更接近用戶認(rèn)為的表情符號(hào)數(shù)量)洞渤,盡管通常只有可能序列的子集在任何平臺(tái)上顯示為單個(gè)字形,并且一些序列可能是特定于平臺(tái)的擴(kuò)展属瓣。
?建議任何旨在支持 Unicode 表情符號(hào)的字體或鍵盤都應(yīng)支持 [emoji-data] 數(shù)據(jù)文件中列出的字符和序列载迄。完整集的最佳定義在 emoji-test.txt 文件中。
?Emoji Counts, v14.0圖表提供了有關(guān)本規(guī)范當(dāng)前版本的各種計(jì)數(shù)的更多詳細(xì)信息。Emoji Counts Key中描述了各種列和行標(biāo)題?。
圖表中的“小計(jì)”行表示用戶通常認(rèn)為的表情符號(hào)的數(shù)量凛虽。例如丛肮,其中不包括 26 個(gè)區(qū)域指標(biāo) (RI) 代碼點(diǎn);即使它們具有 Emoji 狀態(tài)堕虹,它們通常僅成對(duì)使用來(lái)表示標(biāo)志。
?典型的鍵盤通常會(huì)顯示更少的表情符號(hào),因?yàn)樗鼈兛赡苁褂瞄L(zhǎng)按等機(jī)制來(lái)顯示特定表情符號(hào)的修飾符序列怠晴,因此不會(huì)同時(shí)顯示與圖表行相關(guān)的所有圖像,這些圖表行計(jì)算帶有顯式膚色的表情符號(hào)浴捆。
單獨(dú)的 [emoji-charts] 提供了有關(guān)其中許多子集和其他子集的更多信息蒜田,例如:
最近發(fā)布的表情符號(hào)字符列在最近添加的表情符號(hào)中。
?在Emoji Candidates中可以找到 Unicode 未來(lái)版本的?候選表情符號(hào)选泻。
There are different ways to count the emoji in Unicode, especially because an emoji sequence may display as a single emoji image. The following provides an overview of the ways to count emoji; it can be (for example):
The count of code points that can be used in emoji, though this includes some code points that are only used as part of sequences and don’t have emoji appearance by themselves;
All sequences of one or more characters that can appear as a single glyph (which is probably closer to what users think of as the number of emoji), though typically only a subset of possible sequences are displayed as a single glyph on any platform, and some sequences may be platform-specific extensions.
It is recommended that any font or keyboard whose goal is to support Unicode emoji should support the characters and sequences listed in the [emoji-data] data files. The best definition of the full set is in the emoji-test.txt file.
TheEmoji Counts, v14.0?chart provides more detail about the various counts?as of the current version of this specification. The various column and row headers are described inEmoji Counts Key.
The “Subtotal” row in the chart indicates the count of what users typically think of as emoji. For example, the 26 Regional Indicator (RI) code points are not included there; even though they have Emoji status, they are typically only used in pairs to represent flags.
Typical keyboards may normally present even fewer emoji, since they may use mechanisms like a long press to display modifier sequences for specific emoji, and would thus not simultaneously display all of the images associated with the chart rows that count emoji with explicit skin tones.
Separate [emoji-charts] provide more information on many of these subsets and others, for example:
Emoji characters that were released most recently are listed inEmoji Recently Added.
Emoji candidates for a future version of Unicode are found inEmoji Candidates.
即使在表情符號(hào)和文本表示選擇器可用的情況下冲粤,實(shí)施者也不清楚象形圖的默認(rèn)表示應(yīng)該是表情符號(hào)還是文本。這意味著當(dāng)跨平臺(tái)共享時(shí)页眯,一段文本可能會(huì)以不同于預(yù)期的樣式顯示梯捕。雖然這對(duì)于 Unicode 字符來(lái)說(shuō)是完全合法的——永遠(yuǎn)無(wú)法保證呈現(xiàn)風(fēng)格——但開發(fā)人員之間對(duì)何時(shí)使用表情符號(hào)呈現(xiàn)的共識(shí)很重要,這樣可以減少意外或不和諧的呈現(xiàn)窝撵。實(shí)現(xiàn)需要知道通常預(yù)期的默認(rèn)表示是什么傀顾,以促進(jìn)跨平臺(tái)和應(yīng)用程序的互操作性。
對(duì)于實(shí)現(xiàn)者來(lái)說(shuō)碌奉,三類 Unicode 字符之間沒有明確的界限:
emoji-default:那些希望默認(rèn)有表情符號(hào)演示的人短曾,但也可以有文本演示
text-default:那些期望默認(rèn)有文本顯示,但也可以有表情符號(hào)顯示的人
text-only:那些應(yīng)該只有文本演示的
可以使用附件 A:表情符號(hào)屬性和數(shù)據(jù)文件中列出的屬性來(lái)區(qū)分這些類別赐劣。第一類是Emoji=Yes和Emoji_Presentation=Yes的字符嫉拐。第二類是Emoji=Yes和Emoji_Presentation=No的字符。第三類是Emoji=No的字符魁兼。
給定表情符號(hào)字符的呈現(xiàn)取決于環(huán)境椭岩、是否存在表情符號(hào)或文本呈現(xiàn)選擇器以及默認(rèn)呈現(xiàn)樣式(表情符號(hào)與文本)。在短信和聊天等非正式環(huán)境中,大多數(shù)表情符號(hào)字符以彩色表情符號(hào)呈現(xiàn)更合適判哥,并且僅獲得帶有文本呈現(xiàn)選擇器的文本呈現(xiàn)献雅。反之,在文字處理等正式環(huán)境中塌计,一般情況下挺身,emoji 字符最好以文本呈現(xiàn)形式出現(xiàn),而僅通過(guò) emoji 呈現(xiàn)選擇器獲得彩色 emoji 呈現(xiàn)锌仅。
PropertyAbbrProperty Values
EmojiEmoji=Yesfor characters that are emoji
Emoji_PresentationEPres=Yesfor characters that have emoji presentation by default
Emoji_ModifierEMod=Yesfor characters that are emoji modifiers
Emoji_Modifier_BaseEBase=Yesfor characters that can serve as a base for emoji modifiers
Emoji_ComponentEComp=Yesfor characters used in emoji sequences that normally do not appear on emoji keyboards as separate choices, such as keycap base characters or Regional_Indicator characters. All characters in emoji sequences are eitherEmojiorEmoji_Component. Implementations must not, however, assume that allEmoji_Componentcharacters are alsoEmoji. There are some non-emoji characters that are used in various emoji sequences, such as tag characters andZWJ.
Extended_PictographicExtPict=Yesfor characters that are used to future-proof segmentation. TheExtended_Pictographiccharacters contain all theEmojicharacters except for someEmoji_Componentcharacters.
IfEmoji=No, thenEmoji_Presentation=No,Emoji_Modifier=No, andEmoji_Modifier_Base=No.
A.1Data Files
The emoji properties are specified in the emoji data files (see [emoji-data]):
emoji-data.txtProperty value for the properties listed in theEmoji Character Propertiestable
emoji-variation-sequences.txtAll permissibleemoji presentation sequencesandtext presentation sequences
emoji-zwj-sequences.txtZWJ sequences used to represent emoji
emoji-sequences.txtOther sequences used to represent emoji
emoji-test.txtTest file for emoji characters and sequences
章钾、
主要編碼規(guī)則詳細(xì)拆解介紹
Emoji 編碼規(guī)則 D1 emoji presentation sequence(呈現(xiàn)序列)
Emoji 編碼規(guī)則 D2 emoji modifier sequence (修飾序列)
Emoji 編碼規(guī)則 D3 emoji flag sequence (旗幟序列)
Emoji 編碼規(guī)則 D4 emoji keycap sequence (鍵盤序列)