背景:在國內(nèi)大家找Emoji的材料很多都是經(jīng)過各大博主吸收過在分析一遍的。而大家分析的角度不同,很難全面的去了解emoji的整個從發(fā)展到制作規(guī)則菌瘪,再到該如何展示的一個完整的表情過程。所以把官網(wǎng)的Emoji用谷歌翻譯轉(zhuǎn)成中文輔助大家理解。我僅作為搬運分享給大家玷室。為了讓大家了解技術(shù)的源頭。不做商用笤受。如果有侵權(quán)行為請聯(lián)系我穷缤。我立馬收回。
原文地址:https://www.unicode.org/reports/tr51/#Identification
Unicode? Technical Standard #51
概括
本文檔定義了 Unicode 表情符號字符和序列的結(jié)構(gòu)箩兽,并提供了支持該結(jié)構(gòu)的數(shù)據(jù)津肛,例如哪些字符被認(rèn)為是表情符號,哪些表情符號應(yīng)該默認(rèn)顯示為文本樣式而不是表情符號樣式汗贫,哪些可以是以多種膚色顯示身坐。它還提供設(shè)計指南,用于改進跨平臺和實現(xiàn)的表情符號字符的互操作性落包。
從本規(guī)范 11.0 版開始部蛇,表情符號字符庫與 Unicode 標(biāo)準(zhǔn)同步,并具有相同的版本編號系統(tǒng)妥色。有關(guān)詳細(xì)信息搪花,請參閱第 1.5.2 節(jié),?版本控制嘹害。
地位
本文檔已經(jīng)過 Unicode 成員和其他相關(guān)方的審核撮竿,并已被 Unicode 聯(lián)盟批準(zhǔn)發(fā)布。這是一份穩(wěn)定的文件笔呀,可用作參考資料或被其他規(guī)范引用為規(guī)范性參考幢踏。
Unicode 技術(shù)標(biāo)準(zhǔn) (UTS)是一個獨立的規(guī)范。符合 Unicode 標(biāo)準(zhǔn)并不意味著符合任何 UTS许师。
請使用在線報告表[反饋]提交勘誤和其他意見房蝉。有助于理解本文檔的相關(guān)信息可在參考資料中找到。有關(guān) Unicode 標(biāo)準(zhǔn)的最新版本微渠,請參閱 [?Unicode?]搭幻。有關(guān)當(dāng)前 Unicode 技術(shù)報告的列表,請參閱 [報告]逞盆。有關(guān) Unicode 標(biāo)準(zhǔn)版本的更多信息檀蹋,請參閱 [版本]。
1簡介
表:表情符號提案
表:主要來源
1.1表情符號和表情符號
1.2編碼注意事項
1.3目標(biāo)
1.4定義
1.4.1表情符號
1.4.2表情符號展示
1.4.3表情符號和文本呈現(xiàn)序列
1.4.4表情符號修飾符
1.4.5表情符號序列
1.4.6表情符號集
1.4.7符號
1.4.8 性能穩(wěn)定性
1.4.9?EBNF 和正則表達(dá)式
1.5一致性
表:表情符號功能
1.5.1排序一致性
1.5.2版本控制
表:表情符號版本
2.1名稱
2.2顯示
2.3性別
表:Emoji 13.0+ 中的 Emoji 更改為 Gender-Neutral
2.3.1中性表情符號
2.3.2表情符號輸入中的性別標(biāo)記
2.4多樣性
表:表情符號修飾符
2.4.1實現(xiàn)
2.4.2文字中的表情修飾符
2.5?Emoji ZWJ 序列
表:ZWJ序列顯示
2.6多人分組
表:多人分組
2.6.1多人性別
表:多人分組的性別
2.6.2多人膚色
2.7?Emoji 實現(xiàn)筆記
2.7.1表情符號和文本呈現(xiàn)選擇器
2.7.2處理標(biāo)簽字符
2.8頭發(fā)成分
2.9顏色
2.10表情符號字形朝向
2.11?Emoji ZWJ 序列的順序
1簡介
表情符號是象形文字(圖形符號)云芦,通常以彩色卡通形式呈現(xiàn)并在文本中內(nèi)嵌使用俯逾。它們代表諸如面孔贸桶、天氣、車輛和建筑物桌肴、食物和飲料皇筛、動物和植物或代表情感、感覺或活動的圖標(biāo)等事物坠七。
智能手機以及聊天和電子郵件應(yīng)用程序中的表情符號已在全球范圍內(nèi)變得非常流行水醋。例如,截至 2015 年 3 月灼捂,Instagram 報告稱“[Instagram 上] 近一半的文字包含表情符號离例』煌牛” 如 SwiftKey 表情符號報告中所述悉稠,單個表情符號的受歡迎程度也有很大差異(甚至因國家/地區(qū)而異)。有關(guān)這些報告和其他報告的詳細(xì)信息艘包,請參閱表情符號新聞頁面的猛。
表情符號最常用于快速、簡短的社交媒體消息中想虎,它們與讀者聯(lián)系并增加風(fēng)味卦尊、色彩和情感。表情符號沒有替代書面語言的語法或詞匯舌厨。在社交媒體中岂却,表情符號彌補了語音中缺少的手勢、面部表情和語調(diào)裙椭。它們還為消息添加了有用的歧義躏哩,允許作者同時傳達(dá)許多不同的可能概念。許多人也被在表情符號中編寫消息的挑戰(zhàn)所吸引揉燃,以及對表情符號消息的困惑扫尺。
表情符號這個詞來自日語:
表情符號可以在內(nèi)部表示為圖形炊汤,也可以通過像其他字符一樣以字體編碼的普通字形表示正驻。為清楚起見,后者被稱為表情符號字符抢腐。一些 Unicode 字符通常顯示為表情符號姑曙;有些通常顯示為普通文本,有些可以雙向顯示迈倍。
自從表情符號出現(xiàn)在 Unicode 標(biāo)準(zhǔn)中以來伤靠,媒體對它們的關(guān)注度很高,從 2013 年底開始關(guān)注度增加授瘦。例如醋界,根據(jù)谷歌新聞的數(shù)據(jù)竟宋,在 Unicode 7.0 中出現(xiàn)了大約 6,000 篇關(guān)于表情符號的文章。有關(guān)此類文章的許多示例形纺,請參閱emoji 新聞頁面丘侠,以及第 38 屆國際化和 Unicode 會議的主題演講。
表情符號于 1999 年在日本手機上可用逐样。早在 2000 年就提出了將 DoCoMo 表情符號編碼為 Unicode 標(biāo)準(zhǔn)的提議蜗字。當(dāng)時還不清楚這些字符是否會被廣泛使用——而且日本手機運營商也不支持將它們添加到 Unicode 中——因此沒有采取任何行動。
表情符號在日本非常流行脂新,但每個手機運營商都開發(fā)了不同(但部分重疊)的集合挪捕,每個手機供應(yīng)商都使用自己的文本編碼擴展,這些擴展互不兼容争便。供應(yīng)商開發(fā)了交叉映射表级零,以允許表情符號字符與其他供應(yīng)商的手機(包括電子郵件)進行有限的交換。其他平臺無法顯示的字符用〓(U+3013 GETA MARK)表示滞乙,但字符很容易損壞或掉線奏纪。
當(dāng)非日本電子郵件和手機供應(yīng)商開始支持與日本運營商的電子郵件交換時,他們遇到了這些問題斩启。此外序调,沒有辦法用 Unicode 來表示這些字符,而 Unicode 是所有現(xiàn)代程序中文本的基礎(chǔ)兔簇。2006 年发绢,Google 開始著手將日文表情符號轉(zhuǎn)換為 Unicode 私人使用代碼,從而在2007 年
開發(fā)了通過 Unicode 字符支持運營商表情符號的內(nèi)部映射表垄琐。
然而边酒,私有使用方法存在許多問題,因此向 Unicode 聯(lián)盟提出了一項建議此虑,以擴大符號的范圍以包含表情符號甚纲。該提案于 2007 年 5 月獲得批準(zhǔn),導(dǎo)致符號小組委員會的成立朦前,2007 年 8 月介杆,技術(shù)委員會同意根據(jù)小組委員會制定的一套原則支持 Unicode 中的表情符號編碼。以下是一些跟蹤 Unicode 表情符號字符進程的文檔韭寸。
td {white-space:pre-wrap;border:1px solid #dee0e3;}日期文件號標(biāo)題作者
2000/4/26L2/00-152NTT DoCoMo 象形文字格雷厄姆·阿舍(Symbian)
2006/11/1L2/06-369符號(范圍擴展)馬克戴維斯(谷歌)
2007/8/3L2/07-257編碼表情符號的工作草案提案Kat Momoi春哨、Mark Davis、Markus Scherer(谷歌)
2007/8/9L2/07-274R符號決議草案馬克戴維斯(谷歌)
2007/9/18L2/07-391日本電視符號 (ARIB)米歇爾·蘇格納德(微軟)
2009/1/30L2/09-026為新編碼提出的表情符號Markus Scherer恩伺、Mark Davis赴背、Kat Momoi、Darick Tong(谷歌);
Yasuo Kida, Peter Edberg (Apple)
2009/3/5L2/09-025R2對表情符號進行編碼的建議
2010/4/27L2/10-132表情符號:背景數(shù)據(jù)
2011/2/15L2/11-052RWingdings 和 Webdings 符號米歇爾·蘇格納德
要查找此表中的文檔凰荚,請參閱UTC 文檔燃观。
2009 年,第一個明確用作表情符號的 Unicode 字符被添加到 Unicode 5.2 中便瑟,以實現(xiàn)與 ARIB(無線電工業(yè)和商業(yè)協(xié)會)集的互操作性缆毁。一組 722 個字符被定義為日本手機運營商使用的表情符號字符的聯(lián)合:其中 114 個字符已經(jīng)在 Unicode 5.2 中。2010 年到涂,剩下的 608 個表情符號字符與其他一些表情符號字符一起被添加到 Unicode 6.0脊框。2012 年,更多的表情符號被添加到 Unicode 6.1践啄,2014 年更多的表情符號被添加到 Unicode 7.0浇雹。從那時起,根據(jù)提交 Unicode 表情符號提案指南中的選擇因素屿讽,添加了其他字符昭灵。
以下是用作表情符號的一些主要象形文字來源何時以 Unicode 編碼的摘要。每個來源可能包含除表情符號之外的其他字符聂儒,Unicode 字符可以對應(yīng)多個來源虎锚。L 列包含用于圖表 [emoji-charts] 和數(shù)據(jù)文件 [emoji-data] 的各種來源的單字母縮寫硫痰。不對應(yīng)任何這些來源的字符可以用其他 (x) 標(biāo)記衩婚。
有關(guān)何時將各種表情符號源集添加到 Unicode 的詳細(xì)視圖,請參閱表情符號版本源[emoji-charts]效斑。數(shù)據(jù)文件 [JSources] 顯示了與原始日本運營商符號的對應(yīng)關(guān)系非春。
人們經(jīng)常問 Unicode 標(biāo)準(zhǔn)中有多少個表情符號。這個問題沒有一個簡單的答案缓屠,因為沒有明確的界限來區(qū)分哪些象形字符應(yīng)該以典型的表情符號樣式顯示奇昙。有關(guān)完整圖片,請參閱哪些字符是表情符號敌完。
本文檔中使用的彩色圖像和相關(guān)圖表 [emoji-charts] 僅用于說明储耐。它們沒有出現(xiàn)在只有黑白圖像的 Unicode 標(biāo)準(zhǔn)中。它們要么由各自的供應(yīng)商提供以供在本文檔中使用滨溉,要么被認(rèn)為可用于非商業(yè)用途什湘。使用供應(yīng)商圖像的許可查詢應(yīng)直接發(fā)送給這些供應(yīng)商,而不是 Unicode 聯(lián)盟晦攒。有關(guān)更多信息闽撤,請參閱表情符號圖像的權(quán)利。
1.1表情符號和表情符號
表情符號一詞是指一系列文本字符(通常是標(biāo)點符號或符號)脯颜,用于表示面部表情或手勢(有時從側(cè)面看)哟旗,如下所示。
;-)
,但后來被改編為包含 Unicode 字符闸餐。以下示例不僅使用 ASCII 字符饱亮,還使用 U+203F ( ? )、U+FE35 ( ︵ )舍沙、U+25C9 ( ? ) 和 U+0CA0 ( ? )近尚。
^?^
?︵?
?_?
通常實現(xiàn)允許使用表情符號來輸入表情符號。例如场勤,表情符號 ;-) 可以映射到
聊天窗口中戈锻。表情符號一詞有時在更廣泛的意義上使用,還包括用于面部表情和手勢的表情符號和媳。這種廣義的含義用于 Unicode 塊名稱Emoticons格遭,涵蓋從 U+1F600 到 U+1F64F 的代碼點。
1.2編碼注意事項
Unicode 是所有現(xiàn)代軟件中文本的基礎(chǔ):它是所有手機留瞳、臺式機和其他計算機表示每種語言文本的方式拒迅。人們每次在手機或臺式計算機上鍵入密鑰,以及每次查看網(wǎng)頁或應(yīng)用程序中的文本時她倘,都在使用 Unicode璧微。標(biāo)準(zhǔn)要穩(wěn)定非常重要,并且要仔細(xì)審查其中的每個角色硬梁。這需要一個開發(fā)周期長的正式流程前硫。例如,
深色太陽鏡字符在 Unicode 7.0 發(fā)布前幾年就首次提出荧止。
考慮進行編碼的字符通常必須作為文本元素廣泛使用屹电。表情符號和各種符號被添加到 Unicode 中,因為它們在許多日本制造商的公司標(biāo)準(zhǔn)和其他地方用作文本消息的字符跃巡,或者在 Wingdings 和 Webdings 等廣泛分布的字體中長期使用危号。在許多情況下,添加字符是為了往返于源集的完整往返素邪,而不是因為它們本質(zhì)上比其他字符更重要外莲。例如,
翻蓋電話字符被包括在內(nèi)兔朦,因為它在 Wingdings 和 Webdings 中偷线,而不是因為它比“臭鼬”字符更重要。
在某些情況下烘绽,添加一個字符來完成一個集合:例如淋昭,在 Unicode 6.0 中添加了
橄欖球字符以補充
美式足球字符(在 Unicode 5.2 中重新添加了足球)
。同樣安接,添加了一種機制翔忽,可用于表示所有國家標(biāo)志(對應(yīng)于兩個字母的unicode_region_subtag的那些)英融,例如加拿大的標(biāo)志,即使日本運營商集只有 10 個國家標(biāo)志歇式。
數(shù)據(jù)不包括非象形文字驶悟,除了那些在 Unicode 中用于表示來自表情符號來源的字符以實現(xiàn)兼容性的數(shù)據(jù),例如:
或者
除了 U+1F0CF ( ) PLAYING CARD BLACK JOKER 和 U+1F004 (?
) MAHJONG TILE RED DRAGON 之外材失,游戲部件痕鳍,例如多米諾骨牌 (?? ?? ?? ... ?? ??) 目前不包含在表情符號中。這些被包括在內(nèi)龙巨,因為它們對應(yīng)于每個載體組中的一個表情符號字符笼呆。
用于權(quán)衡潛在候選人編碼的選擇因素可在提交 Unicode 表情符號提案指南中的選擇因素中找到。該文件還提供了提交新表情符號提案的說明旨别。
有關(guān)表情符號的常見問題列表诗赌,請參閱Unicode 表情符號常見問題解答。
1.3目標(biāo)
本文件提供:
用于改進跨平臺和實現(xiàn)的互操作性的設(shè)計指南
關(guān)于表情符號字符的背景信息和長期替代品
數(shù)據(jù)表明:
哪些字符通辰粘冢可以被認(rèn)為是表情符號
默認(rèn)情況下铭若,哪些表情符號字符應(yīng)以文本樣式與表情符號樣式顯示
可以使用各種膚色顯示哪些表情符號字符,以及實現(xiàn)細(xì)節(jié)
指向 [CLDR]數(shù)據(jù)的 指針
更自然地對表情符號進行排序
用于搜索和分組表情符號字符的注釋
它還提供了有關(guān)表情符號的背景信息递览,并討論了表情符號的長期方法叼屠。
隨著新的 Unicode 字符的添加或表情符號使用的“常見做法”發(fā)生變化,本文檔提供的數(shù)據(jù)和建議可能會隨之發(fā)生變化绞铃。因此镜雨,建議和數(shù)據(jù)將在本文檔的各個版本中發(fā)生變化。
1.4定義
以下提供了本文檔中使用的一些術(shù)語的更正式的定義憎兽。對文檔的其他功能更感興趣的讀者可以選擇從第 2 節(jié)冷离,設(shè)計指南繼續(xù)。
ED-1纯命。emoji— 一種彩色象形文字,可以在文本中內(nèi)聯(lián)使用痹栖。在內(nèi)部亿汞,表示是(a)圖像,(b)編碼字符或(c)編碼字符序列揪阿。
對于 (a) 疗我,本文檔中使用了術(shù)語emoji 圖像。也可以使用術(shù)語貼紙南捂。
對于 (b)而言吴裤,為了清楚起見,在必要時使用了表情符號字符這一術(shù)語溺健。
對于 (c)麦牺,為了清楚起見,使用了術(shù)語emoji 序列。
ED-2剖膳。表情符號— (1) 一系列文本字符(通常是標(biāo)點符號或符號)魏颓,用于表示面部表情或手勢,例如 ;-) 和 (2) 在更廣泛的意義上吱晒,還包括用于面部表情和手勢的表情符號甸饱。
1.4.1表情符號
ED-3。emoji character— 具有Emoji 屬性的字符仑濒。
emoji_character := \p{Emoji}
建議將這些字符用作表情符號粟害。
ED-4。擴展象形文字— 具有 Extended_Pictographic屬性的字符圈盔。
這些字符是象形的鱼辙,或者在其他方面與具有 Emoji 屬性的字符相似。
Extended_Pictographic屬性用于自定義分段(如 [UAX29] 和 [UAX14] 中所述)矗烛,以便將來可能的 emoji zwj 序列不會破壞字素簇辅柴、單詞或線條。在某些塊中具有 Line_Break=ID 的未分配代碼點也被分配了 Extended_Pictographic屬性瞭吃。這些塊用于將來分配表情符號字符碌嘀。
ED-5。表情符號組件— 具有Emoji_Component 屬性的字符歪架。
這些字符在表情符號序列中使用股冗,但通常不會作為單獨的選項出現(xiàn)在表情符號鍵盤上,例如鍵帽基本字符或區(qū)域指示符字符和蚪。
一些emoji 組件是emoji 字符止状,而其他(例如標(biāo)簽字符和ZWJ)不是。
有關(guān)詳細(xì)信息攒霹,請參閱第 3 節(jié)怯疤,哪些字符是表情符號。有關(guān)定義表情符號屬性的數(shù)據(jù)文件的信息催束,請參閱附件 A:表情符號屬性和數(shù)據(jù)文件集峦。
1.4.2表情符號展示
ED-6。默認(rèn)表情符號演示字符- 默認(rèn)情況下抠刺,應(yīng)與表情符號演示而不是文本演示一起出現(xiàn)的字符塔淤。
default_emoji_presentation_character := \p{Emoji_Presentation}
這些字符具有Emoji_Presentation 屬性。請參閱附件 A:表情符號屬性和數(shù)據(jù)文件速妖。
ED-7高蜂。默認(rèn)文本演示字符— 默認(rèn)情況下應(yīng)與文本演示一起出現(xiàn)的字符,而不是表情符號演示罕容。
default_text_presentation_character := \P{Emoji_Presentation}
這些字符沒有Emoji_Presentation 屬性备恤;也就是說稿饰,它們的Emoji_Presentation 屬性值為No。請參閱附件 A:表情符號屬性和數(shù)據(jù)文件烘跺。
有關(guān)表情符號和文本演示的更多詳細(xì)信息湘纵,請參閱第 2 節(jié),設(shè)計指南和第 4 節(jié)滤淳,演示樣式梧喷。
1.4.3表情符號和文本呈現(xiàn)序列
ED-8。文本呈現(xiàn)選擇器- 字符 U+FE0E VARIATION SELECTOR-15 (VS15)脖咐,用于請求表情符號字符的文本呈現(xiàn)铺敌。 (在本規(guī)范的先前版本中 也稱為文本變體選擇器
text_presentation_selector := \x{FE0E}
ED-8a。文本呈現(xiàn)序列- 由一個表情符號字符 和一個文本呈現(xiàn)選擇器屁擅。
text_presentation_sequence := emoji_character text_presentation_selector
唯一有效的文本呈現(xiàn)序列是emoji-variation-sequences.txt [emoji-data] 中列出的那些偿凭。
ED-9。表情符號演示選擇器- 字符 U+FE0F VARIATION SELECTOR-16 (VS16)派歌,用于請求表情符號字符的表情符號演示弯囊。 (在本規(guī)范的先前版本中 也稱為表情符號變體選擇器
emoji_presentation_selector := \x{FE0F}
ED-9a。emoji 表示序列— 由一個emoji 字符和一個emoji 表示選擇器胶果。
emoji_presentation_sequence := emoji_character emoji_presentation_selector
唯一有效的表情符號呈現(xiàn)序列是emoji-variation-sequences.txt [emoji-data]中列出的那些匾嘱。
ED-10。(此定義已被刪除早抠。)
1.4.4表情符號修飾符
ED-11霎烙。emoji 修飾符— 可用于修改emoji 修飾符序列中前面的 emoji 外觀的字符。
emoji_modifier := \p{Emoji_Modifier}
這些字符具有Emoji_Modifier 屬性蕊连。請參閱附件 A:表情符號屬性和數(shù)據(jù)文件悬垃。
ED-12。emoji modifier base— 一個字符甘苍,其外觀可以由emoji 修飾符序列中的后續(xù) emoji 修飾符修改尝蠕。
emoji_modifier_base := \p{Emoji_Modifier_Base}
這些字符具有Emoji_Modifier_Base 屬性。請參閱附件 A:表情符號屬性和數(shù)據(jù)文件羊赵。
它們也列在受表情符號修飾符的字符中趟佃。
ED-13。emoji 修飾符序列— 以下形式的序列:
emoji_modifier_sequence :=? emoji_modifier_base emoji_modifier
有關(guān)表情符號修飾符的更多詳細(xì)信息昧捷,請參閱第 2.4 節(jié),多樣性罐寨。
1.4.5表情符號序列
ED-14靡挥。表情符號標(biāo)志序列- 兩個區(qū)域指示符字符的序列,其中對應(yīng)的 ASCII 字符是[CLDRUnicode 區(qū)域子標(biāo)簽指定的有效區(qū)域序列 鸯绿,idStatus="regular" 或 "deprecated"跋破。另請參閱附件 B:有效的表情符號標(biāo)志序列簸淀。
emoji_flag_sequence :=? regional_indicator regional_indicator
regional_indicator := \p{Regional_Indicator}
單例區(qū)域指示符字符不是格式良好的表情符號標(biāo)志序列。
ED-14a毒返。表情符號標(biāo)簽序列 (ETS)— 以下形式的序列:
emoji_tag_sequence := tag_base tag_spec tag_endtag_base? ? ? ? ? := emoji_character? ? ? ? ? ? ? ? ? ? | emoji_modifier_sequence? ? ? ? ? ? ? ? ? ? | emoji_presentation_sequencetag_spec? ? ? ? ? := [\x{E0020}-\x{E007E}]+tag_end? ? ? ? ? ? := \x{E007F}
tag_spec由從 U+E0020 TAG SPACE 到 U+E007E TAG TILDE 的所有字符組成租幕。每個都tag_spec定義了一個特定的視覺變體,以應(yīng)用于tag_base字符拧簸。雖然tag_spec包括值 U+E0041 TAG LATIN CAPITAL LETTER A .. U+E005A TAG LATIN CAPITAL LETTER Z劲绪,但它們目前不使用,保留用于將來的擴展盆赤。
由tag_end字符 U+E007F CANCEL TAG 組成贾富,必須用于終止序列。
不屬于 an 的標(biāo)簽字符序列emoji_tag_sequence不是格式良好的表情符號標(biāo)簽序列牺六。
表情符號標(biāo)簽序列的含義和有效性標(biāo)準(zhǔn)以及 a 的預(yù)期視覺變體tag_spec由附件 C:有效表情符號標(biāo)簽序列確定颤枪。
ED-14b。(此定義已被刪除淑际。)
ED-14c畏纲。emoji 鍵帽序列— 以下形式的序列:
emoji_keycap_sequence := [0-9#*] \x{FE0F 20E3}
這些序列位于type_field Emoji_Keycap_Sequence下列出的emoji-sequences.txt文件中
ED-15。emoji 核心序列— 以下形式的序列:
emoji_core_sequence :=? emoji_character| emoji_presentation_sequence| emoji_keycap_sequence| emoji_modifier_sequence| emoji_flag_sequence
ED-15a春缕。emoji zwj 元素— 可以在 emoji ZWJ 序列中使用的更有限的元素盗胀,如下所示:
emoji_zwj_element :=? emoji_character| emoji_presentation_sequence| emoji_modifier_sequence
ED-16。emoji zwj 序列— 具有至少一個連接符的 emoji 序列淡溯。
emoji_zwj_sequence :=? emoji_zwj_element ( ZWJ emoji_zwj_element )+
ZWJ := \x{200d}
ED-17读整。表情符號序列— 核心序列、標(biāo)簽序列或 ZWJ 序列咱娶,如下所示:
emoji_sequence :=? emoji_core_sequence| emoji_zwj_sequence| emoji_tag_sequence
ED-17a米间。限定的表情符號字符- 字符串中的表情符號字符 (a) 具有默認(rèn)表情符號表示或 (b) 是表情符號修飾符序列中的第一個字符或 (c) 不是默認(rèn)表情符號表示字符,但是第一個字符表情符號演示序列膘侮。
ED-18屈糊。完全限定的 emoji— 限定的 emoji 字符,或每個 emoji 字符都限定的 emoji 序列琼了。
ED-18a逻锐。最低限度限定的 emoji— 一個 emoji 序列,其中第一個字符是限定的雕薪,但序列不是完全限定的昧诱。
ED-19。不合格的表情符號——既不是完全合格也不是最低限度合格的表情符號所袁。
有關(guān)在表情符號序列中使用變體選擇器的建議盏档,請參閱第 2.7 節(jié),表情符號實現(xiàn)說明燥爷。
1.4.6表情符號集
以下集合是根據(jù)附件 A 中描述的數(shù)據(jù)文件和屬性定義的:表情符號屬性和數(shù)據(jù)文件蜈亩。這些集合的組成可能會從一個版本更改為下一個版本懦窘。
這些集合中的每一個都可以被認(rèn)為是一個二元屬性。它們是字符串的屬性稚配。有關(guān)更多討論畅涂,請參閱UTS #18:Unicode 正則表達(dá)式[UTS18] 和UTR #23:Unicode 字符屬性模型[UTR23]。
ED-20道川∥缢ィ基本表情符號集— type_field Basic_Emojiemoji-data]中列出的表情符號字符集和表情符號呈現(xiàn)序列。
這是一組用于通用輸入的表情符號愤惰。
該集合不包括所有不用于獨立直接輸入的表情符號組件實例苇经。實現(xiàn)應(yīng)支持此集中表情符號組件的獨立顯示,即使它們不可用于直接輸入宦言。
膚色修改器和頭發(fā)組件甚至應(yīng)該單獨顯示扇单,但它們不應(yīng)該(通常)出現(xiàn)在鍵盤面板上。這些包含在 Basic_Emoji 中奠旺。
其他組件(U+20E3 COMBINING ENCLOSING KEYCAP蜘澜、區(qū)域指示符、標(biāo)簽字符响疚、ZWJ 和 VS16)不應(yīng)該單獨出現(xiàn)表情符號鄙信,而是作為表情符號序列的一部分出現(xiàn)。這些不包含在 Basic_Emoji 中忿晕。
否則装诡,此集合包括? 屬性值為 Emoji_Presentation = Yes 的表情符號字符的所有實例以及 其基本字符的屬性值為 Emoji_Presentation? = No 的有效 表情符號呈現(xiàn)序列的所有實例。
ED-21践盼。emoji keycap sequence set—emoji-sequences.txt文件 [emoji-data] 中 type_fieldEmoji_Keycap_Sequence 下列鸦采。
這是所有有效表情符號鍵帽序列的集合。
注意:以下定義使用首字母縮略詞“RGI”來表示“推薦用于一般交換”咕幻,指的是旨在跨多個平臺廣泛支持的某個較大集合的子集渔伯。
ED-22。RGI emoji 表情修飾符序列集—emoji-sequences.txt文件 [emoji-data] 中 type_fieldRGI_Emoji_Modifier_Sequence 下列肄程。
這是推薦用于一般交換的所有有效 表情符號修飾符序列的子集锣吼。
ED-23。RGI emoji flag sequence set— emoji-sequences.txt文件 [emoji-data] 中 type_fieldRGI_Emoji_Flag_Sequence中列出的特定表情符號序列蓝厌。
這是推薦用于一般交換的所有有效表情符號標(biāo)志序列的子集玄叠。請參閱附件 B:有效的表情符號標(biāo)志序列
ED-24。RGI 表情符號標(biāo)簽序列集—emoji-sequences.txt文件 [emoji-data] 中 type_fieldRGI_Emoji_Tag_Sequence 下列拓提。
這是推薦用于一般交換的所有有效表情符號標(biāo)簽序列的子集诸典。請參閱附件 C:有效的表情符號標(biāo)簽序列。
ED-25崎苗。RGI emoji ZWJ 序列集— 在RGI_Emoji_ZWJ_Sequenceemoji-zwj-sequences.txt文件 [emoji-data]狐粱。
這是推薦用于一般交換的所有有效表情符號 zwj 序列的子集。
ED-26胆数。(此定義已被刪除肌蜻。)
ED-27。RGI 表情符號集— ED-20必尼、ED-21蒋搜、ED-22、ED-23判莉、ED-24和ED-25涵蓋的所有表情符號(字符和序列)的集合 豆挽。
這是推薦用于一般交換的所有有效表情符號(字符和序列)的子集。
這對應(yīng)于RGI_Emoji屬性券盅。
1.4.7符號
全部大寫的字符名稱是正式的 Unicode 名稱屬性值帮哈,例如 U+1F473 MAN WITH TURBAN。正式名稱是不可變的內(nèi)部標(biāo)識符锰镀,但通常不能反映當(dāng)前解釋字符的做法娘侍。
現(xiàn)有字符或序列的小寫字符名稱是 CLDR 短名稱,例如 U+1F473person wear turban泳炉。
1.4.8 性能穩(wěn)定性
表情符號屬性對于每個版本的數(shù)據(jù)都是穩(wěn)定的——它們不會因那個版本而改變憾筏。但是,它們可能會在該版本和后續(xù)版本之間發(fā)生變化花鹅。例如氧腰,對于 Emoji 版本 5.0,isEmoji(?)=false刨肃,但對于版本 11.0古拴,則為 true。
某些表情符號屬性未針對某些字符串操作關(guān)閉之景。例如:
isEmoji(toLowercase(X)) ≠ isEmoji(X) 對于 X=?? 的情況斤富,因為:
isEmoji(??) = true
toLowercase(??) = ?
isEmoji(?) = false
套管操作可能會產(chǎn)生無效的變化序列。雖然以下字符串形成了一個大小寫對锻狗,但表情符號表示選擇器沒有為 ? 定義满力,因此對其呈現(xiàn)沒有影響:
td {white-space:pre-wrap;border:1px solid #dee0e3;}?? = <U+24C2 帶圓圈的拉丁大寫字母 M, U+FE0F VS16>有效變化序列
? = <U+24DC 帶圓圈的拉丁小寫字母 M, U+FE0F VS16>無效的變化序列
1.4.9 EBNF 和正則表達(dá)式
以下 EBNF 可用于快速掃描可能的表情符號。然后可以在必要時通過根據(jù)定義執(zhí)行有效性測試或檢查RGI 表情符號集來驗證這些可能的表情符號轻纪。它比當(dāng)前定義中的表達(dá)式要簡單得多油额。它包括一個表情符號的超集,作為這種簡單性的副產(chǎn)品刻帚,但可以通過有效性測試清除額外的表情符號潦嘶。
td {white-space:pre-wrap;border:1px solid #dee0e3;}EBNF筆記
可能的表情符號:=
flag_sequence
| zwj_element (\x{200D} zwj_element)*
\x{200D} = 零寬度連接符
flag_sequence := \p{RI} \p{RI}\p{RI} = 區(qū)域指標(biāo)
zwj_element := \p{Emoji} emoji_modification?
表情符號修改:= \p{EMod} | \x{FE0F} \x{20E3}?\p{EMod} = Emoji_Modifier
\x{FE0F} = emoji VS
\x{20E3} = 封閉鍵帽
tag_modifier :=
[\x{E0020}-\x{E007E}]+ \x{E007F}
\x{E00xx} 是標(biāo)簽
\x{E007F} = TERM 標(biāo)簽
從這些 EBNF 規(guī)則可以生成一個正則表達(dá)式崇众,如下所示掂僵。雖然這個正則表達(dá)式可能看起來很復(fù)雜航厚,但它比定義的結(jié)果要簡單得多。直接使用定義會導(dǎo)致正則表達(dá)式復(fù)雜很多倍锰蓬,但仍需要通過有效性測試進行驗證幔睬。
td {white-space:pre-wrap;border:1px solid #dee0e3;}正則表達(dá)式
\p{RI} \p{RI} | \p{表情符號} ( \p{EMod} | \x{FE0F} \x{20E3}? | [\x{E0020}-\x{E007E}]+ \x{E007F})芹扭? (\x{200D} \p{表情符號} ( \p{EMod} | \x{FE0F} \x{20E3}麻顶? | [\x{E0020}-\x{E007E}]+ \x{E007F})? )*
1.5一致性
以下條款規(guī)定了與本規(guī)范的一致性舱卡。
C1辅肾。聲明符合本規(guī)范的實現(xiàn)應(yīng)標(biāo)識聲明符合本規(guī)范的版本。
本規(guī)范的每個版本都有 Unicode 標(biāo)準(zhǔn)的最低版本轮锥,其中包含Emoji=Yes的所有字符矫钓。例如,聲稱符合 Emoji 5.0 的實現(xiàn)還必須支持 Unicode 9.0 曲目交胚。
C2份汗。聲稱符合本規(guī)范的實現(xiàn)應(yīng)識別下面指定的哪些功能支持哪個表情符號設(shè)置ED-20到ED-25。這必須至少包括set ED-20basic emoji set的C2a顯示功能蝴簇。例如杯活,一個實現(xiàn)可以聲明它支持基本表情符號集顯示、 編輯和輸入功能 表情符號修飾符序列集的顯示和 編輯功能熬词,并且不得聲稱任何其他集合的功能旁钧。
td {white-space:pre-wrap;border:1px solid #dee0e3;}C2a顯示器該實現(xiàn)能夠?qū)⒅付械拿總€字符和序列顯示為帶有表情符號表示的單個字形。
C2b編輯該實現(xiàn)將指定集中的每個字符和序列視為一個不可分割的單元互拾,用于編輯目的(光標(biāo)移動歪今、刪除、換行等)颜矿。
C2c輸入該實現(xiàn)提供了一種機制寄猩,用于將指定集中的每個字符和序列輸入為帶有表情符號表示的單個字形。
一個實現(xiàn)可以聲明部分符合C2骑疆,指定它不支持的字符集田篇。例如,一個實現(xiàn)可以聲明除了 [? {????}] 集之外的所有表情符號集和功能都符合 C2箍铭,即:
U+23CF彈出按鈕
U+1F1FA U+1F1F3聯(lián)合國
C3泊柬。聲稱符合本規(guī)范的實現(xiàn)不得支持用于display或input的無效 emoji_flag_sequence 或無效或格式錯誤的 emoji_tag_sequence顯示除外,例如
.
單個 emoji 表情區(qū)域指示器可以顯示為帶有特殊顯示的大寫 A..Z 字符
實現(xiàn)可以支持以下任何顯示诈火、編輯或輸入:
基本表情符號集之外的單個代碼點
一個表情符號序列兽赁,將在ED-20到ED-25表情符號集之一中,但它缺少一個或多個表情符號演示選擇器
1.5.1排序一致性
實現(xiàn)可以通過符合特定版本的 CLDR 來聲明表情符號排序規(guī)則或短名稱的一致性。
1.5.2版本控制
從本規(guī)范 11.0 版開始刀崖,表情符號字符庫與 Unicode 標(biāo)準(zhǔn)同步惊科,并具有相同的版本編號系統(tǒng)。
從 13.0 版開始蒲跨,數(shù)據(jù)文件注釋使用標(biāo)簽約定“Ex.x”译断。此標(biāo)簽對應(yīng)于表情符號字符或表情符號序列首次在關(guān)聯(lián)數(shù)據(jù)文件中定義時的表情符號版本。例如或悲,標(biāo)簽“E5.0”與Unicode Emoji,版本 5.0相關(guān)聯(lián)堪唐。在 2015 年 Emoji 1.0 正式發(fā)布之前巡语,主要用于 emoji 字符的三個特殊值:
td {white-space:pre-wrap;border:1px solid #dee0e3;}標(biāo)簽預(yù)期覆蓋范圍
E0.0此標(biāo)簽用于特殊字符,包括:大多數(shù)表情符號組件字符淮菠,無論它們何時首次編碼男公。數(shù)據(jù)文件中的其他非表情符號字符。
E0.6添加到 Unicode 6.0 的表情符號字符合陵。這包括源自日本運營商集的表情符號字符枢赔,以及來自 ARIB 日本電視標(biāo)準(zhǔn)的一些字符。
E0.7添加到 Unicode 7.0 的表情符號字符拥知。這主要包括源自 Windows Wingding 和 Webdings 集的表情符號踏拜,但也包括來自 ARIB 日本電視標(biāo)準(zhǔn)的更多字符。
下表顯示了對應(yīng)的 Emoji 版本和 Unicode 標(biāo)準(zhǔn)版本低剔,一直到版本 14.0速梗,包括數(shù)據(jù)文件注釋中使用的標(biāo)簽。
td {white-space:pre-wrap;border:1px solid #dee0e3;}表情符號版日期統(tǒng)一碼版本數(shù)據(jù)文件注釋
不適用各種各樣的各種各樣的E0.0
不適用2010/10/11統(tǒng)一碼 6.0E0.6
不適用2014/6/16統(tǒng)一碼 7.0E0.7
表情符號 1.02015/6/9統(tǒng)一碼 8.0E1.0
表情符號 2.02015/11/12統(tǒng)一碼 8.0E2.0
表情符號 3.02016/6/3統(tǒng)一碼 9.0E3.0
表情符號 4.02016/11/22統(tǒng)一碼 9.0E4.0
表情符號 5.02017/6/20統(tǒng)一碼 10.0E5.0
表情符號 11.02018/5/21統(tǒng)一碼 11.0E11.0
表情符號 12.02019/3/5統(tǒng)一碼 12.0E12.0
表情符號 12.12019/10/21統(tǒng)一碼 12.1E12.1
表情符號 13.02020/3/10統(tǒng)一碼 13.0E13.0
表情符號 13.12020/9/15統(tǒng)一碼 13.0E13.1
表情符號 14.02021/9/14統(tǒng)一碼 14.0E14.0
Unicode 字符可以有許多不同的文本表示形式襟齿。例如姻锁,“a”可能會因字體而異。表情符號字符可以有兩種主要的表現(xiàn)形式:
一個表情符號演示猜欺,具有色彩繽紛位隶、也許是異想天開的形狀,甚至是動畫
文本演示开皿,例如黑白
更準(zhǔn)確地說涧黄,文本表示是一個簡單的前景形狀,其顏色由其他信息確定副瀑,例如在文本上設(shè)置顏色弓熏,而表情符號表示確定字符的顏色,并且通常是多色的糠睡。換句話說挽鞠,當(dāng)有人在文字處理器中更改文本顏色時,帶有表情符號的字符不會改變顏色。
任何 Unicode 字符都可以以文本形式呈現(xiàn)信认,就像在 Unicode 圖表中一樣材义。對于表情符號表示,在設(shè)計表情符號的外觀時嫁赏,應(yīng)同時考慮名稱和 Unicode 圖表中的代表字形其掂,以及其他供應(yīng)商使用的圖像。角色的形狀可以有很大的不同潦蝇。例如款熬,這里只是 U+1F36D LOLLIPOP、U+1F36E CUSTARD攘乒、U+1F36F HONEY POT 和 U+1F370 SHORTCAKE 的一些可能圖像:
雖然角色的形狀可能會有很大差異贤牛,但設(shè)計師應(yīng)該根據(jù)行業(yè)實踐中最常用的形狀保持相同的“核心”形狀。例如则酝,一個 U+1F36F HONEY POT 編碼一罐蜂蜜的圖形表示殉簸,而不是像“甜”這樣的語義。例如沽讹,將 U+1F36F HONEY POT 表示為方糖是出乎意料的般卑。偏離該核心形狀太遠(yuǎn)可能會導(dǎo)致互操作性問題:請參閱意外發(fā)送朋友一個毛茸茸的心臟表情符號
。方向(無論是人還是物體是朝右還是朝左爽雄,朝上還是朝下)也應(yīng)盡可能保持蝠检,因為方向的改變會改變含義:發(fā)送時
“鱷魚被警察擊中”,人們希望任何接受者都能看到手槍指向的方向與他們創(chuàng)作時的方向相同盲链。同樣蝇率,U+1F6B6行人應(yīng)面向左側(cè)
,而不是右側(cè)刽沾。請參閱第 2.10 節(jié)本慕,表情符號字形朝向。
用于人和身體部位的通用表情符號也不應(yīng)提供過于具體的圖像:一般建議是在種族侧漓、民族和性別方面盡可能保持中立锅尘。因此,對于角色 U+1F777 CONSTRUCTION WORKER布蔗,建議使用中性圖形
(橙色膚色)而不是過于具體的圖像
(淺膚色)藤违。這包括Sample Emoji Modifier Bases中列出 的emoji 修飾符基本字符。表情符號修飾符允許表達(dá)膚色的變化纵揍。
Unicode 9.0 添加了幾個旨在完成性別對的字符顿乒,并且正在努力在未來提供更多的性別選擇。有關(guān)詳細(xì)信息泽谨,請參閱第 2.3 節(jié)璧榄,性別特漩。
組合封閉標(biāo)記可以應(yīng)用于表情符號,就像它們可以應(yīng)用于其他字符一樣骨杂。完成后涂身,組合應(yīng)呈現(xiàn)表情符號。例如搓蚪,a
表示為序列“1”加上表情符號表示選擇器加上 U+20E3 組合封閉鍵帽蛤售。
U+20E3 COMBINING ENCLOSING KEYCAP 是目前 RGI 表情符號序列中唯一的此類符號。
標(biāo)志 emoji 字符在附件 B: Valid Emoji Flag Sequences中討論妒潭。
2.1名稱
每個表情符號都有一個 CLDR 短名稱悴能,它可能會隨著時間而改變。每個表情符號字符也有一個正式的 Unicode 名稱杜耙,就像所有其他 Unicode 字符一樣搜骡;這是一個無法更改的永久標(biāo)識符。
Unicode 字符的正式 Unicode 名稱并不能決定其外觀佑女。BLACK MEDIUM SQUARE 或 WHITE MEDIUM SQUARE 等符號的正式名稱并不意味著相應(yīng)的字符必須分別以黑色或白色呈現(xiàn);相反谈竿,在名稱中使用“黑色”和“白色”通常只是為了對比 填充與輪廓形狀团驱,或者較深的顏色填充與較淺的顏色填充。同樣空凸,在其他符號如U+261A BLACK LEFT POINTING INDEX 和U+261C WHITE LEFT POINTING INDEX 中嚎花,“白色”和“黑色”這兩個詞也指輪廓與填充骑脱,并不表示膚色吩抓。
但是纺非,名稱中的其他顏色詞(例如黃色)通常會提供有關(guān)表情符號表示的建議谦絮,應(yīng)遵循此建議以避免互操作性問題牡昆。
在許多情況下拇舀,自最初的正式名稱標(biāo)準(zhǔn)化以來烫扼,最佳描述的共識已經(jīng)發(fā)展彤敛,現(xiàn)在滓窍,CLDR 短名稱更好地反映了首選描述卖词。例如,U+1F483 DANCER 應(yīng)該按照 CLDR 短名woman dance 來設(shè)計(為mandance添加了一個額外的字符)吏夯。此外此蜈,只有表情符號字符具有正式的 Unicode 名稱;表情符號序列只有 CLDR 短名稱噪生。
每個字符的正式 Unicode 名稱必須是唯一的裆赵,有時在名稱中包含區(qū)分詞以在添加兩個對比字符時保持唯一性,例如:
???? U+1F436 狗臉
?? U+1F415 狗
?? U+1F42E 牛臉
?? U+1F404 牛
在這種情況下跺嗽,圖像也必須對比战授。但是页藻,在某些情況下,在不需要唯一性時陈醒,會在名稱中添加諸如 FACE 之類的附加術(shù)語惕橙。在沒有對比表情符號的情況下,不需要保持圖像對比度钉跷∶逐校考慮以下表情符號:
???? U+1F98C 鹿
?? U+1F993 斑馬臉
因為沒有其他對比鮮明的 DEER 或 ZEBRA 表情符號,所以這兩個表情中的每一個都可以只用一張臉爷辙、臉和肩膀彬坏、全身或其他選擇來描繪。
2.2顯示
表情符號字符可能并不總是顯示在白色背景上膝晾。通常最好給它們一個微弱栓始、狹窄的對比邊框,以使角色在視覺上與類似顏色的背景區(qū)分開來血当。因此幻赚,日本國旗有一個邊框,以便在白色背景上可見臊旭,而瑞士國旗有一個邊框落恼,以便在紅色背景上可見。
目前的做法是表情符號具有正方形的縱橫比离熏,源于它們在日語中的起源佳谦。為了互操作性,建議在當(dāng)前和未來的表情符號中繼續(xù)這種做法滋戳。它們通常具有與 CJK 表意文字大致相同的垂直位置和前進寬度钻蔑。例如:
他們應(yīng)該使用透明度來正確顯示選擇并使用彩色背景:
支持的表情符號序列集可能因平臺而異。例如奸鸯,采取以下 emoji zwj 序列:
在特定平臺上咪笑,它可以顯示為單個圖像:
但是,如果該組合不支持作為單個單元府喳,它可能會顯示為如下所示的序列蒲肋,并且用戶看不到任何跡象表明它應(yīng)該組合成單個圖像:
實現(xiàn)可以在可能的情況下提供不受支持的表情符號序列的組合性質(zhì)的指示。這為用戶提供了該序列旨在具有組合形式的附加信息钝满。它還解釋了為什么序列不會作為單獨的元素表現(xiàn):箭頭鍵不會在旗幟和骷髏和交叉骨之間移動兜粘,并且明顯單獨的表情符號之間不會出現(xiàn)換行符。
以下是實現(xiàn)可以使用的方法的示例弯蚜。還有其他方法可以具有更直觀的外觀孔轴,但使用當(dāng)前的文本顯示機制可能難以實現(xiàn)。
將 ZWJ 顯示為可見的“膠水”字符碎捺,寬度為零或非常窄路鹰。
2.3性別
以下人形表情符號目前被認(rèn)為具有基于名稱和/或?qū)嵺`的明確性別外觀贷洲。他們故意與其他角色形成對比。如果添加了新的顯式性別字符晋柱,或者其中一些被更改為不分性別优构,則此列表可能會在未來發(fā)生變化。下面的名稱是 CLDR 短名稱雁竞,如果不同钦椭,后面是大寫字母的正式 Unicode 名稱。
td {white-space:pre-wrap;border:1px solid #dee0e3;}女性男性
U+1F467女孩U+1F466男生
U+1F469女士U+1F468男人
U+1F475老婦
人 OLDER WOMAN
U+1F474老人
老人
U+1F46D手牽手的女人 手牽手
的兩個女人
U+1F46C手牽手的男人 手牽手
的兩個男人
U+1F936克勞斯夫人 圣誕
媽媽
U+1F385圣誕老人
父親圣誕節(jié)
U+1F478公主U+1F934王子
U+1F483跳舞
的女人
U+1F57A跳舞的男人
U+1F930懷孕的女人
U+1F931哺乳
U+1F9D5戴頭巾的女人 戴頭巾
的人
明確的性別組合
U+1F46B手牽手的女人和男人 手牽手的
男人和女人
下表Emoji Changed to Gender-Neutral in Emoji 13.0+中的表中的 emoji 已從表Emoji With Explicit Gender Appearance中刪除碑诉,大多數(shù)的 CLDR 名稱已更改為使用person(以及其他一些更改)彪腔。戴面紗的人和穿著燕尾服表情符號的人也有 RGI 男性和女性的性別變體。其他人沒有进栽;對于穿著西裝的人和戴著頭蓋骨的人德挣,表情符號大小的視覺區(qū)別會不清楚。
td {white-space:pre-wrap;border:1px solid #dee0e3;}性別中立
E13.0U+1F470帶面紗的人 帶面紗的
新娘
U+1F935
穿燕尾服的人 穿燕尾服的人
U+1F574西裝革履的人 西裝革履的
人
U+1F472戴黃蓋帽的人
MAN WITH GUA PI MAO
E13.1U+1F9D4人: 胡子
有胡子的人
2.3.1中性表情符號
通常情況下快毛,性別是未知的或不相關(guān)的格嗅,例如“飛機上有醫(yī)生嗎?”的用法唠帝,或者可能不希望出現(xiàn)性別化的外觀吗浩。這種情況被稱為“性別中立”、“性別包容”没隘、“未指定性別”或許多其他術(shù)語。除了表格Emoji With Explicit Gender Appearance中顯示的表情符號外禁荸,人形表情符號通常應(yīng)以中性方式描繪右蒲,除非 以下表中所示的方式之一使用表情符號 ZWJ 序列明確指定性別外觀。
td {white-space:pre-wrap;border:1px solid #dee0e3;}類型描述例子
簽名格式可以使用 ZWJ 序列為人形表情符號賦予明確的性別赶熟。該序列包含基本表情符號瑰妄,后跟 ZWJ 和女性符號或男性符號。單獨的人形表情符號在形式上應(yīng)該是中性的映砖。男跑者 = RUNNER + ZWJ + MALE SIGN
女跑者 = RUNNER + ZWJ + FEMALE SIGN
跑者 = RUNNER
對象格式可以使用 ZWJ 序列形成職業(yè)或角色表情符號间坐。該序列以 MAN 或 WOMAN 開始,然后是 ZWJ邑退,并以對象結(jié)束竹宋。ADULT 字符可用于中性版本。男宇航員 = MAN + ZWJ + ROCKET SHIP
女宇航員 = WOMAN + ZWJ + ROCKET SHIP
宇航員 = 成人 + ZWJ + ROCKET SHIP
盡管符號格式類型 ZWJ 序列中使用的人形表情符號本身應(yīng)該具有中性外觀(當(dāng)不用于符號格式類型 ZWJ 序列時)地技,但許多供應(yīng)商之前將這些人形表情符號描述為男人或女人. 結(jié)果蜈七,它們具有與符號格式類型 ZWJ 序列之一相同的外觀。例如莫矗,大多數(shù)供應(yīng)商將偵探描述為男性偵探飒硅,將理發(fā)的人描述 為女性理發(fā)砂缩,但一些供應(yīng)商將警察描述為男性警察,而其他供應(yīng)商將其描述為女性警察三娩。
使用對象格式類型 ZWJ 序列的職業(yè)或角色表情符號的性別中立版本通過將它們添加到RGI 表情符號標(biāo)簽序列集來發(fā)布庵芭。
2.3.2表情符號輸入中的性別標(biāo)記
表情符號輸入系統(tǒng)(如鍵盤或調(diào)色板)通常提供一些表情符號的輸入,這些表情符號的外觀明確區(qū)分性別 - 例如雀监,專門以女性或男性的形式出現(xiàn)的表情符號双吆。當(dāng)此類表情符號未包含在Emoji With Explicit Gender Appearance表中時,輸入系統(tǒng)應(yīng)為它們生成一個明確指示性別外觀的序列滔悉,而不是依賴特定系統(tǒng)的默認(rèn)外觀伊诵。下面的例子展示了這個原理:
假設(shè)在某些系統(tǒng)上,偵探的默認(rèn)外觀是mandetective回官。在該系統(tǒng)上曹宴,當(dāng)輸入man detective時,輸入系統(tǒng)仍應(yīng)使用顯式序列
U+1F575 U+FE0F U+200D U+2642 U+FE0F(男偵探)
而不僅僅是
U+1F575 U+FE0F(偵探)
2.4多樣性
世界各地的人們都希望擁有反映更多人類多樣性的表情符號歉提,尤其是膚色笛坦。用于人和身體部位的 Unicode 表情符號字符旨在具有通用性,并以通用(非人類)外觀顯示苔巨,例如類似于用于笑臉的黃色/橙色版扩。
在 Unicode 版本 8.0(2015 年中)中發(fā)布了五個符號修飾符字符,它們?yōu)槿祟惐砬榉柼峁┝艘幌盗心w色侄泽。這些字符基于 Fitzpatrick 量表的六種音調(diào)礁芦,這是公認(rèn)的皮膚病學(xué)標(biāo)準(zhǔn)(網(wǎng)上有很多這種量表的示例,例如FitzpatrickSkinType.pdf
)悼尾。確切的陰影可能因?qū)崿F(xiàn)而異柿扣。
td {white-space:pre-wrap;border:1px solid #dee0e3;}代碼CLDR 短名稱Unicode 字符名稱樣品
U+1F3FB淺膚色表情修飾符 FITZPATRICK TYPE-1-2
U+1F3FC中淺膚色表情修飾符 FITZPATRICK TYPE-3
U+1F3FD中等膚色表情修飾符 FITZPATRICK TYPE-4
U+1F3FE中深膚色表情修飾符 FITZPATRICK TYPE-5
U+1F3FF深色膚色表情修飾符 FITZPATRICK TYPE-6
這些字符的設(shè)計使得即使沒有人類表情符號的各種彩色圖像,讀者也可以看到預(yù)期的含義闺魏。
單獨使用時未状,這些修飾符字符的默認(rèn)表示是色樣。每當(dāng)這些字符之一緊跟某些字符(例如 WOMAN)時析桥,字體應(yīng)將序列顯示為與具有指定膚色的人或身體部位的圖像相對應(yīng)的單個字形司草,例如:
+?
→
但是,即使字體沒有顯示組合字符泡仗,用戶仍然可以看到預(yù)期的膚色:
這可能會退回到黑白點畫或陰影圖像埋虹,例如不支持彩色表情符號時。
+?
→
當(dāng)一個人類表情符號沒有緊跟一個表情符號修飾符字符時沮焕,它應(yīng)該使用通用的吨岭、非真實的膚色,例如
RGB #FFCC22(通常用于笑臉的顏色之一)峦树。
不需要特定的頭發(fā)顏色辣辫,但是旦事,黑色頭發(fā)通常被認(rèn)為更中性,因為黑色或深棕色頭發(fā)在各種膚色的人中都很普遍急灭。這不適用于已經(jīng)具有明確頭發(fā)顏色的表情符號姐浮,例如 PERSON WITH BLOND HAIR(最初是為了與日本手機表情符號兼容而添加的),無論膚色如何葬馋,都需要有金色頭發(fā)卖鲤。
要對 emoji 產(chǎn)生影響,emoji 修飾符必須緊跟該基本 emoji 字符畴嘶。當(dāng) emoji 字符后面跟著 emoji 修飾符時蛋逾,既不需要也不推薦使用 Emoji 表示選擇器,并且不應(yīng)在新生成的 emoji 修飾符序列中使用窗悯;表情符號修飾符自動暗示表情符號呈現(xiàn)風(fēng)格区匣。見ED-13。表情符號修飾符序列蒋院。但是亏钩,一些較舊的數(shù)據(jù)可能包括有缺陷的表情符號修飾符序列,其中表情符號表示選擇器確實出現(xiàn)在基本表情符號字符和表情符號修飾符之間欺旧;這是 emoji 修飾符必須緊跟在它修飾的字符之后的規(guī)則的唯一例外姑丑。在這種情況下,表情符號表示選擇器應(yīng)該被忽略辞友。要按順序處理文本表示選擇器栅哀,請參閱第 4 節(jié),表示樣式称龙。
<U+270C 勝利之手 FE0F TYPE-3>
任何其他中間字符都會導(dǎo)致表情符號修飾符顯示為獨立字符昌屉。因此
+?
+?
→
2.4.1 實現(xiàn)
實現(xiàn)可以將表情符號修飾符作為輸入調(diào)色板中的單獨字符呈現(xiàn),或使用長按等機制呈現(xiàn)組合字符茵瀑。
表情符號修飾符不適用于與任意表情符號字符組合。相反躬厌,它們僅限于表情符號修飾符基本字符:其他字符不得與表情符號修飾符組合马昨。隨著本文檔的后續(xù)版本,該集合可能會隨著時間而改變扛施。要查找每個版本的表情符號修飾符庫的確切列表鸿捧,請使用 Emoji_Modifier_Base 字符屬性,如附件 A:表情符號屬性和數(shù)據(jù)文件中所述疙渣。
td {white-space:pre-wrap;border:1px solid #dee0e3;}
下圖顯示了帶有表情符號修飾符的預(yù)期顯示匙奴,具體取決于前面的字符和對表情符號修飾符的支持級別⊥螅“不支持”行顯示字符通常如何出現(xiàn)在沒有包含該字符的字體的系統(tǒng)上:缺少字形指示符泼菌。在某些情況下谍肤,應(yīng)禁止在 Emoji_Modifier_Base 字符之后顯示表情符號修飾符:
如果 emoji 修飾符基礎(chǔ)在特定系統(tǒng)上沒有可見的皮膚,則應(yīng)禁止任何后續(xù) emoji 修飾符哗伯。
在其他情況下荒揣,可能會抑制在 Emoji_Modifier_Base 字符之后顯示表情符號修飾符:
如果特定 emoji 修飾符基使用與用于其他 Emoji_Modifier_Base 字符的默認(rèn)膚色不同的非真實膚色,則可能會抑制任何后續(xù) emoji 修飾符焊刹。例如系任,假設(shè)吸血鬼在特定實現(xiàn)中顯示為灰色皮膚,而其他 Emoji_Modifier_Base 字符在沒有表情符號修飾符的情況下顯示為霓虹黃色皮膚虐块;吸血鬼之后的任何表情符號修飾符都可能被抑制俩滥。
td {white-space:pre-wrap;border:1px solid #dee0e3;}支持水平表情符號修飾符基礎(chǔ)序列展示
完全支持是的+
是的+
是的,但看不到皮膚+
是贺奠,但不尋常的默認(rèn)膚色+?
不+
倒退是的+
不+
不支持是的+
不+
如上所述霜旧,在第 2.4 節(jié)的末尾,多樣性敞嗡,表情符號表示選擇器既不需要也不推薦用于表情符號修飾符序列颁糟。見ED-13。表情符號修飾符序列喉悴。但是棱貌,較舊的數(shù)據(jù)可能包含有缺陷的表情符號修飾符序列,其中確實包含表情符號表示選擇器箕肃。
2.4.2文字中的表情修飾符
支持的表情修飾符序列應(yīng)被視為單個字素簇以進行編輯(光標(biāo)時刻婚脱、刪除等);分詞勺像、換行等障贸。對于輸入,該集群的組成不需要對用戶很明顯:它在屏幕上顯示為單個圖像吟宦。例如篮洁,在手機上,長按人物可以調(diào)出不同膚色的小調(diào)色板殃姓,而用戶無需分別找到人物和修飾符袁波。以下顯示了一些可能的外觀:
td {white-space:pre-wrap;border:1px solid #dee0e3;}? 或者
當(dāng)然,除了膚色不同之外蜗侈,人的外貌還有很多其他類型的多樣性:不同的發(fā)型和顏色篷牌、眼鏡的使用、各種面部毛發(fā)踏幻、不同的體型枷颊、不同的頭飾等等。提供基于編碼的機制來表示表情符號用戶可能想要表示的人類外觀多樣性的各個方面超出了 Unicode 的范圍。傳達(dá)非常具體的人類圖像(或任何類型的圖像夭苗,其中保留特定外觀非常重要)的最佳方法是使用嵌入式圖形信卡,如長期解決方案中所述。
2.5 Emoji ZWJ 序列
U+200D ZERO WIDTH JOINER (ZWJ) 可用于字符序列的元素之間听诸,以指示應(yīng)顯示單個字形(如果可用)坐求。實現(xiàn)可以使用這種機制來處理這樣的 emoji zwj 序列作為單個字形,使用調(diào)色板或鍵盤為所示字形生成適當(dāng)?shù)男蛄猩卫妗τ谶@樣一個系統(tǒng)的用戶來說桥嗤,這些行為就像單個表情符號字符,即使它們在內(nèi)部是序列仔蝌。
當(dāng) emoji zwj 序列被發(fā)送到?jīng)]有對應(yīng)的單個字形的系統(tǒng)時泛领,ZWJ 字符將被忽略并顯示單獨的 emoji 的后備序列。因此敛惊,一個 emoji zwj 序列只應(yīng)由回退序列對接收者也有意義的實現(xiàn)來定義和支持渊鞋。
例如,以下是可能的顯示:
td {white-space:pre-wrap;border:1px solid #dee0e3;}序列展示組合字形瞧挤?
是的
不
另請參閱Emoji ZWJ 序列[emoji-charts]锡宋。
在某些實現(xiàn)中使用 ZWJ 序列可能很困難,因此在添加新序列之前應(yīng)謹(jǐn)慎特恬。
有關(guān)在 ZWJ 序列中使用變體選擇器的建議执俩,請參閱下面的第 2.7 節(jié),表情符號實現(xiàn)說明癌刽。
2.6多人分組
有幾種表情符號描繪了不止一個人的互動役首。如果這些要通過選擇或性別或膚色來實施,則可能需要根據(jù)具體情況進行特殊處理显拜。下面列出了這些表情符號:
td {white-space:pre-wrap;border:1px solid #dee0e3;}十六進制字符CLDR 名稱
U+1F91D握手
U+1F46F有兔耳朵的人
U+1F93C人們摔跤
U+1F46B手牽手的女人和男人
U+1F46C手牽手的男人
U+1F46D手牽手的婦女
U+1F48F吻
U+1F491有心的情侶
U+1F46A家庭
還有一些其他表情符號可以共享相同的性別和膚色衡奥,例如雙手合十。就性別和膚色而言远荠,這些行為就像一個人一樣矮固,因此不需要特殊處理。其他示例包括:
對于 U+1F486接受按摩的人譬淳,提供按摩的人的手應(yīng)該被描繪成沒有膚色顯示乏屯,也許戴著手套。
對于以下 emoji 及其膚色變體瘦赫,嬰兒應(yīng)被描繪為不顯示膚色,可能被毯子覆蓋蛤迎,以便將 emoji 視為一個單獨的人來調(diào)整膚色:
U+1F931母乳喂養(yǎng)
U+1F469 U+200D U+1F37C女人喂奶
U+1F468 U+200D U+1F37C男人喂奶
U+1F9D1 U+200D U+1F37C人喂奶
2.6.1多人性別
多人分組的表情符號具有未指定的性別(除非修改)确虱,但牽手的三個字符除外。握手本身并沒有提供性別差異替裆。
通過使用包含 MAN校辩、WOMAN窘问、ADULT、BOY宜咒、GIRL 和 CHILD 的 ZWJ 序列惠赫,將 Gender 應(yīng)用于 KISS、COUPLE WITH HEART 和 FAMILY故黑。數(shù)據(jù)文件列出了這些的 RGI 版本儿咱,如下所示:
td {white-space:pre-wrap;border:1px solid #dee0e3;}U+1F469 U+200D U+2764 U+FE0F U+200D U+1F48B U+200D U+1F468吻:女人,男人
使用 ZWJ 序列將性別應(yīng)用于具有兔耳朵的人和摔跤的人场晶,如下所示混埠。
td {white-space:pre-wrap;border:1px solid #dee0e3;}描述內(nèi)部代表
有兔耳朵的人
兔耳朵的男人?
兔耳朵的女人?
人們摔跤
男子摔跤?
女子摔跤?
2.6.2多人膚色
與性別一樣,膚色可以以類似的方式應(yīng)用于多人分組诗轻。由序列內(nèi)部表示的表情符號可能會在每個使用它們的字符(帶有 Emoji_Modifier_Base 的字符)之后添加 膚色修飾符(Emoji_Modifier字符)钳宪。這通過下面的表使用序列進行多人分組的膚色進行了說明。
不應(yīng)生成混合沒有膚色的人物角色和有膚色的人物角色的多人序列扳炬。也就是說吏颖,對于輸入系統(tǒng),如果多人表情符號序列中的一個人物角色具有膚色修飾符恨樟,那么該序列中的所有人物角色都應(yīng)該具有膚色修飾符半醉。
在 Emoji 12.0 中,更新了 Emoji_Modifier_Base 屬性厌杜、表情修飾符序列和RGI ZWJ 序列奉呛,添加了 25 種男女手拉手的膚色組合,以及女性手拉手夯尽、男性手拉手和人手拉手的各 15 種組合瞧壮。這些序列顯示為 70 個不同的圖像。
在 Emoji 12.1 中匙握,女性手拉手咆槽、男性手拉手和人們手拉手的 RGI ZWJ 序列進一步更新,分別增加了 10 個序列圈纺,因此它們的序列對應(yīng)于女性和男性手拉手的序列秦忿。新序列適用于不同膚色的人,但在序列后期而不是較早時膚色較深蛾娶。例如:
表情符號 12.0 序列: 1F468 1F3FD 200D 1F91D 200D 1F468 1F3FB灯谣;手拉手的男士:中等膚色,淺膚色
表情符號 12.1 新增:1F468 1F3FB 200D 1F91D 200D 1F468 1F3FD蛔琅;手牽手的男士:淺膚色胎许,中等膚色
上述序列之間的唯一區(qū)別是,中等膚色男人和淺膚色男人的推斷位置是左右互換的。
實現(xiàn)可以為兩個序列使用相同的圖像辜窑。對于多人表情符號钩述,實現(xiàn)不需要僅根據(jù)位置為相同性別的人提供不同的圖像。是否這樣做的選擇可能取決于特定于特定供應(yīng)商圖像的設(shè)計考慮穆碎。
其他不同膚色組合的多人組可以表示為有效序列牙勘,但還不是RGI;例如所禀,為家庭添加混合膚色會添加 4,225 個表情符號序列方面。
td {white-space:pre-wrap;border:1px solid #dee0e3;}描述內(nèi)部代表
手牽手的女性:
中等、深色的膚色
手牽手的人:
中等北秽、深色的膚色
家庭:女人葡幸,女人,女孩贺氓,女孩:
中等蔚叨,黑暗。淺色辙培,中等膚色
膚色修飾符可以應(yīng)用于多人分組表中列出的九個角色中的每一個蔑水;下表說明了其中一些字符的示例。這使組中的所有人都具有相同的膚色扬蕊,這類似于性別標(biāo)記的工作方式搀别。
但是,在 Emoji 14.0 中尾抑,此類 emoji 修飾符序列僅對 9 個字符中的 6 個具有 RGI 狀態(tài):親吻歇父、帶心的情侶、牽手的男女再愈、牽手的男人榜苫、牽手的女人和握手。
td {white-space:pre-wrap;border:1px solid #dee0e3;}描述內(nèi)部代表
握手:
中等膚色
兔耳朵的人:
中等膚色
兔耳女性:
中等膚色
手牽手的男女:
中等膚色
家庭:
中等膚色
2.7 Emoji 實現(xiàn)筆記
本節(jié)介紹 emoji 的重要實現(xiàn)特性翎冲,包括 emoji 和文本表示選擇器的使用垂睬、如何進行分割以及標(biāo)簽字符的處理。
2.7.1 表情符號和文本呈現(xiàn)選擇器
本節(jié)介紹可以使用表情符號表示選擇器的位置抗悍。文本呈現(xiàn)選擇器僅出現(xiàn)在文本呈現(xiàn)序列中驹饺,不會顯示為表情符號。
td {white-space:pre-wrap;border:1px solid #dee0e3;}人物變化/行為
表情符號如果結(jié)果是有效的表情符號呈現(xiàn)序列或文本呈現(xiàn)序列缴渊,則可能會添加表情符號或文本呈現(xiàn)選擇器
如果 Emoji_Presentation=No 需要表情符號演示赏壹,則應(yīng)添加表情符號演示選擇器
表情符號標(biāo)志序列不包含表情符號或文本演示選擇器
默認(rèn)情況下應(yīng)與表情符號一起顯示
表情符號修飾符序列不包含表情符號或文本演示選擇器
默認(rèn)情況下應(yīng)該與表情符號一起顯示,無論修飾符基礎(chǔ)是否有 Emoji_Presentation=Yes實現(xiàn)可以選擇支持包含 有缺陷的 emoji_modifier_sequences 的舊數(shù)據(jù)衔沼,即具有 emoji 表示選擇器蝌借。
emoji zwj 序列可能有一個表情符號表示選擇器
推薦的行為是:
用戶輸入:只有完全合格的表情符號zwj 序列才能由鍵盤和其他用戶輸入設(shè)備生成田柔。處理和顯示:完全合格的 emojizwj 序列在處理中應(yīng)適當(dāng)處理,例如顯示骨望、編輯、分割等欣舵。最低限度合格或不合格的 emoji zwj 序列可以以與其完全合格形式相同的方式處理擎鸠;選擇取決于實施。文本呈現(xiàn)選擇器會破壞 emoji zwj 序列缘圈,從而防止任一側(cè)的字符顯示為單個圖像劣光。這兩個部分序列應(yīng)顯示為單獨的圖像,每個圖像都具有由存在的任何演示選擇器指定的演示樣式糟把,或者默認(rèn)樣式用于那些沒有任何變體選擇器的表情符號绢涡。
2.7.2處理標(biāo)簽字符
標(biāo)記字符 U+E0020..U+E007F (TAG SPACE..CANCEL TAG) 的屬性已被修改,用于指示表情符號字符的變體或擴展遣疯。有關(guān)正確處理標(biāo)簽序列的詳細(xì)信息雄可,請參閱附件 C:有效的表情符號標(biāo)簽序列。
2.8頭發(fā)成分
Emoji 版本 11.0 引入了頭發(fā)組件缠犀,可以在 ZWJ 序列中使用來指示頭發(fā)顏色或樣式数苫。推薦用于通用交換 (RGI) 的序列列在數(shù)據(jù)文件中。組件包括:
紅發(fā)(姜)
卷發(fā)
白發(fā)
禿
頭發(fā)顏色和發(fā)型有數(shù)百種可能的區(qū)別辨液,但為了限制組合的數(shù)量——而且因為表情符號是用“卡通”風(fēng)格呈現(xiàn)的——頭發(fā)成分的數(shù)量很少虐急。請注意,金發(fā)男子/女人/人物表情符號已經(jīng)提供了金色的頭發(fā)顏色滔迈。棕色/黑色頭發(fā)已經(jīng)是人形表情符號中頭發(fā)顏色的典型默認(rèn)設(shè)置止吁。
2.9顏色
ZWJ 序列中可以使用九個大的彩色方形表情符號,以指示如果可能的話燎悍,應(yīng)該以該顏色顯示基本表情符號敬惦。結(jié)果圖像的顏色可能與顏色方塊不完全相同。用于此目的的顏色方塊是:
U+2B1B黑色大方
U+2B1C 白色大方
U+1F7E5 大紅色正方形 ... U+1F7EB 大棕色正方形
如果實現(xiàn)不提供該顏色的單個表情符號圖像间涵,用戶應(yīng)該看到顯示所需顏色指示的后備外觀仁热。如果支持顏色 ZWJ 序列并且基本表情符號已經(jīng)具有該顏色夏漱,則應(yīng)忽略顏色方塊颊咬。
td {white-space:pre-wrap;border:1px solid #dee0e3;}內(nèi)部代表樣品
展示
后備
外觀
黑貓
U+1F408U+200DU+2B1B
橘貓
U+1F408U+200DU+1F7E7
方格需要 ZWJ;它們的行為不像Emoji Modifiers中列出的五個膚色修飾符亦鳞。
白色方形表情符號通常呈現(xiàn)為淺灰色思劳,以將其與白色背景區(qū)分開來迅矛。
在 Emoji 版本 14.0 中,只有一個這種形式的 RGI emoji ZWJ 序列潜叛。
2.10表情符號字形朝向
根據(jù)供應(yīng)商的做法秽褒,帶有面向右側(cè)或左側(cè)的字形的表情符號可能面向任一方向壶硅。但是,在跨平臺交換文本時销斟,這種不一致可能會導(dǎo)致含義發(fā)生變化庐椒。以下 ZWJ 機制可用于明確指示方向。如果沒有面向該方向的基本表情符號圖像蚂踊,用戶應(yīng)該會看到顯示所需方向指示的后備外觀约谈。如果支持方向 ZWJ 序列并且基本表情符號已經(jīng)面向該方向,則應(yīng)忽略方向表情符號犁钟。
td {white-space:pre-wrap;border:1px solid #dee0e3;}內(nèi)部代表預(yù)期
顯示
后備
外觀
U+1F3C3U+200DU+2B05 U+FE0F
U+1F3C3U+200DU+27A1 U+FE0F
在 Emoji 版本 14.0 中沒有這種形式的 RGI emoji ZWJ 序列棱诱。
2.11 Emoji ZWJ 序列的順序
為個人表示 emoji ZWJ 序列時,應(yīng)使用以下順序:
td {white-space:pre-wrap;border:1px solid #dee0e3;}命令類別部分
1根據(jù)第 1.4.1 節(jié)表情符號字符
2表情符號修飾符或表情符號演示選擇器第 2.4 節(jié)多樣性
3頭發(fā)成分第 2.8 節(jié)頭發(fā)組件
4顏色第 2.9 節(jié)涝动,顏色
5性別標(biāo)志或?qū)ο蟮?2.3.1 節(jié)迈勋,中性表情符號
6方向指示器第 2.10 節(jié),表情符號字形朝向