JS函數(shù)charCodeAt的Lua實(shí)現(xiàn)

JS函數(shù)charCodeAt的Lua實(shí)現(xiàn)

charCodeAt by Lua

@(Lua JavaScript charCodeAt)

I wanted to have a function charCodeAt in Lua ,and it should works exactly like javascript
but with Lua5.1 ,UTF8 and Unicode are not supported,

1: how charCodeAt works in javascript

to show Console press F12 in Chrome( MAC:CMD+alt+J)

[
'你'.charCodeAt(0),
'?'.charCodeAt(0),
'n'.charCodeAt(0)
]

it will output [20320, 241, 110] 胳挎,it means the numeric value of Unicode , '你'=20320 , '?'=241, 'n'=110.

The charCodeAt() method returns the numeric Unicode value of the character at the given index (except for unicode codepoints > 0x10000).

according to alexander-yakushev we can know how many bytes one UTF8 word takes using function utf8.charbytes
[https://github.com/alexander-yakushev/awesompd/blob/master/utf8.lua]

function utf8.charbytes (s, i)
   -- argument defaults
   i = i or 1
   local c = string.byte(s, i) 
   -- determine bytes needed for character, based on RFC 3629
   if c > 0 and c <= 127 then
      -- UTF8-1 byte
      return 1
   elseif c >= 194 and c <= 223 then
      -- UTF8-2 byte
      return 2
   elseif c >= 224 and c <= 239 then
      -- UTF8-3 byte
      return 3
   elseif c >= 240 and c <= 244 then
      -- UTF8-4 byte
      return 4
   end
end

Unicode & UTF8 convert method

Unicode code range UTF-8 code example
hex code binary code char
0000 0000-0000 007F 0xxxxxxx n(alphabet)
0000 0000-0000 007F 110xxxxx 10xxxxxx ?
0000 0080-0000 07FF 1110xxxx 10xxxxxx 10xxxxxx (most CJK)
0001 0000-0010 FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx other chars

but we should pay attention to 4 bytes UTF8[emoji], it works not that simple

special Method

javascript engine using UTF16伐蒋,characters in Basic Multilingual Plane were the same with unicode, but if the characters were in Supplementary Plane it should use the formula below,usually we encounter Supplementary Plane emoji like?? (4 byte UTF8 character)

-- formula 1
H = Math.floor((c-0x10000) / 0x400)+0xD800 
L = (c - 0x10000) % 0x400 + 0xDC00

code is here

https://github.com/lilien1010/lua-bit

Feedback & Bug Report


Thank you for reading this , if you got any better idea, share it.

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市窍荧,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,204評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件僧叉,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡棺榔,警方通過(guò)查閱死者的電腦和手機(jī)瓶堕,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)症歇,“玉大人郎笆,你說(shuō)我怎么就攤上這事谭梗。” “怎么了宛蚓?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,548評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵激捏,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我凄吏,道長(zhǎng)缩幸,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,657評(píng)論 1 293
  • 正文 為了忘掉前任竞思,我火速辦了婚禮,結(jié)果婚禮上钞护,老公的妹妹穿的比我還像新娘盖喷。我一直安慰自己,他們只是感情好难咕,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布课梳。 她就那樣靜靜地躺著,像睡著了一般余佃。 火紅的嫁衣襯著肌膚如雪暮刃。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,554評(píng)論 1 305
  • 那天爆土,我揣著相機(jī)與錄音椭懊,去河邊找鬼。 笑死步势,一個(gè)胖子當(dāng)著我的面吹牛氧猬,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播坏瘩,決...
    沈念sama閱讀 40,302評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼盅抚,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了倔矾?” 一聲冷哼從身側(cè)響起妄均,我...
    開(kāi)封第一講書(shū)人閱讀 39,216評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎哪自,沒(méi)想到半個(gè)月后丰包,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,661評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡提陶,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評(píng)論 3 336
  • 正文 我和宋清朗相戀三年烫沙,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片隙笆。...
    茶點(diǎn)故事閱讀 39,977評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡锌蓄,死狀恐怖升筏,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情瘸爽,我是刑警寧澤您访,帶...
    沈念sama閱讀 35,697評(píng)論 5 347
  • 正文 年R本政府宣布,位于F島的核電站剪决,受9級(jí)特大地震影響灵汪,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜柑潦,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評(píng)論 3 330
  • 文/蒙蒙 一享言、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧渗鬼,春花似錦览露、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,898評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至堰乔,卻和暖如春偏化,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背镐侯。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,019評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工侦讨, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人析孽。 一個(gè)月前我還...
    沈念sama閱讀 48,138評(píng)論 3 370
  • 正文 我出身青樓搭伤,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親袜瞬。 傳聞我的和親對(duì)象是個(gè)殘疾皇子怜俐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 思不見(jiàn), 幽深碧海接天流邓尤,疏離月下掛龍鉤拍鲤。 危林猛生天地增,金陽(yáng)驟起萬(wàn)獸游汞扎。 龐魚(yú)騰浪吞鯤鵬季稳,惡虎攔空撕飛虬。 天...
    弄情閱讀 633評(píng)論 66 97
  • 昨日做下的事: 去婁底見(jiàn)一個(gè)朋友澈魄,聊了很久景鼠。 看專欄文章,寫(xiě)讀后感。 寫(xiě)日記總結(jié)铛漓,練雙截棍溯香。 做做熟人市場(chǎng)的寬帶預(yù)...
    文建偉CZYH閱讀 380評(píng)論 0 0
  • 1. /proc/kallsyms列出了linux內(nèi)核導(dǎo)出的所有符號(hào)及對(duì)應(yīng)的地址。 基本格式是: 邏輯地址 標(biāo)識(shí) ...
    WebSSO閱讀 421評(píng)論 0 0