字符串長度
s := "神奇大葉子" // UTF-8
fmt.Println(len(s))
// 15
熟悉python
的朋友應(yīng)該覺得結(jié)果就是5,為什么go
里是15呢,因為一個中文字符占3個字節(jié)
我們來遍歷一下
for _, b := range []byte(s) {
fmt.Printf("%X ", b) // 16進(jìn)制
}
// E7 A5 9E E5 A5 87 E5 A4 A7 E5 8F B6 E5 AD 90
for i, ch := range s {
fmt.Printf("(%d %X)", i, ch)
}
// (0 795E)(3 5947)(6 5927)(9 53F6)(12 5B50)
可見一個中文字符確實(shí)是3個字節(jié),那我就想知道我這句話是幾個字呢,不想知道字節(jié),變量那章講過 rune
就是go
里的 char
fmt.Println("Rune count:", utf8.RuneCountInString(s))
遍歷
bytes := []byte(s)
for len(bytes) > 0 {
ch, size := utf8.DecodeRune(bytes)
bytes = bytes[size:]
fmt.Printf("%c ", ch) // 字符
}
這樣是不是略顯麻煩,通常要遍歷字符串,看下面
for i, ch := range []rune(s) {
fmt.Printf("(%d %c) ", i, ch)
}
// (0 神) (1 奇) (2 大) (3 葉) (4 子)
utf8還有很多方法,可以自行嘗試
還有 stings
包包含了很多字符串操作的方法,千萬不要傻兮兮的自己實(shí)現(xiàn)
總結(jié)
- 使用
range
遍歷pos,rune 對 - 使用
utf8.RuneCountInString
獲得字符數(shù) -
len
獲取的是字節(jié)數(shù) - 使用
[]byte
獲得字節(jié) -
strings
包包含很多字符串的操作- Fields,Split,Join
- Contains,Index
- ToLower,ToUpper
- Trim,TrimRight,TrimLeft
上述代碼均已上傳至 github, 歡迎 star
https://github.com/yejunyu/golearn