相比于 c/c++芭商,golang 的一個(gè)很大的改進(jìn)就是引入了 gc 機(jī)制,不再需要用戶自己管理內(nèi)存搀缠,大大減少了程序由于內(nèi)存泄露而引入的 bug铛楣,但是同時(shí) gc 也帶來了額外的性能開銷,有時(shí)甚至?xí)驗(yàn)槭褂貌划?dāng)胡嘿,導(dǎo)致 gc 成為性能瓶頸蛉艾,所以 golang 程序設(shè)計(jì)的時(shí)候,應(yīng)特別注意對(duì)象的重用,以減少 gc 的壓力勿侯。而 slice 和 string 是 golang 的基本類型拓瞪,了解這些基本類型的內(nèi)部機(jī)制,有助于我們更好地重用這些對(duì)象
slice 和 string 內(nèi)部結(jié)構(gòu)
slice 和 string 的內(nèi)部結(jié)構(gòu)可以在 $GOROOT/src/reflect/value.go
里面找到
type StringHeader struct {
Data uintptr
Len int
}
type SliceHeader struct {
Data uintptr
Len int
Cap int
}
可以看到一個(gè) string 包含一個(gè)數(shù)據(jù)指針和一個(gè)長度助琐,長度是不可變的
slice 包含一個(gè)數(shù)據(jù)指針祭埂、一個(gè)長度和一個(gè)容量,當(dāng)容量不夠時(shí)會(huì)重新申請(qǐng)新的內(nèi)存兵钮,Data 指針將指向新的地址蛆橡,原來的地址空間將被釋放
從這些結(jié)構(gòu)就可以看出,string 和 slice 的賦值掘譬,包括當(dāng)做參數(shù)傳遞泰演,和自定義的結(jié)構(gòu)體一樣,都僅僅是 Data 指針的淺拷貝
slice 重用
append 操作
si1 := []int{1, 2, 3, 4, 5, 6, 7, 8, 9}
si2 := si1
si2 = append(si2, 0)
Convey("重新分配內(nèi)存", func() {
header1 := (*reflect.SliceHeader)(unsafe.Pointer(&si1))
header2 := (*reflect.SliceHeader)(unsafe.Pointer(&si2))
fmt.Println(header1.Data)
fmt.Println(header2.Data)
So(header1.Data, ShouldNotEqual, header2.Data)
})
si1 和 si2 開始都指向同一個(gè)數(shù)組葱轩,當(dāng)對(duì) si2 執(zhí)行 append 操作時(shí)睦焕,由于原來的 Cap 值不夠了,需要重新申請(qǐng)新的空間靴拱,因此 Data 值發(fā)生了變化垃喊,在 $GOROOT/src/reflect/value.go
這個(gè)文件里面還有關(guān)于新的 cap 值的策略,在 grow
這個(gè)函數(shù)里面袜炕,當(dāng) cap 小于 1024 的時(shí)候本谜,是成倍的增長,超過的時(shí)候偎窘,每次增長 25%乌助,而這種內(nèi)存增長不僅僅數(shù)據(jù)拷貝(從舊的地址拷貝到新的地址)需要消耗額外的性能,舊地址內(nèi)存的釋放對(duì) gc 也會(huì)造成額外的負(fù)擔(dān)评架,所以如果能夠知道數(shù)據(jù)的長度的情況下眷茁,盡量使用 make([]int, len, cap)
預(yù)分配內(nèi)存,不知道長度的情況下纵诞,可以考慮下面的內(nèi)存重用的方法
內(nèi)存重用
si1 := []int{1, 2, 3, 4, 5, 6, 7, 8, 9}
si2 := si1[:7]
Convey("不重新分配內(nèi)存", func() {
header1 := (*reflect.SliceHeader)(unsafe.Pointer(&si1))
header2 := (*reflect.SliceHeader)(unsafe.Pointer(&si2))
fmt.Println(header1.Data)
fmt.Println(header2.Data)
So(header1.Data, ShouldEqual, header2.Data)
})
Convey("往切片里面 append 一個(gè)值", func() {
si2 = append(si2, 10)
Convey("改變了原 slice 的值", func() {
header1 := (*reflect.SliceHeader)(unsafe.Pointer(&si1))
header2 := (*reflect.SliceHeader)(unsafe.Pointer(&si2))
fmt.Println(header1.Data)
fmt.Println(header2.Data)
So(header1.Data, ShouldEqual, header2.Data)
So(si1[7], ShouldEqual, 10)
})
})
si2 是 si1 的一個(gè)切片上祈,從第一段代碼可以看到切片并不重新分配內(nèi)存,si2 和 si1 的 Data 指針指向同一片地址浙芙,而第二段代碼可以看出登刺,當(dāng)我們往 si2 里面 append 一個(gè)新的值的時(shí)候,我們發(fā)現(xiàn)仍然沒有內(nèi)存分配嗡呼,而且這個(gè)操作使得 si1 的值也發(fā)生了改變纸俭,因?yàn)閮烧弑揪褪侵赶蛲黄?Data 區(qū)域,利用這個(gè)特性南窗,我們只需要讓 si1 = si1[:0]
就可以不斷地清空 si1 的內(nèi)容揍很,實(shí)現(xiàn)內(nèi)存的復(fù)用了
PS: 你可以使用 copy(si2, si1)
實(shí)現(xiàn)深拷貝
string
Convey("字符串常量", func() {
str1 := "hello world"
str2 := "hello world"
Convey("地址相同", func() {
header1 := (*reflect.StringHeader)(unsafe.Pointer(&str1))
header2 := (*reflect.StringHeader)(unsafe.Pointer(&str2))
fmt.Println(header1.Data)
fmt.Println(header2.Data)
So(header1.Data, ShouldEqual, header2.Data)
})
})
這個(gè)例子比較簡單郎楼,字符串常量使用的是同一片地址區(qū)域
Convey("相同字符串的不同子串", func() {
str1 := "hello world"[:6]
str2 := "hello world"[:5]
Convey("地址相同", func() {
header1 := (*reflect.StringHeader)(unsafe.Pointer(&str1))
header2 := (*reflect.StringHeader)(unsafe.Pointer(&str2))
fmt.Println(header1.Data, str1)
fmt.Println(header2.Data, str2)
So(str1, ShouldNotEqual, str2)
So(header1.Data, ShouldEqual, header2.Data)
})
})
相同字符串的不同子串,不會(huì)額外申請(qǐng)新的內(nèi)存窒悔,但是要注意的是這里的相同字符串呜袁,指的是 str1.Data == str2.Data && str1.Len == str2.Len
,而不是 str1 == str2
简珠,下面這個(gè)例子可以說明 str1 == str2
但是其 Data 并不相同
Convey("不同字符串的相同子串", func() {
str1 := "hello world"[:5]
str2 := "hello golang"[:5]
Convey("地址不同", func() {
header1 := (*reflect.StringHeader)(unsafe.Pointer(&str1))
header2 := (*reflect.StringHeader)(unsafe.Pointer(&str2))
fmt.Println(header1.Data, str1)
fmt.Println(header2.Data, str2)
So(str1, ShouldEqual, str2)
So(header1.Data, ShouldNotEqual, header2.Data)
})
})
實(shí)際上對(duì)于字符串阶界,你只需要記住一點(diǎn),字符串是不可變的聋庵,任何字符串的操作都不會(huì)申請(qǐng)額外的內(nèi)存(對(duì)于僅內(nèi)部數(shù)據(jù)指針而言)膘融,我曾自作聰明地設(shè)計(jì)了一個(gè) cache 去存儲(chǔ)字符串,以減少重復(fù)字符串所占用的空間祭玉,事實(shí)上氧映,除非這個(gè)字符串本身就是由 []byte
創(chuàng)建而來,否則攘宙,這個(gè)字符串本身就是另一個(gè)字符串的子串(比如通過 strings.Split
獲得的字符串)屯耸,本來就不會(huì)申請(qǐng)額外的空間,這么做簡直就是多此一舉
參考鏈接
- Go Slices: usage and internals:https://blog.golang.org/go-slices-usage-and-internals
- 測試代碼鏈接:https://github.com/hatlonely/hellogolang/blob/master/internal/buildin/reuse_test.go
原文作者:hatlonely
文章出處:http://www.hatlonely.com/2018/03/17/golang-slice-和-string-重用/