新聞中心
本文轉載自微信公眾號「碼農桃花源」,作者小X 。轉載本文請聯(lián)系碼農桃花源公眾號。

讓客戶滿意是我們工作的目標,不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領域值得信任、有價值的長期合作伙伴,公司提供的服務項目有:域名注冊、網(wǎng)頁空間、營銷軟件、網(wǎng)站建設、東營網(wǎng)站維護、網(wǎng)站推廣。
你好,我是小X。
曹大最近開 Go 課程了,小X 正在和曹大學 Go。
這個系列會講一些從課程中學到的讓人醍醐灌頂?shù)臇|西,撥云見日,帶你重新認識 Go。
熟悉 map 結構體的讀者應該知道,hmap 由很多 bmap(bucket) 構成,每個 bmap 都保存了 8 個 key/value 對:
hmap
有時落在同一個 bmap 中的 key/value 太多了,超過了 8 個,就會由溢出 bmap 來承接,即 overflow bmap(后面我們叫它 bucket)。溢出的 bucket 和原來的 bucket 形成一個“拉鏈”。
對于這些 overflow 的 bucket,在 hmap 結構體和 bmap 結構體里分別有一個 extra.overflow 和 overflow 字段指向它們。
如果我們仔細看 mapextra 結構體里對 overflow 字段的注釋,會發(fā)現(xiàn)這里有“文章”。
- type mapextra struct {
- overflow *[]*bmap
- oldoverflow *[]*bmap
- nextOverflow *bmap
- }
其中 overflow 這個字段上面有一大段注釋,我們來看看前兩行:
- // If both key and elem do not contain pointers and are inline, then we mark bucket
- // type as containing no pointers. This avoids scanning such maps.
意思是如果 map 的 key 和 value 都不包含指針的話,在 GC 期間就可以避免對它的掃描。在 map 非常大(幾百萬個 key)的場景下,能提升不少性能。
那具體是怎么實現(xiàn)“不掃描”的呢?
我們知道,bmap 這個結構體里有一個 overflow 指針,它指向溢出的 bucket。因為它是一個指針,所以 GC 的時候肯定要掃描它,也就要掃描所有的 bmap。
而當 map 的 key/value 都是非指針類型的話,掃描是可以避免的,直接標記整個 map 的顏色(三色標記法)就行了,不用去掃描每個 bmap 的 overflow 指針。
但是溢出的 bucket 總是可能存在的,這和 key/value 的類型無關。
于是就利用 hmap 里的 extra 結構體的 overflow 指針來 “hold” 這些 overflow 的 bucket,并把 bmap 結構體的 overflow 指針類型變成一個 unitptr 類型(這些是在編譯期干的)。于是整個 bmap 就完全沒有指針了,也就不會在 GC 期間被掃描。
- overflow *[]*bmap
另一方面,當 GC 在掃描 hmap 時,通過 extra.overflow 這條路徑(指針)就可以將 overflow 的 bucket 正常標記成黑色,從而不會被 GC 錯誤地回收。
當我們知道上面這些原理后,就可以利用它來對一些場景進行性能優(yōu)化:
- map[string]int -> map[[12]byte]int
因為 string 底層有指針,所以當 string 作為 map 的 key 時,GC 階段會掃描整個 map;而數(shù)組 [12]byte 是一個值類型,不會被 GC 掃描。
我們用兩種方法來驗證優(yōu)化效果。
主動觸發(fā) GC
這里的測試代碼來自文章《盡量不要在大 map 中保存指針》[1]:
- func MapWithPointer() {
- const N = 10000000
- m := make(map[string]string)
- for i := 0; i < N; i++ {
- n := strconv.Itoa(i)
- m[n] = n
- }
- now := time.Now()
- runtime.GC()
- fmt.Printf("With a map of strings, GC took: %s\n", time.Since(now))
- // 引用一下防止被 GC 回收掉
- _ = m["0"]
- }
- func MapWithoutPointer() {
- const N = 10000000
- m := make(map[int]int)
- for i := 0; i < N; i++ {
- str := strconv.Itoa(i)
- // hash string to int
- n, _ := strconv.Atoi(str)
- m[n] = n
- }
- now := time.Now()
- runtime.GC()
- fmt.Printf("With a map of int, GC took: %s\n", time.Since(now))
- _ = m[0]
- }
- func TestMapWithPointer(t *testing.T) {
- MapWithPointer()
- }
- func TestMapWithoutPointer(t *testing.T) {
- MapWithoutPointer()
- }
直接用了 2 個不同類型的 map:前者 key 和 value 都是 string 類型,后者 key 和 value 都是 int 類型。整個 map 大小為 1kw。
測試結果:
- === RUN TestMapWithPointer
- With a map of strings, GC took: 150.078ms
- --- PASS: TestMapWithPointer (4.22s)
- === RUN TestMapWithoutPointer
- With a map of int, GC took: 4.9581ms
- --- PASS: TestMapWithoutPointer (2.33s)
- PASS
于是驗證了 string 相對于 int 這種值類型對 GC 的消耗更大。正如這篇文章的標題所說:
Go語言使用 map 時盡量不要在 big map 中保存指針。
用 pprof 看對象數(shù)
第二種方式就是直接開個 pprof 來看 heap profile。這次我們將 string 類型的 key 優(yōu)化成數(shù)組類型:
- package main
- import (
- "fmt"
- "io"
- "net/http"
- _ "net/http/pprof"
- )
- // var m = map[[12]byte]int{}
- var m = map[string]int{}
- func init() {
- for i := 0; i < 1000000; i++ {
- // var arr [12]byte
- // copy(arr[:], fmt.Sprint(i))
- // m[arr] = i
- m[fmt.Sprint(i)] = i
- }
- }
- func sayHello(wr http.ResponseWriter, r *http.Request) {
- io.WriteString(wr ,"hello")
- }
- func main() {
- http.HandleFunc("/", sayHello)
- err := http.ListenAndServe(":8000", nil)
- if err != nil {
- fmt.Println(err)
- }
- }
注意,去掉代碼里的注釋即可將 key 從 string 優(yōu)化成數(shù)組類型。
直接在 init 里構建 map,然后開 pprof 看 profile:
key 為 string
key 為數(shù)組
對象數(shù)從 33w 下降到 1.5w,效果非常明顯。
map 的 key 和 value 要不要在 GC 里掃描,和類型是有關的。數(shù)組類型是個值類型,string 底層也是指針。
不過要注意,key/value 大于 128B 的時候,會退化成指針類型。
那么問題來了,什么是指針類型呢?**所有顯式 *T 以及內部有 pointer 的對像都是指針類型。
——來自董神的 map 優(yōu)化文章
關于超過 128 字節(jié)的情況,源碼里也有說明:
- // Maximum key or elem size to keep inline (instead of mallocing per element).
- maxKeySize = 128
- maxElemSize = 128
總結
當 map 的 key/value 是非指針類型時,GC 不會對所有的 bucket 進行掃描。如果線上服務使用了一個超大的 map ,會因此提升性能。
為了不讓 overflow 的 bucket 被 GC 錯誤地回收掉,在 hmap 里用 extra.overflow 指針指向它,從而在三色標記里將其標記為黑色。
如果你用了 key 是 string 類型的 map,并且恰好這些 string 是定長的,那么就可以用 key 為數(shù)組類型的 map 來優(yōu)化它。
通過主動調用 GC 以及開 pprof 都可觀察優(yōu)化效果。
好了,這就是今天全部的內容了~ 我是小X,我們下期再見~
歡迎關注曹大的 TechPaper 以及碼農桃花源~
參考資料
[1]《盡量不要在大 map 中保存指針》: https://www.jianshu.com/p/5903323a7110
網(wǎng)站名稱:曹大帶我學Go之從Map的Extra字段談起
文章位置:http://fisionsoft.com.cn/article/cosjdpp.html


咨詢
建站咨詢
