Go
go 数组、slice、map原理、内存对齐
[TOC]
以下基于go.1.14
函数内联优化
函数内联优化:在A函数中调用了B函数,内联后,B函数的代码直接在A函数内原地展开,代替这个函数实现,当有多次调用时,就会多次展开
go在编译时会自动判断函数是否可以内联,当函数内包含以下内容时不会被内联:闭包调用,select,for,defer,go关键字创建的协程等。
内联的好处:因为函数调用被内联了,可以减少栈帧的创建,减少读写寄存器的读取,减少参数和函数的拷贝,提升性能
缺点:堆栈panic显示的行数可能不准确、增加编译出来的包的大小
编译时使用go build -gcflags="-m -m" main.go
可以知道编译器的内联优化策略,
go编译时默认会使用内联优化,使用go build --gcflags="-l" main.go
可禁掉全局内联,如果传递两个或以上-l,则会打开内联;
defer
多个defer是栈的关系,以链表的形式挂在G上,先进后出,即在一个函数中,写在前面的defer会比写在后面的defer调用得晚,先进后出的原因是后面定义的函数可能会依赖前面的资源,如果前面的先执行导致依赖没了,会影响后面的执行,导致出错;
defer和return同时出现时,先return后defer,defer可以修改到return里的变量;
return 是非原子性的,需要两步,执行前首先要为返回值赋值,然后 return 将返回值返回调用处。
defer 和 return 的执行顺序是:1. 先为返回值赋值;2. 然后执行 defer;3. 然后 return 到函数调用处
要注意defer + 函数 的场景,如果是函数调用,并且使用的变量是传参进去的,那得看入参类型;如果是闭包调用,引用了外边的变量(不管是不是指针),那就是引用
当返回值没有声明变量时,会内置一个隐式的变量来接收return的赋值
panic被触发时,控制权就交给了defer
遇到panic时,会先遍历此协程内的defer链表,并执行defer,如果在执行过程中遇到recover,则停止panic,返回recover处继续往下执行,如果没遇到recover,则遍历完本协程的defer链表后,向stderr抛出panic信息;
执行defer过程中出现panic,此时的panic会覆盖它之前的panic,直至被捕获或抛出;
内存对齐
CPU读取数据时不会一个字节一个字节去读取,而是一块一块,块的大小可以是2、4、6、8、16字节,块大小称为内存访问粒度。32位CPU一次读取4个字节,64位CPU一次读取8个字节。
如果未进行内存对齐,会导致CPU进行两次内存访问,并且需要花费额外的时钟周期来处理对齐及运算,如果对齐了内存,一次读取就能访问完成,内存对齐可能会耗费额外的空间,但是可以加快读取效率,标准的空间换时间做法。
以32位CPU对齐为例:
对齐规则:
结构体的成员变量,第一个成员变量的偏移量为 0。往后的每个成员变量的对齐值必须为编译器默认对齐长度(
#pragma pack(n)
)或当前成员变量类型的长度(unsafe.Sizeof
),取最小值作为当前类型的对齐值。其偏移量必须为对齐值的整数倍结构体本身,对齐值必须为编译器默认对齐长度(
#pragma pack(n)
)或结构体的所有成员变量类型中的最大长度,取最大数的最小整数倍作为对齐值结合以上两点,可得知若编译器默认对齐长度(
#pragma pack(n)
)超过结构体内成员变量的类型最大长度时,默认对齐长度是没有任何意义的
对齐过程:
a
bool
0
1
字节对齐
无
1
3
b
int32
4
4
c
int8
8
1
字节对齐
无
9
7
d
int64
16
8
e
byte
24
1
字节对齐
无
25
7
总占用大小
-
-
32
内存布局:axxx|bbbb|cxxx|xxxx|dddd|dddd|e,之后要保证整个结构体进行字节对齐,发现它不是2^n,可得出最近一个数是32。
对结构体内字段顺序进行调整后,可以发现算出来的大小会不一样
e
byte
0
1
c
int8
1
1
a
bool
2
1
字节对齐
无
3
1
b
int32
4
4
d
int64
8
8
总占用大小
-
-
16
内存布局:ecax|bbbb|dddd|dddd
数组
声明时必须指定固定长度,因为编译时需要知道数组长度以便分配内存,如
var arr1 [5]int
,或者var arr2 = [5]int{1,2,3}, 其余数字为0
数组长度最大是2Gb
当数组类型是整形时,所有元素都会被自动初始化为0,即声明完数组,数组会被设置类型的默认值
可以使用new()来创建,如
var arr3 = new([3]int)
,arr3的类型是*[3]int
,arr1、arr2的类型是[5]int
函数的参数可以是[5]int, 表明入参是数组,如果是[]int,表明入参是slice。类型[3]int和[5]int是两种不同的类型。
数组是值类型,赋值和传参会进行拷贝,函数内部的修改不会影响原始数组。
如果数组中的元素个数小于或等于4个,所有变量会直接在栈上初始化;当数组元素大于4个,变量就会在静态存储区初始化然后拷贝到栈上。
切片Slice
数据结构
slice本质是一个结构体,所以它是值类型是不难理解的,它仅仅只是对数组的一种包装,且该结构体不包含任何函数,任何对slice的处理都是go的内置函数来处理的。
基本
创建时无需指定长度,如
slice1 := []int{1,2,3}, 此时长度和容量均为3
从数组上截取
arr1 := [5]int; var slice2 []int = arr1[1:3], 此时长度2,容量5,且对slice2的修改会影响arr1
。可以使用make([]type, len, cap)来创建,len必填,cap非必填,如果cap不填,初始cap=len。如
slice4 := make(int[], 5, 10),长度5,容量10
。可以使用new来创建,比如
new([100]int)[0:50]
效果等同于make([]int, 50, 100)
,或者slice := *new([]int) 为空切片
空切片:
slice := make([]int, 0) 或 slice := []int{}
,nil切片:var slice *[]int 或 slice := *new([]int)
;两者的区别在于,空切片会指向一个内存地址,但它没有分配任何的内存空间;nil切片是直接指向nil。打印时,两者的结果均为
[], len=0, cap=0
,但nil切片与nil比较的结果为true,空切片与nil的比较结果为false。切片是对数组的一个连续片段的引用,对于切片底层数组是引用类型,作为函数参数时,虽然是传切片的值,但是底层数组传递指针,函数内部的修改会影响原始数组
一个数组可以创建多个slice,一个slice也可以创建多个slice,但是新老slice会共用底层数组,新老slice的修改都会互相影响。但是如果新slice经过append,使得slice底层数组扩容了,此时slice引用了新的数组,此时新老slice就不会互相影响了。
语法:
ns = slice1[起始下标:结束下标(不包括):cap容量]
使用new()和make()的区别
看起来二者没有什么区别,都在堆上分配内存,但是它们的行为不同,适用于不同的类型。
new (T) 为每个新的类型 T 分配一片内存,初始化为 0 并且返回类型为 *T 的内存地址:这种函数 返回一个指向类型为 T,值为 0 的地址的指针,它适用于值类型,如数组和结构体;它相当于 &T{}。 make(T) 返回一个类型为 T 的初始值,它只适用于 3 种内建的引用类型:切片、map 和 channel。
range遍历的注意点:将slice的每个元素赋值给v时,发生了一次拷贝,无法通过修改v来修改slice。如果是slice是指针结构体类型,还是能修改的。也就是说如果slice是指针类型,通过range遍历append时要注意
扩容
原理
当使用append()函数向slice追加元素,会根据slice的容量判断是否需要扩容。另外,因为slice是值传递,append()函数不会修改传入的slice,返回是重新对底层数组、长度、容量做包装,返回新slice。
如果slice容量够用,则直接把新元素追加进去,长度 + 1,返回原slice
原slice容量不够,将slice扩容,得到新的slice
将新元素追加到新slice,长度 + 1,返回新slice
另外,copy函数拷贝两个slice时,会将源slice拷贝到目标slice,如果目标slice的长度<源slice,不会发生扩容。
Demo:
扩容策略
扩容实际上包括两部分:计算容量的规则 和 内存对齐
如果期望容量大于当前容量的两倍就会使用期望容量,期望容量指的是把元素加进去后的容量,一般发生在append 多个的时候,如 append(arr, 1, 2, 3, 4)。
如果当前切片的长度小于 1024,扩容两倍。
如果当前切片的长度大于 1024 就会每次增加 25% 的容量,即扩容1.25倍,直到新容量大于期望容量。
此时只是确定切片的大致容量,之后会判断切片中元素所占字节大小,如果字节大小是1、2、8的倍数时,会进行内存对齐,这个操作之后,扩容后的容量可能会 > 原容量的两倍 或 1.25倍。
内存对齐主要是为了提高内存分配效率,减少内存碎片。
PS:go 18以前还是用 1024 来判断要扩容的大小,18之后使用256,长度小于256,扩容两倍;长度大于256时,规则为 原长度 += (原长度 + 3*256) / 4
Map
数据结构
注:一个bmap里key和value是各自存的,而key/value一对对存储,这样的好处是省掉padding字段,节省内存空间,方便内存对齐。
例如,有这样一个类型的 map:
map[int64]int8
,如果按照key/value...
这样的模式存储,那在每一个 key/value 对之后都要额外 padding 7 个字节;而将所有的 key,value 分别绑定到一起,这种形式key/key/.../value/value/...
,则只需要在最后添加 padding,每个 bucket 设计成最多只能放 8 个 key-value 对,如果有第 9 个 key-value 落入当前的 bucket,那就需要再构建一个 bucket ,通过overflow
指针连接起来。
基本
创建:
m := map[string]int{"1": 11, "2": 22}
或者m := make(map[string]int, 10)
当使用字面量的方式创建哈希表时,如果{}中元素少于或等于25时,编译器会转成make的方式创建,再进行赋值;如果超过了25个,编译时会转成make的方式创建,同时为key和value分别创建两个数组,最后进行循环赋值
直接声明
var m map[string]int
会创建了一个nil的map,此时不能被赋值,但可以取值,虽然不会panic,但会得到零值key不允许为slice、map、func;允许bool、numeric、string、指针、channel、interface、struct及其类型对应的数组;
即key必须支持 == 或 != 运算的类型,如果是结构体,则他们的所有字段都相等,才被认为是相同的key;
另外,float比较特殊,因为float作为key时,会被转成unit64,再插入key中,可能会有精度问题,导致有时候查询不到,或者查询出来的key不一样;
有个特殊的key值
math.NaN
,它每次生成的哈希值是不一样的,这会造成m[math.NaN
]是拿不到值的,而且多次对它赋值,会让map中存在多个math.NaN
的key。map容量最多为 6.5 * 2^B 个元素,6.5是装载因子阈值常量,装载因子 = 哈希表中的元素 / 哈希表总长度,装载因子越大,冲突越多。B最大值是63。
拉链法解决哈希冲突(指8个正常位和溢出桶),除留余数法得到桶的位置。
key的哈希值的低B位计算获得桶的位置,高8位计算得到tophash的位置,进而找到key的位置。
溢出桶也是一个bmap,bmap的overflow会指向下一个溢出桶,所以溢出桶的结构是链表,但是它们跟正常桶是在一片连续内存上,都在buckets数组里,前2^B个当成正常桶,后2^(B-4)个当作溢出桶。
每个桶存了8个tophash + 8对键值对。
扩容判断发生在插入,扩容迁移发生在插入和删除。
map是非线程安全的,扩容不是一个原子操作,通过hmap里的flags字段在并发读写时进行fast-fail。
当 map 对象同时进行加锁的 write 和不加锁的read(比如打印,序列化等)时,会发生panic,因为相当于并发读写。
当map出现并发读写时,不是抛出panic错误,而是fatal错误,fatal错误不可被recover,程序会直接退出;原因是当存在并发读写时,如果被recover了,会导致其他协程出现读取错误的情况。
但在同一个协程里,边遍历边增删,并不会触发并发检测,但是可能会导致漏遍历;
map的遍历是无序的,每次遍历出来的结果的顺序都不一样。
无法直接对map的value直接取地址:
&m["key"]
会无法通过编译,虽然可以使用unsafe.Pointer
取地址,但是因为map会扩容,拿到的地址也不一定是之后的地址。
创建初始化
通过make(map[type]type)
,或者make(map[type]type, hint), hint <= 8
创建的map,底层会调用makemap_small函数
,并直接从堆上进行分配,此时只分配内存空间,不初始化桶,懒加载,只有在第一次插入时才会初始化桶,此时B=0,桶的数量为1。
当hint > 8时,则会在运行时调用makemap函数
进行创建和初始化,
计算哈希表占用的内存是否溢出或者超出能分配的最大值
调用fastrand()获取随机哈希种子
根据hint来计算需要的桶的数量来计算B的值(hint是make的第二个参数),用于初始化桶的数量 = 2^B;
调用
makeBucketArray()
分配连续的空间,创建用于保存桶的数组当桶的数量小于2^4时,由于数据较少,哈希冲突的可能性较小,此时不会创建溢出桶。
当桶的数量大于2^4时,就会额外创建2^(B-4)个溢出桶,溢出桶与普通桶在内存空间上是连续的,使用extra的nextOveflow来做溢出桶,预分配。
查找与插入
v := m[key]
使用函数mapaccess1()
进行查找, v, ok := m[key]
使用函数mapaccess2()
进行查找
mapaccess2()
也会调用mapaccess1()
,只是返回的时候会返回多一个用于表示当前键值对是否存在的布尔值。
key的定位
找buckets数组中的bucket的位置:key经过哈希计算得到哈希值,取出hmap的B值,取哈希值的后B位个bit位,计算后面的B位的值得到桶的位置(实际上这一步就是除留余数法的取余操作)。
比如:一个key经过哈希计算之后,得到的结果是:
10010111 | 000011110110110010001111001010100010010110010101010 │ 00110
长度为64位,B等于5,取后5位,即拿到00110,值为6,也就是6号桶,buckets[6]
确定使用buckets数组还是oldbuckets数组:判断oldbuckets数组中是否为空,不为空说明正处于扩容中,还没完成迁移,则重新计算桶的位置,并在oldbuckets数组找到对应的桶;如果为空,则在buckets数组中找到对应的桶。
在桶中找tophash的位置:用key哈希计算得到的哈希值,取高8个bit位 + minTopshash(小于minTopshash值时才需要加),计算得到此bucket桶中的tophash,即key在桶中的编号,之后在桶中的正常位遍历比较。
每个桶是一整片连续的内存空间,先遍历bucket桶中的正常位,与桶中的tophash进行比较,当找到对应的tophash时,根据tophash进行计算得到key,根据key的大小计算得到value的地址,找到value。
如果bucket桶中的正常位没找到tophash,且overflow不为空,则继续遍历溢出桶overflow bucket,直到找到对应的tophash,再根据key的大小计算得到value的地址,找到value。
插入
插入也需要先定位到key的位置后才能进行插入,定位key的操作跟上面是类似的,调用mapassign函数,mapassign入参不用传value,而是通过方法返回key对应的value的指针来进行赋值。
先判断hmap是否为空,是否是并发写入,如果是直接抛错误;修改当前hamp的状态。
根据key计算出哈希;还有就是判断bucket桶是否为空,为空则分配bmap数组,。
判断 hmap的oldbuckets是否为空,不为空说明当前处于扩容搬迁,则进行搬迁工作(一次最多迁移两个bucket桶),完了再进行之后的流程。
根据key的哈希值的低B个bit位,计算得到桶的位置;根据key的哈希值的高8个bit位,计算出tophash。
先遍历正常位,从第一个cell开始,比较桶上的每个tophash是否等于计算得到的tophash,如果不等,再判断该tophash是否为空,如果为空,计算key和value的内存地址,进行插入。如果不为空,则遍历下一个cell进行tophash的判断。
下一个cell上的tophash与计算的tophash相等,说明发生了哈希冲突,先计算key的地址,找到key,判断key是否相等,如果相等,计算key对应的value地址,将value的值进行更新。
如果key不相等,遍历下一个cell的tophash,直到正常位遍历完成,如果此时还不能插入,继续遍历溢出桶,如果溢出桶为空,退出循环。
在已有桶和溢出桶都未找到合适的cell插入时,会有两种情况进行判断:
判断当前map的装载因子是否达到默认的6.5,或者当前map的溢出桶数量是否过多,如果是这两种情况之一,则进行扩容,扩容 + 迁移后,继续步骤5上的逻辑(使用了goto关键字)。如果不满足扩容条件,则进行下一种情况的判断
此时key还没插入,且正常位已满,还不需要扩容,此时会调用
newoverflow()函数
。newoverflow()函数
使用hmap在extra.nextOverflow
中创建好的桶,如果有,遍历这个创建好的桶链表,直到可以放入新的键值对;如果没有,则创建一个桶,增加noverflow计数,将新键值对放入这个桶中,然后将新桶挂载到当前桶overflow字段,成为溢出桶。newoverflow()函数
会在一开始判断hmap的extra.nextOverflow
是否为空,如果为空会先预分配,不为空则直接将其设置为当前要使用的溢出桶,并把原来的nextOverflow设置为空,目的是充分利用已分配的内存,减少分配次数。
扩容
扩容条件
!h.growing() && (overLoadFactor(h.count+1, h.B) || tooManyOverflowBuckets(h.noverflow, h.B))
即 在没有正在进行扩容 的情况下,负载因子 > 6.5 或 溢出桶的数量 >= buckets数组的数量
扩容条件的判断发生在mapassign函数
,即对map使用put的时候。
扩容策略
增量扩容 - 降低哈希冲突
overLoadFactor函数
,该函数返回true,表示哈希表内的元素过多,哈希冲突的概率变大,可能在找到桶,遍历完桶内的元素,还要继续遍历溢出桶链表,此时需要**增量扩容,扩容为原来的两倍 **,降低哈希冲突的概率。
等量扩容 - 提高桶的利用率,防止内存泄漏,加快查询效率
tooManyOverflowBuckets函数
,该函数返回true,表示由于某一个桶满后,开始使用溢出桶,不断的插入数据到溢出桶,又不断的删除正常桶上的正常位,但此时哈希表的数量又没超阈值,但是空桶太多,溢出桶的数量太多,而每次查找又得先遍历正常位,查找效率变低,此时需要等量扩容,容量不变,重新迁移键值对。
触发扩容
触发扩容条件时,会执行hashGrow函数
,进行新桶的分配,但还未迁移数据,真正迁移数据在growWork函数
中。
首先会判断是增量扩容还是等量扩容,如果是增量扩容,B + 1,即扩容到原来的两倍,如果是等量扩容,B + 0,容量不变
将当前buckets数组挂在hmap的oldbuckets字段,当前extra里的溢出桶挂在
hmap.extra.oldoverflow
创建新的buckets数组,容量为新的B值,预创建溢出桶(溢出桶的数量看上面创建初始化逻辑),然后将新的buckets数组挂在buckets字段,新的溢出桶挂在
hmap.mapextra.nextOverflow
字段上
触发扩容条件,对新桶进行内存分配,只是创建了新的桶,旧数据还在旧桶上,之后还需要完成数据迁移。
扩容迁移
扩容迁移发生在 mapassign 和 mapdelete 函数中,即进行插入、修改、删除时,才会调用growWork函数
和evacuate函数
,完成真正的迁移工作后,才会进行插入、修改或删除。
迁移时是渐进式迁移,一次最多迁移两个bucket桶。
在插入、修改或删除中,如果发现oldbuckets数组不为空,表示此时正在扩容中,需要进行扩容迁移,调用
growWork函数
,growWork函数
调用一次evacuate函数
,如果调用完成后,hmap的oldbuckets还是非空,则再调用一次evacuate函数
,加快迁移进程。
进入
evacuate函数
:
如果是等量扩容,B值不变,老bucket桶上的键值计算出来的桶的序号不变,tophash不变,此时会将老桶上的键值对依次地一个个转移到新桶上,使这些键值对在新桶上排列更加紧凑;
如果是增量扩容,容量变为原来的两倍,B值+1,老bucket桶上的键值计算出来的桶的序号改变,这些键值对计算后的bucket桶的序号可能跟之前一样,也可能是相比原来加上2^B,取决于key哈希值后 老B+1 位的值是0还是1。比如:
10010111 | 000011110110110010001111001010100010010110010101010 │ 01010
,B=5,bucket的序号是10,增量扩容后为10010111 | 00001111011011001000111100101010001001011001010101 | 001010
,B=6,bucket的序号还是10,另一种情况是
10010111 | 000011110110110010001111001010100010010110010101011 │ 01010
,B=5,bucket的序号是10,增量扩容后为10010111 | 00001111011011001000111100101010001001011001010101 │ 101010
,B=6,bucket的序号是42(10 + 32,即10 + 2 ^5)tophash不变,原来老bucket桶上的键值对会重新分流到两个新bucket桶上。将老bucket桶上的键值对和其指向的溢出桶上的键值对进行迁移,依次转移到新桶上,每迁移完一个,key在老buckect的tophash设置为evacuatedX或者evacuatedY(tophash的最低位表示迁移到新桶的哪一part,0为x,1为y),hmap的nevacuate计数+1,直到老bucket桶上的键值对迁移完成,最后清空oldbuckets和oldoverflow字段。
这里两个新的桶对应源码里的X part, Y part,因为扩容到原来的 2 倍,桶的数量是原来的 2 倍,前一半桶被称为 X part,后一半桶被称为 Y part。一个 bucket 中的所有key 可能会分流到 2 个桶中,一个位于 X part,一个位于 Y part。所以在搬迁一个 cell 之前,需要计算这个cell要落入到哪一part。
X part 与 Y part的关系:X part + 2 ^ 老B = Y part,之所以要确定key落在哪个区间,是为了方便计算key要插入的内存地址。
扩容前,B = 2,共有 4 个 buckets,lowbits 表示 hash 值的低位。假设我们不关注其他 buckets 情况,专注在 2 号 bucket。并且假设 overflow 太多,触发了等量扩容。
扩容完成后,overflow bucket 消失了,key 都集中到了一个 bucket,更为紧凑了,提高了查找的效率。
假设触发了 2 倍的扩容,那么扩容完成后,老 buckets 中的 key 分裂到了 2 个 新的 bucket。一个在 x part,一个在 y 的 part。依据是 hash 的 lowbits。新 map 中
0-3
称为 x part,4-7
称为 y part。
删除
调用delete函数,无论要删除的key是否存在,delete都不会返回任何结果。删除实际上也是一个key的定位 + 删除的操作,定位到key后,将其键值对置空,hmap的count - 1,tophash置为empty。删除过程也会检查是否处于扩容状态,如果是,则会触发搬迁。
遍历
对go中的map是无序的,每次遍历出来的顺序都是不一样的,go在每次遍历map时,并不是固定地从0号bucket桶开始遍历,每次都是从一个随机值序号的bucket桶开始遍历,并且是从这个bucket桶的一个随机序号的 正常位开始遍历。
首先从buckets数组中,随机确定一个索引,作为startBucket,然后确定offset偏移量,得到桶中的正常位的位置,作为起始key的地址。
遍历当前bucket及bucket.overflow,判断当前bucket是否正在扩容中,如果是则跳转到3,否则跳转到4。
如果是在扩容中,遍历时会先到当前bucket扩容前的老的bucket桶中遍历那些能迁移到当前桶的key。
假如原先的buckets为0,1,那么扩容后的新的buckets为0,1,2,3,此时我们遍历到了buckets[0], 发现这个bucket正在扩容,那么找到bucket[0]所对应的oldbuckets[0],遍历里面的key,这时候仅仅遍历那些key经过hash后,可以散列到bucket[0]里面的部分key;同理,当遍历到bucket[2]的时候,发现bucket正在扩容,找到oldbuckets[0],然后遍历里面可以散列到bucket[2]的那些key。
遍历当前这个bucket即可。
继续遍历bucket下面的overflow链表。
如果遍历到了startBucket,说明遍历完了,结束遍历。
假设我们有下图所示的一个 map,起始时 B = 1,有两个 bucket,后来触发了扩容(这里不要深究扩容条件,只是一个设定),B 变成 2。并且, 1 号 bucket 中的内容搬迁到了新的 bucket,
1 号
裂变成1 号
和3 号
;0 号
bucket 暂未搬迁。老的 bucket 挂在在*oldbuckets
指针上面,新的 bucket 则挂在*buckets
指针上面。这时,我们对此 map 进行遍历。假设经过初始化后,startBucket = 3,offset = 2。于是,遍历的起点将是 3 号 bucket 的 2 号 cell,下面这张图就是开始遍历时的状态:
标红的表示起始位置,bucket 遍历顺序为:3 -> 0 -> 1 -> 2,遍历到0号桶时,虽然0号桶此时还没搬迁,但只会遍历0号桶搬迁过后仍然在0号桶的key,即遍历时如果遇到正在扩容,会按照将来扩容完成后新bucket的顺序进行遍历
最终遍历的顺序为:
参考
Last updated