Golang的slice
今天来说个简单的,也不简单的东西,那就是切片。slice对于golang来说那真的是一个非常常用的东西了,很多地方都会用到它,今天就来说说,slice底层是如何实现的,又有哪些坑是需要提前注意的。
slice结构
很多第一次接触golang的同学都会认为,数组和切片是差不多的东西,其实不是的,切片是数组的封装。
1 | type slice struct { |
上面这个就是slice的结构,顺便说一下:slice的源码位置是:
go/src/runtime/slice.go
- 其中array是一个指针,指向底层的数组
- len代表slice的长度
- cap代表slice的容量
为什么会有长度和容量这个区分呢,这两个东西是用来干什么的呢?我们往下看。
slice的长度和容量
我们先来看一个最简单的案例
1 | sli := make([]int, 2) |
我们创建一个长度为2的slice然后打印一下它的len和cap。
然后添加一个元素,再次打印最后结果为:
len=2 cap=2
len=3 cap=4
从中我们可以知道len和cap是不同的东西,明显嘛。但是为什么呢?
其实原因很简单,因为数组在创建的时候只能创建固定大小的数组,而当slice在不断往其中添加元素的时候,势必会遇到大小不够的情况,如果每次添加都不够,那么每次都要创建新的数组,那会相当浪费时间和资源,所以当不够的时候索性一次就创建大一些,所以cap其实就代表了整体的一个容量,而len代表当前用到了第几个。
slice的扩容
刚才提到的整个过程就是扩容的原因,那么slice究竟是如何进行扩容的呢?
网上我看见过两个说法:
- 每次2倍
- 当len<1024的时候每次2倍,当len>1024的时候每次1.25倍
我最后得到的结论是其实两个都不完全正确。正确的应该看看源码中是怎么说的。
1 | func growslice(et *_type, old slice, cap int) slice { |
我们省略其中部分代码看关键部分,首先说明一下growslice这个方法是扩容的方法,其中的入参et *_type, old slice, cap int
分别是元素的类型,老的slice,新slice要求的最小容量
针对最后这个参数举个简单的例子,当前如果是len=2,cap=2的一个slice添加一个元素,那么这个参数传入的就是3,因为最小需要容量为3。
其实从前半部分来看,第二种说法是正确的,当len<1024确实就是两倍,而当len>1024的时候,每次以原来的25%增加直到满足要求。
但是其实你看后面部分,有一个roundupsize的方法,并且又对newcap进行赋值,所以肯定修改了cap的值,所以其实扩容并没有描述的那么简单,实际中会进行内存对齐
,具体什么事内存对齐呢?简单的描述是,内存中肯定不是你想怎么放就怎么放的肯定要满足一个规则,有的地方虽然你只要这么点地方,但是由于美观的要求,会多给你一点,凑个整,保持统一整齐,这就是内存对齐。(是不是花里胡哨的,我尽可能已经白话了,具体还是要看)
https://blog.csdn.net/u011957758/article/details/85059117
总之,我们知道,slice的扩容并不是那么简单的。最后附上一个例子作为验证:
1 | func main() { |
输出
1 | len= 2 cap=4 |
1280 = 1024 * 1.25
1696 = 1280 * 1.325
slice的操作
普通的创建添加元素我就不多说了,你肯定知道,你要是不知道就不会来看我的博客了。说一些看起来高端的微操。
创建slice
make([]int, 10, 32)
make的时候可以指定第三个参数也就是初始的cap
slice删除一个元素
sli = append(sli[:3], sli[4:]…)
因为底层是数组,所以删除一个元素看起来会比较麻烦
reslice
1 | func main() { |
sli = sli[1:3:5]
reslice的时候也可以指定cap,但是注意的是,这个时候并不是指定的整体容量为5,而是容量为原来slice下标为5的地方。
如果原来是[1 2 3 4 5 6 7 8 9 10]
按照上面的操作,按照我自己的平常说的就是切两刀,第一刀是切到3,第二刀是切到5
slice是[2,3],但是实际底层还有[4,5] cap应该是4,所以输出应该是:
1 | [1 2 3 4 5 6 7 8 9 10] |
slice的坑点
slice的坑其实主要在于使用者需要清楚值传递引用传递的关系。
首先在golang中只有值传递,没有引用传递。
- reslice的时候要注意,如果只是reslice那么后续操作是会对原来的slice造成影响的。
- 但是如果经过append之后,那么由于扩容的时候回重新分配内存,如果涉及扩容之后,那么就不会对原来的slice造成影响。
- 如果作为函数的参数传递的是数组,因为是值传递,所以函数内部的修改不会对外部的变量产生影响,但是如果是slice传递,那么因为传递的是指针,所以会修改外部的变量。
- 同时因为是值传递,形参的重新赋值是不会对外部的变量造成影响的。
下面的代码说明了以上可能出现的坑点
1 | package main |
总结
总结一下,创建slice的时候如果可以的话尽可能初始化好要用容量,以免经常扩容。slice作为参数进行传递的时候,还有slice进行append的时候注意一下,别的应该没有问题。总的来说slice的实现还是比较简单的。