《笨开发学习操作系统》4进程间通信
在操作系统中,两个进程之间是如何进行通信的?
随着我们的应用系统越来越大,单进程往往无法满足我们的要求,将一个大的系统拆分成多个功能模块,解耦,往往是一种常用的设计。无论是从将功能模块化、数据隔离等方面考虑,多进程协作都有着优势。
那么就意味着进程之间需要进行数据的传递,于是进程间通信(Inter-Process Communication)也就是我们常说的 IPC 就非常重要了。今天我们就来看看有哪些方式能实现 IPC。
大纲,我们主要围绕着 IPC 的方式展开,今天比较简单:
共享内存
管道
信号
信号量
消息队列
套接字
管道
1ps -ef |grep target
通过 shell 的管道符号 “ | “,将第一个命令的输出通过管道作为第二个命令的输入。
特点:
单方向:由一方发送,另一方接收
使用功能内存作为缓冲区,没有持久化
创建:
匿名管道:通过 pipe 系统调用创建
命名管道:通过 mkfifo 创建
其实本质是创建了两个文件描述符,然后通过内存作为缓冲区,来实现通信。
消息队列
UNIX 系统提供了 System V 消息队列来作为一种进程间通信的 ...
go 中 struct 是否可以比较?
今天来水一篇,最近比较忙,一直没有时间写 go 相关的,今天从一个小问题入手,来说说 struct 的比较问题。
由于已经有很多其他的文章说过这个问题,我这里赘述就显得多余,所以我直接给出结论,并直接说明在实际中用的上的。
为什么要比较?原本这应该是某人想出的面试题,但是如果光光是解决这个问题的话,太应试了。大白话就是,谁没事去比较两个 struct 呢?为什么要比较呢?
那比较的原因,肯定是我们需要知道两个结构体是否相等。
比较的依据两个结构体是否相等,比价的依据有两个:
两个结构体的地址是否相等?(比较地址)
两个结构体中的所有字段是否都相等?(比较内容)
重点1:如果两个 struct 类型不同,一定是无法比较的,会直接编译报错,也没有人这么干吧。。
比较地址其实大多数情况下,我们不需要知道这个问题的答案,至少我无法想象到为什么要比较两个对象的地址是不是一样。
123456789101112131415package main import "fmt" type User struct { Name string ...
《笨开发学习操作系统》3内存
OOM 往往是我们经常遇到的 “严重” 问题之一,那内存究竟是如何被合理分配和使用的呢?
本期大纲
首先我们要知道一个重要概念就是 虚拟地址
虚拟地址和物理地址的映射关系
内存中放了什么东西
内存是如何分配的
内存不够了怎么办
前言你的电脑上或许此时插着一根 8G 的内存条,你经常在使用它,但你有没有想过操作系统是如何管理内存的?如果让你来分配使用,你是否会想着:给正在运行的游戏分配其中的 4G,给我的视频软件分配 2G,给音乐软件分配 1G,分配各自独立,互不干扰。但当我的游戏需要更多的内存的时候,是否我的视频就无法播放了呢?
那么对于操作系统来说,如何合理的分配和管理好内存就是我们今天要解决的问题。
虚拟地址首先要引出一个概念:虚拟地址。我们将实际在内存条上存储的地址称为:物理地址。所谓虚拟地址,就是我们人为创建的一个地址,对于进程来说,只能看见虚拟地址。
为什么需要虚拟地址就像前言中所描述的,如果我们直接都使用物理地址会出现什么问题呢?
随着程序的运行,使用的内存不断变化,我们无法预见到需要使用多少内存,无法事先分配;即使事先分配,也会造成使用浪费。
如果不事先分配, ...
《笨开发学习操作系统》2进程
进程和线程有什么区别?一个常常被问到的面试题
我们在实际的开发过程中,经常打交道的就是线程,而进程呢,通常就是我们整个运行的程序。对于他们两个来说其实并不陌生,你要让我说出个一二三也可以讲,但可能也都是从使用的角度,而今天我们就从 操作系统 的角度来重新认识一下他们两个(从内核的角度看进程和线程长什么样)。
大纲:
首先我会让你直观感受我们的进程和基本的分类
优先理解他们的数据结构
状态的变化是非常重要的一环
接着是重点:如何创建他们
最后再来看调度
你所需要把握的重点是:结构、创建和调度。这些对于以后的开发或是问题的解决都是有着密切联系的。
进程的直观感受首先让我们从实际角度来直观感受什么是进程,通过 ps -ef 命令可以查看当前进程的相关情况
1234567891011121314151617181920212223242526UID PID PPID C STIME TTY TIME CMDroot 1 0 0 2021 ? 00:38:48 /usr/lib/systemd/systemd ...
《笨开发学习操作系统》1启动
问问自己,如果你都不知道计算机是怎么启动的,那以后怎么修电脑呢?
虽然我们程序员不是修电脑的,虽然计算机启动到操作系统启动这个部分其实对工作的意义可能不大,但就是上面说的那句话,不知道启动,总是说不过去的,所以我还是单独把它拿出来,作为我们万里长征的第一步。
那你是否想过,当你按下开机键的那一刻,电脑做了什么事情呢?是不是直接读取操作系统的代码,然后一条条往下执行,最终就启动了整个系统,然后你就可以使用了?其实整个启动过程复杂而又神秘。
回忆让我们先来看两张图
你是否曾经在开机的时候见过这两个画面?没错,蓝色的这张是 BIOS,而黑色的这张则是 GRUB,为什么我要先拿这两张图出来呢?没错,其实操作系统的启动过程你需要记住这两个画面,今天你就能通过下面的学习将原有的这两幅画面串起来了。
前置知识点首先来标记一些你需要了解的基本术语和概念,方便我们后面的描述和讨论。
ROMROM(read-only memory) 只读内存,开机程序就在这里面
BIOSBIOS(Basic Input/Output System) 基本输入输出系统,如果你自己尝试重装操作系统,应该对它不陌生,因 ...
《笨开发学习操作系统》0前言
本专栏就是为了记录从一个普通开发的视角去学习操作系统基础知识的过程,其中的“笨”开发就是指作者我
面向的用户
可能没有系统学习过操作系统的基础知识,或是大学学了之后就忘了
常年的业务开发,却没有怎么了解操作系统相关的知识
看了操作系统的书就觉得困,觉得无法继续坚持
如果你和曾经的我一样,也有这样的问题,那么我觉得份专栏应该会对你有用。
学习的角度我将从一个”笨”开发的学习视角让你从一个不一样的角度来学习操作系统的知识,我尽可能的做到简单易懂并且能联系实际,让知识本身不过于枯燥。
其实对于很多业务开发的工程师来说,操作系统是经常打交道的,但是一旦学习起来就会发现,它的知识大多是无法在实际的生产马上发挥作用的,对于这种及时正反馈很差的知识来说,学习起来就会变得很困难。
于是我就在学习的过程中开始整理,将学习的知识尽可能的联系我们的业务,或是代码的设计,或者是中间件的使用,从其他方面着手去理解和学习这些知识。希望我整理的整个学习过程和思路可以帮到准备开始迈出第一步的你。
广度和深度作为一个普通的开发者,我觉得,对于操作系统来说,如果你不是做内核开发或是运维开发,或是嵌入式开发,总之如果 ...
kubernetes调度之分配规则
前言
正所谓每一次事故都是一次成长
事情是这样的,最近行业不景气(摆烂),由于业务收缩,所以需要对其中一个小的 k8s 集群中的节点做收缩,下掉几台不需要使用的服务器,在对 k8s node 做变更的时候出现了一个意外:coredns 在某个 node 被删除之后重启后发现无法正常启动,并且出现报错
0/7 nodes are available: 3 node(s) had taint {node-role.kubernetes.io/master: }, that the pod didn’t tolerate, 4 node(s) didn’t match Pod’s node affinity.
在救火之后,让我想到,之前没有写过和调度相关问题的博客,于是今天先来说一些最基本的规则,让我们能控制一个 pod 能被调度到整个集群的哪一个 node 上去。本文最后回过头再来解决这个问题。
其实合理的控制 pod 调度也是我们一个非常实用且必会的技能之一。
nodeName这个很少用到,也最简单最粗暴,就是直接指定你这个 pod 只能到哪个 node 上去。12spec: n ...
工作默默无闻的sysmon
sysmon 默默无闻的后台监控golang 里面里面有一个默默无闻的工作者在后台跑着,它的名字叫 sysmon ,你可能在某个地方见到过它。我最早是在 gc 中第一次见到了它,当时只知道默认有一个两分钟的 gc 是由它来控制的,那么它究竟还做了什么工作呢?今天我们就来看看它。
启动首先让我们来看看 sysmon 是谁启动的。
123456789101112131415// The main goroutine.func main() { ........... if GOARCH != "wasm" { // no threads on wasm yet, so no sysmon // For runtime_syscall_doAllThreadsSyscall, we // register sysmon is not ready for the world to be // stopped. atomic.Store(&sched.sysmonStarting, 1) systemstack(func() { ...
博客装修(2022年3月)
博客装修记录一(2022年3月)
过去一年都没有装修我的博客,虽然还看的过去,但是见过了很多大佬的魔改之后发现改进的地方还有很多,于是花了一周的时间进行了这个主题的第一次装修
装修主要改变
新增主页顶部推荐分类
新增主页顶部固定栏目
新增用爱发电页面
将部分公用图片资源挪到 cdn 下
修改评论组件
调整分页等字体、背景颜色、图标等
…
下面我先来说说如何装修的
新增页面元素新增主页顶部推荐分类、新增主页顶部固定栏目 这两个装修都是通过新增页面元素来完成的
大致步骤 :
在 theme\butterfly\layout\includes 新增所需页面元素的 xxx.pug
然后所需页面,如 index.pug 引入
添加自定义 css,在 _config.yml 文件的 配置项 inject 中配置即可
其实关键还是在你需要熟悉 pug 的语法和 css 的语法,就很快能实现你所需要的功能,如果不熟悉的话还需要参考别的大佬的魔改后的样式,然后照着修改
pug 的语法参考 https://sobaigu.com/hexo-pug-notes.html
新增页面这个很简单,只需 ...
loki 自定义部署配置
loki 自定义部署配置前言之前有简单的提到 loki 的部署和基本的一些使用,能支持用户最基本的在 k8s 中的部署和使用,非常简单。但是因为很多配置是默认的以至于并不满足需求,所以这里就来更新一下一些自定义配置的更改以便更好的支持当前的使用。下面举例包括:
过期日志如何删除?如何只保留 14 天的日志
如何更换 loki 的存储位置
非 stdout 输出日志的项目如何进行日志采集?
日志采集 promtail 配置有什么需要注意的地方
下面以 helm 默认部署 loki 之后为例进行修改
如何配置定期删除过期日志我们最常见的一个需求就是只保留固定天数的日志,因为由于日志量大,所以过期的日志不做保留,以避免磁盘占用量过大。那么在 loki 里面配置也很简单。
官方文档位置:https://grafana.com/docs/loki/latest/operations/storage/retention/
如果你使用 helm 进行部署,那么 loki 的配置文件位置是在 Secrets 下的,名称默认为 loki。
123456789101112131415161718192 ...
k8s StorageClass使用攻略
在 k8s 中当我们需要持久化存储一些数据的使用,会使用到的就是 PV 和 PVC,但 PV 和 PVC 都是需要手动创建的话会很麻烦,特别是当有 StatefulSet 应用存在的时候,如果你需要手动对每个 pod 都创建一个 PVC 和 PV 就非常麻烦,于是 StorageClass 就是来解决这个问题的。
准备首先你需要一个 nfs 或其他存储,这里我以 nfs 为例进行部署
我们先来梳理一下思路和几个需要的东西:
nfs 是我们最终的存储
nfs-client 是用来动态创建 pv 和 pvc 的,我们称为 provisioner
StorageClass 关联到对应的 provisioner 就可以使用
statefulset(或别的资源)需要配置 storageClassName 进行使用
部署创建 ServiceAccount创建对应需要使用的 ServiceAccount,因为需要操作 pv 和 pvc
123456789101112131415161718192021222324252627282930313233343536373839404142apiVe ...
go 应用在 k8s 中如何优雅停止
每次当我们发布新版本的时候总是慌兮兮,一方面是担心有 bug,另一方面其实重启应用会带来一些抖动,可能有几秒钟或者几个请求的不正常,从而担心用户在这段时间内的操作。那么如何在应用重启的过程中尽可能的保证不会带来抖动,从而平滑又优雅的重启呢?
本文只针对于应用版本更新时,进行版本发布时进行的重启操作,从而导致的相关问题的解决。不涉及由于应用本身 panic 导致的重启,也不涉及蓝绿发布或回滚等操作。当前版本更新是在 k8s 中进行的重启操作,访问负载均衡交由 k8s 的 service 处理,再上层的网关层面的负载则不在本次讨论范围内。
通过本文你可以学到:
go 应用优雅退出所需要做的事情
go 应用优雅退出 k8s 所需要的配置
k8s 应用关闭时 pod 的生命周期
测试程序先写一个最简单的测试程序(当然有很多压测工具都能满足需求,但是我还是想自己弄个最简单的,不想搞复杂),当然这个测试程序不能满足所有使用场景和情况,如并发的一些场景等,只是为了展现出固定的问题。
1234567891011121314151617181920212223242526272829package ...
defer 原理分析
很早之前我有写过有关 defer 的博客,现在看来起标题的时候有点蠢,有点标题党,(https://www.linkinstars.com/post/48e6221e.html) 其中主要是注重与 defer 的使用,避免使用上的问题,对于 defer 具体实现其实只是点了一下,而今天就让我们详细看看 defer 究竟是如何实现的。
前置知识点
在阅读本文之前你可能需要有两个基础知识前提
defer 的基本使用规则
逃逸分析:https://www.linkinstars.com/post/1ceb1a77.html
函数调用规约:https://www.linkinstars.com/post/fecd400.html
因为在 1.14 之后 defer 是有优化过的(https://golang.org/doc/go1.14#runtime),所以需要注意,本文使用的 go 版本是 1.17
引子问题
编译器是如何处理 defer 关键字的?
defer 的执行顺序是怎么样实现的?
defer 数据结构首先我们来看看 defer 究竟是长什么样子
12345678910 ...
go 函数调用规约
函数调用规约?如果你是第一次听到这个名词可能会有疑惑,这是在说什么?难道两个函数之间调用还需要约定什么吗?难道不是定好入参出参就可以了吗?没错函数的调用规约其实就是:我在调用其他函数的时候我的参数和返回值要如何分布?
那么其实在 golang 底层函数的调用还是有很多细节的,比如你的入参放在哪里?返回值存放在哪里?相信看完这篇你就都明白了。
栈
首先我们定一下基调,因为我们今天讨论的是函数调用规约,所以我们今天的主角是栈,没有堆什么事,也就是说,所有变量都默认分配在栈上,不考虑逃逸的情况
栈的样子先来看看我们今天主角的样子:
我们今天说的要说的栈,其实应该叫调用栈 call stack 而不是我们平常说的数据结构中栈。栈的增长方向是从高位地址到低位地址向下进行增长的,栈底是我们的高地址,而栈顶是我们的低地址,栈的作用是存放程序执行过程中使用的局部变量。
调用规约说简单也简单,说复杂也复杂,这里准备由浅入深,首先用一张图来直接描述 go 里面的函数调用规约究竟是怎么样的
左边是调用者栈情况,右边是被调用者栈情况
可以看到调用者栈里有本地的一些变量、当前调用函数的返回值、调用函数 ...
go 中其实不复杂的 timer
在 go 中当我们需要延迟一段时间后执行,或者需要间隔固定时间去执行某个行为的时候就需要使用到 timer,那么 timer 到底是如何实现的呢?我们今天就来看看 timer 里面是什么样的。
同时因为 1.14 版本前后 timer 的实现有很大的区别,我们顺便来了解一下之前的版本和现在的版本有什么样的不一样,到底做了什么样的优化。
前置知识点有以下的知识点支持才能更好的理解今天的分析
需要有 GMP 模型的基础
需要有 go 调度相关的基础
需要有数据结构中’堆‘的基础
ticker要看 timer 可以先从 ticker 入手,ticker 其实我们经常使用到,ticker 顾名思义就是每次间隔一段时间触发一次,下面我们就来看看它的具体实现
带着问题
Ticker 如果当前时间到了,没有及时处理,下一次时间到了,会保留吗?是都在后面排队,还是直接被丢弃了?
NewTicker() 和 Tick() 有什么区别?使用上需要注意什么?
数据结构123456// A Ticker holds a channel that delivers ``ticks'' ...
我怎么从来没见过 sync.Cond
sync.Cond 作为 go 标准库提供的一个并发原语,但是可能你从来没听过,可见它使用场景挺少的,但是我们需要有这个知识储备,只有储备了之后才能在需要用的时候用出来。
其实如果你之前和我一样接触过 java,那么其实对于这个并发原语其实应该很熟悉,其实就是常说的等待通知机制,也就是 wait 方法和 notify 方法。
使用我们首先从使用的角度的出发,先来看看 cond 是如何使用的
三个方法首先我用最白话的方式描述一下 cond 的三个方法
Wait 当前调用者等待执行,直到被唤醒,调用该方法时需要加锁
Signal 唤醒一个调用者
Broadcast 唤醒所有调用者
一把锁一个队列cond 初始化需要传入一个锁,用于并发控制,调用 wait 的时候需要加锁
cond 内部维护着一个队列,等待调用者排队等待
使用我们创建两个 goroutine 使用 cond 等待执行任务,然后使用 signal 方法唤醒试试
123456789101112131415161718192021222324252627282930package mainimport ( "f ...
golang 使用 rabbitmq 延迟队列
你在实际业务中是否有遇到过下面这样的场景:
订单十分钟没有支付,自动取消
用户注册成功后无任何操作,一天后自动提醒
预定票之后,在出发之前的一天自动提醒用户
这样类似的场景经常会发生在实际的业务中,它们总有一个共性,就是当前并不是马上触发,而是需要过一段时间才进行触发,当触发时间到达时才进行具体的执行。那么问题就来了,为了实现这样的功能,我们如何更加灵活的实现呢?
为什么使用延迟队列我们以 订单十分钟过期 场景举例:
方案 1:为当前订单创建一个定时器,定时器时间到了之后自动去查询当前订单状态,如果没有支付,则进行取消操作
方案 2:设定一个总的定时器,每一分钟检查一次,当检查发现过期的订单就直接进行取消操作
方案 3:如果你有一个延迟队列,你只需将任务丢进去,等到了对应的时间,这个任务会出队,然后出队的时候进行订单过期时间判断
方案比较正所谓抛弃场景谈方案都是耍流氓:我的观点也很明确,这三种方案都有自己所试用的场景。
方案 1如果全局只有一个用户,并且这个订单又是那种量比较小的,可能每天有个 30 个已经撑死了,这样的后台的系统,可能都谈不上需要高可用的情况,那么方案 ...
K8S之CNI
之前我们解决了跨主机间容器间通信的问题,但是这也只能说我们铺好了路,村里通路了,但是其实作为 k8s 来说,还有好多其他的问题等待着我们解决。今天我们就通过这些问题来看看 k8s 的 CNI 的设计。CNI 到底究竟是个什么东西,到底是不是和你想的一样那么困难。
问题IP 分配我们知道 k8s 整个集群里面有许多的 pod 那么 IP 怎么分配呢?总不能分配着之后出现 IP 冲突了吧。k8s 集群里面是不是能不有一个类似 DHCP 的东西来管这个 IP 地址分配呢?
流量转发当流量打到宿主机上时,应该有一个什么设备来快速将请求转到对应的 pod 才对吧?那么谁来做这个事情呢?
那为了解决上面的问题,我们一步步出发。
k8s 网络模型首先有关 k8s 的网络模型,官网有下面的描述:(https://kubernetes.io/zh/docs/concepts/cluster-administration/networking/)
节点上的 Pod 可以不通过 NAT 和其他任何节点上的 Pod 通信
节点上的代理(比如:系统守护进程、kubelet)可以和节点上的所有Pod通信
备 ...
K8S之跨主机通信
你是否之前看过 k8s 的网络部分,第一次看是否会觉得很困难?或者说你有没有想过为什么 k8s 要这样设计它的网络,跨主机之间的网络通信究竟是怎么实现的?今天就来搞一篇干货,其实想写这个很久了,但是一直拖延症,这次正好碰到了一个新的点想让我仔细重新审视一下。
本文可能需要你有以下知识基础:
docker基本原理
k8s基本架构
网络基础知识
本文不想引出过多细节的概念,因为网络本身确实有很多细节,每一个细节其实都可以写一篇,如果篇幅过长就会让人觉得没有重点,于是本文的重点将会放在从外部的大视角来看跨主机的网络通信,其中的细节先挖坑,后面慢慢填。
引子问题我们知道 k8s 往往会有很多主机进行集群的部署,k8s 要管理很多 pod,而这些 pod 里面有很多容器,每个容器都是一个小的服务,服务与服务之间往往需要互相访问,而 pod 并不总是在同一宿主机上,那么问题来了:k8s 是如何做到让服务之间能够互相访问的呢?这里网络的链路到底是怎么走的?
时刻记住,本文将围绕这个问题展开。
假设和思考如果说每个容器都绑定一个宿主机的端口来进行通信,那么一旦容器很多就要占用非常多的宿主机的端 ...
go 中没怎么用过的 sync.Map
我们知道 golang 的 map 并发会有问题,所以 go 官方在 sync 包中加入了一个 sync.map 来作为一个官方的并发安全的 map 实现。
如果你了解过 java 中常用的一个并发安全的 map 叫做 ConcurrentHashMap 就会知道它有两个亮点设计:一是当链表长度过长的时候会转换为红黑树的实现,还有一个就是分段锁。得益于这两个设计也导致 java 中实现的代码非常复杂,偷笑。
那么 go 里面是如何设计的呢?今天我们就来看看它是怎么实现的。
PS: 本文 go 源码基于版本1.16.2,我觉得当有了泛型之后这个库十有八九是要改的….
数据结构定义123456type Map struct { mu Mutex read atomic.Value // readOnly dirty map[interface{}]*entry misses int}
123456// readOnly is an immutable struct stored atomically in the Map.r ...