缓存和发布订阅都是后端开发中常用的手段,其中缓存主要是用于可丢失数据的暂存,发布订阅主要是用于消息传递,今天给大家介绍一个k8s中带有发布订阅的缓存实现,其目标是给定一个时间,只关注该时间后续的事件,主要是用于近实时状态数据的获取
1. 业务背景
在k8s中的kubelet中支持不同的容器运行时,为了缓存容器运行时当前所有可见的Pod/Container就构造了一个Cache结构,当一个事件发生后,kubelet接收到事件后,此时需要获取当前Pod的状态,此时要获取的状态,就必须要求是在事件产生后的最新的状态,而不能是之前的状态,
2. 核心实现
2.1 数据与订阅记录
2.1.1 状态数据
状态数据主要是存储一个pod的状态数据
type data struct {
// 存储Pod的状态
status *PodStatus
// 试图检测Pod状态出错信息
err error
// 上次数据的修改时间
modified time.Time
}
2.1.2 订阅记录
订阅记录其实指的是一个订阅需求,其通过一个chan来进行数据通知,其中time字段是过滤条件,即只有时间大于time的记录才允许被加入到chan中
type subRecord struct {
time time.Time
ch chan *data
}
2.2 Cache实现
2.2.1 核心成员结构
cache里面的数据在kubelet每次进行PLEG更新的时候,都会更新timestamp,并且会重新获取最新的Pod状态进行填充cache,所以这里会更新timestamp,寓意着让之前旧的状态都过期,并且会针对旧的订阅的进行数据的返回
// cache implements Cache.
type cache struct {
// 读写锁
lock sync.RWMutex
// 存储Pod的状态数据,用于满足不带时间戳的状态获取
pods map[types.UID]*data
// 全局时间戳,即当前缓存中的数据,至少都要比该时间戳新
timestamp *time.Time
//存储对应Pod的定语记录列表
subscribers map[types.UID][]*subRecord
}
2.2.3 普通状态数据获取
普通状态获取即直接通过Map来进行数据的返回
func (c *cache) Get(id types.UID) (*PodStatus, error) {
c.lock.RLock()
defer c.lock.RUnlock()
d := c.get(id)
return d.status, d.err
}
2.2.4 默认状态构造器
当发现当前的cahce中并不存在对应的数据,则是直接根据ID来生成一个默认的状态数据
func (c *cache) get(id types.UID) *data {
d, ok := c.pods[id]
if !ok {
return makeDefaultData(id)
}
return d
}
// 默认状态构造器
func makeDefaultData(id types.UID) *data {
return &data{status: &PodStatus{ID: id}, err: nil}
}
2.2.5 最新状态数据获取
会给定一个时间戳,只有当当前缓存的数据的时间在该时间戳之后,才有效,否则返回nil,这里有个关键点就是timestamp的相关设计,因为在每个PLEG周期中,都会更新timestamp
如果minTime<globaltimestamp, 则意味着在已经有新一轮的更新,而你这个事件还是上一轮的事件,则可能就是事件的处理太慢,此时就会将之前缓存的状态,直接返回,因为下一轮很有可能会有新的事件到来 go func (c *cache) getifnewerthan(id types.uid, mintime time.time) *data { 获取当前的状态 d, ok :="range" 如果全局时间戳大于给定的时间,则会直接返回 globaltimestampisnewer !="nil" && c.timestamp.after(mintime)) if !ok 状态没有缓存,但是全局时间比最小时间新,就直接返回 return makedefaultdata(id) } 如果之前数据的时间在获取时间之后,或者全局时间已经更新 (d.modified.after(mintime) || globaltimestampisnewer) d the pod status is not ready. nil
### 2.2.6 订阅状态管道构造 订阅管道最终会返回一个状态的管道,同时会进行检查,如果发现当前有可用数据,则会直接丢进管道中,否则则创建一个subrecords订阅记录,并保存 subscribe(id timestamp chan ch *data, 1) c.lock.lock() defer c.lock.unlock() 获取状态数据 timestamp) 如果已经有状态数据,则立即返回 <- 否则添加一个订阅记录到subscribers中对应的列表中 c.subscribers[id]="append(c.subscribers[id]," &subrecord{time: timestamp, ch: ch}) 2.2.7 通知清理过期管道 通知的时候回根据subrecord的订阅时间进行检测,如果订阅时间已经超过当前的 timestamp则直接获取数据进行返回,最后只会保留那些还未过期的订阅记录 notify(id 获取事件的id列表 list, no one to notify. newlist 遍历所有的订阅记录subrecords for i, r list 如果这些订阅记录的时间在timestamp之前,就不进行操作, 即当前管道时间>timestamp if timestamp.Before(r.time) { newList = append(newList, list[i]) continue } // 获取一个数据返回, 同时关闭管道 r.ch <- c.get(id) close(r.ch) } if len(newList) == 0 { // 如果不存在订阅记录,则就删除对应的key delete(c.subscribers, id) } else { // 剩余的订阅列表 c.subscribers[id] = newList } }
### 2.2.8 全局时间戳更新
全局时间戳更新,则会遍历所有的订阅,以最新的全局时间戳作为时间,进行通知
```go
func (c *cache) UpdateTime(timestamp time.Time) {
c.lock.Lock()
defer c.lock.Unlock()
c.timestamp = &timestamp
// Notify all the subscribers if the condition is met.
for id := range c.subscribers {
c.notify(id, *c.timestamp)
}
}
2.2.9 Pod事件更新通知函数
更新的时候,则会调用notify来进行通知
func (c *cache) Set(id types.UID, status *PodStatus, err error, timestamp time.Time) {
c.lock.Lock()
defer c.lock.Unlock()
// 进行事件的通知
defer c.notify(id, timestamp)
// 保存最新的状态数据
c.pods[id] = &data{status: status, err: err, modified: timestamp}
}
今天就到这里,这些数据结构和设计有很多值得学习地方,希望大家能多多交流,一起学习云原生相关的设计与关键实现
> 微信号:baxiaoshi2020 > 关注公告号阅读更多源码分析文章 > 更多文章关注 www.sreguide.com > 本文由博客一文多发平台 OpenWrite 发布</globaltimestamp,>