Cache

连续性

Cache Hit 与存取时间

记

则存取时间

$$T=T_{\mathrm{cache}}\cdot h + (T_{\mathrm{cache}}+T_{\mathrm{mem}})\cdot(1-h)$$

因为 Cache Miss 要先访问 Cache 再访问主存

映射方式	直接映射	全相联映射	组相联映射
映射关系	Cache 行号 = 主存块号 % Cache 行数	Cache 分为若干槽，主存块按策略存入槽	先取模直接映射到组，再组内采用相联映射
行号算法	地址 / 块长 % 组数	地址 / 块长	地址 / 块长 % 组数
tag 算法	地址 / 块长 / 组数	地址 / 块长	地址 / 块长 / 组数
优点	易实现，命中快，易淘汰	Miss Rate 低
缺点	命中率低	tag compare 慢
地址结构	`[标记:行号:块内地址]`	`[标记:块内地址]`	`[标记:组号:块内地址]`
寻址方式	1. 查询行号 2. 对比标记，一致 hit 否则 miss	1. 查找标记是否 cached 2. 存在 hit 否则 miss	1. 先查询组号 (直接映射) 2. 组内再相联映射

关联度

关联度 := 可用槽数 per Cache 组

一般关联度越高 $\Rightarrow$

直接与相联

可以把组相联看成对 Cache 的 $m\times n$ 划分

每组 $n$ 行，也叫 n-路组相联映射

地址位数

常见替换策略

写缓存

减少全写法直接写回主存的时间损耗设计为 FIFO 队列

联合/分立	联合	分立
组织形式	数据+指令存在相同 Cache	分离单独的数据Cache & 指令Cache
命中擅长	命中率	命中时间
应用采用	L2 Cache	L1 Cache
应用采用原因	减少主存访存	减少时钟周期，防止结构冒险 (就算 Miss，L2 Cache 访存代价也不大)

从高级编程语言(C, C++, …) 看 cache hit，先转成指令 e.g. a[k] = a[k] + 32 其实访问了 a + k 处两次 (lw + addi)
Cache 比较器用于并行比较组内 tag，个数 = 组内行数，位数 = $\log_{2}|\mathrm{tag}|$