一.优化核心思想 提升缓存命中率 1.矩阵乘法传统算法描述: 2.算法图形化展示: 根据矩阵乘法的计算特征以及C语言的访存特性(按行优先的存储),CPU在访问B矩阵数据的时候处于一个非连续的状态,那么CPU的缓存命中率会被极大的降低,为了扭转这样的局面,我们可以先给B矩阵做一个转置操作(耗时相对于乘法计算几乎可以忽略不计),先把行变成列,再“行行对应”计算,这样在计算过程中可以极大的提升缓存的命中率,从而实现一定程度的加速。 二.优化前的代码 三.优化后的代码 转置: