矩阵乘法(C语言版)串行程序优化之一

该博客探讨了矩阵乘法的传统算法及其内存访问问题,提出通过转置B矩阵来优化,以提高CPU缓存命中率和计算速度。通过测试,对于2000x2000的矩阵,优化后速度提升了4倍。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一.优化核心思想

提升缓存命中率

1.矩阵乘法传统算法描述:
在这里插入图片描述
在这里插入图片描述

2.算法图形化展示:
在这里插入图片描述
根据矩阵乘法的计算特征以及C语言的访存特性(按行优先的存储),CPU在访问B矩阵数据的时候处于一个非连续的状态,那么CPU的缓存命中率会被极大的降低,为了扭转这样的局面,我们可以先给B矩阵做一个转置操作(耗时相对于乘法计算几乎可以忽略不计),先把行变成列,再“行行对应”计算,这样在计算过程中可以极大的提升缓存的命中率,从而实现一定程度的加速。

二.优化前的代码

在这里插入图片描述

三.优化后的代码

转置:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值