
C/C++学习
文章平均质量分 82
RookieCao
清醒自律知进退
努力上进且温柔
谦逊自信为韶华
展开
-
LeetCUDA-学习记录-矩阵转置(mat-transpose)
本文记录了作者学习LeetCUDA项目的过程,重点分析了矩阵转置(mat-transpose)算子的优化设计。作者首先介绍了行主序和列主序的概念,并详细分析了项目中两种矩阵转置的实现方式:一种是基于行主序的优化,另一种是基于列主序的优化。通过使用float4向量化和共享内存,项目成功减少了计算延迟和访存耗时,但仍存在部分bank conflict问题。作者进一步优化了核函数,通过调整共享内存的访问模式,完全消除了bank conflict,并在GTX 1660 SUPER上测试,性能提升了1.2倍。原创 2025-05-20 22:14:35 · 924 阅读 · 0 评论 -
C/C++学习-Docker linux环境
本文采用**ubuntu:20.04**镜像,对刚入行的开发者详细介绍如何在Docker容器中安装GCC编译器。原创 2024-11-25 21:44:49 · 737 阅读 · 1 评论