兜忆轩
我是 Cedric,做 compiler / GPU / backend systems。
这里记录我拆 AI 编译器、Triton/TVM/MLIR、CUDA kernel 和工程工具的过程。
文章分为 lab notes、concept notes 和 essays;lab notes 优先给出可复现代码。
待补充:本文摘要
TVM TIR 中 ramp 向量表达与向量化地址生成笔记
待补充:本文摘要
待补充:本文摘要
待补充:本文摘要
待补充:本文摘要
待补充:本文摘要
待补充:本文摘要
剖析从高层框架到硬件的GPU计算技术栈,理解其组件与协作机制。
待补充:本文摘要