| 合集 | 简介 |
|---|---|
| ai-inference-resources | 面向 AI 推理系统工程师的精选资源合集,涵盖 LLM Serving、GPU Kernel 编程、Attention 机制、量化、分布式推理和生产部署。 |
| LeetCUDA | 面向初学者的现代 CUDA 学习笔记,包含 PyTorch、200 多个 CUDA 内核、Tensor Core、HGEMM 和 FA-2 MMA。 |
AI Infra 领域的资源合集与 Awesome Lists
| 合集 | 简介 |
|---|---|
| ai-inference-resources | 面向 AI 推理系统工程师的精选资源合集,涵盖 LLM Serving、GPU Kernel 编程、Attention 机制、量化、分布式推理和生产部署。 |
| LeetCUDA | 面向初学者的现代 CUDA 学习笔记,包含 PyTorch、200 多个 CUDA 内核、Tensor Core、HGEMM 和 FA-2 MMA。 |