2026年6月3日 · 8 min
Dive into LLM
本文介绍 LLM 的基础知识,包括推理过程、Transformer 结构、KV Cache、模型类型和 VRAM 计算等核心概念。
LLM Transformer KV Cache +1
技术文章、论文阅读、实验观察和工程思考
本文介绍 LLM 的基础知识,包括推理过程、Transformer 结构、KV Cache、模型类型和 VRAM 计算等核心概念。
如果没有稳定的评测切面,很多 Agent 改动都会陷入看似变好、实际不可验证的状态。
看论文和看指标都不够,研究笔记更需要回到任务定义、数据条件与失效模式。
有趣&实用的repo
最新
保持人的尺度,而不是只剩技术陈列。