MyWeb:面向长期写作与项目沉淀的个人站点
Prototype围绕内容、双语和静态部署,搭建一个能长期维护的个人研究主页。
精选
不是罗列仓库,而是展示问题、方法和结果。
围绕内容、双语和静态部署,搭建一个能长期维护的个人研究主页。
把日志诊断拆成分阶段 Agent 流程,并通过评测回看真实失败类型。
最新
围绕 Agent 系统、评测、工具链与实现细节的写作沉淀。
把 Agent 问题拆成状态、转换和边界条件,通常比直接谈 Prompt 更稳定。
如果没有稳定的评测切面,很多 Agent 改动都会陷入看似变好、实际不可验证的状态。
最新
论文阅读、实验观察和问题拆解。
看论文和看指标都不够,研究笔记更需要回到任务定义、数据条件与失效模式。