Agent / LLM Research & Building
你好,我是 sikm。
Agent / LLM 算法方向研究生
我在这里长期沉淀关于 Agent、评测、RAG、工具调用和工程实践的文章、项目与研究笔记,也保留少量真实生活记录。
精选
精选项目
不是罗列仓库,而是展示问题、方法和结果。
LogAgent:面向复杂失败日志的多阶段诊断实验
In Progress把日志诊断拆成分阶段 Agent 流程,并通过评测回看真实失败类型。
Python Agent Workflow Prompting +1
最新
最新文章
围绕 Agent 系统、评测、工具链与实现细节的写作沉淀。
2026年5月10日 · 7 分钟
从状态视角重看 Agent 系统设计
把 Agent 问题拆成状态、转换和边界条件,通常比直接谈 Prompt 更稳定。
Agent LangGraph Workflow
2026年5月6日 · 6 分钟
用评测驱动 Agent 迭代,而不是靠主观感觉修修补补
如果没有稳定的评测切面,很多 Agent 改动都会陷入看似变好、实际不可验证的状态。
Evaluation Agent Reliability
最新
研究笔记
论文阅读、实验观察和问题拆解。
2026年5月4日 · 5 分钟
RF-DETR 阅读笔记:从模型结果回到任务定义
看论文和看指标都不够,研究笔记更需要回到任务定义、数据条件与失效模式。
Research Object Detection RF-DETR