章节导览
按章节浏览本期要点,可点击任意章节跳转到对应播放位置。
本期笔记
来源与重点整理,方便你快速回顾这期内容。
Chip Huyen:AI 工程不是会更多模型,而是把系统更稳更能学
这期在讲什么
本期从 AI Engineering 视角,把“技术焦虑”翻译为“工程优先级”。重点不是选最热模型,而是做对“用户反馈、数据质量、评估框架、可切换架构”这四层底座。
学习要点
1. 在 AI 项目里,后训练和产品工作流常常比模型训练更影响效果。
2. 预训练参数不是你能每周优化的变量;但数据和提示是你每周能实打实改的变量。
3. 评估最有效时是“业务关键场景优先”,不是每个环节都追求全覆盖。
4. 比较式评估(A/B式对比)通常更稳定,能更快识别真实问题。
5. 选技术栈前先判断“可切换成本”,否则会被架构债务拖慢增长。
行动清单
- 先列出 3 个高失败成本场景,把它们定义成你的首批评估指标。
- 给每个场景建立“正确答案示例 + 错误样例 + 可接受阈值”。
- 每周至少做一次用户反馈复盘:真实失败样本是从哪类提示、哪类数据触发。
- 避免一次性重构:用可替换接口封装模型层,业务逻辑与模型供应商解耦。
- 把评估结果映射到发布决策,而不是只写进文档。
主要来源
- 原片来源:<https://www.youtube.com/watch?v=qbvY0dQgSJ4>
- 逐字稿:`../../transcripts/2025-10-23__Lennys_Podcast__chip-huyen.md`