【Agent智能体12 | 反思设计模式-使用外部反馈】

张

张建站

2026/5/30 17:02:01

10分钟阅读

声明本篇博客是以吴恩达的【Agent智能体】教程为基础并对其中的内容做了笔记整理以及个人收获的总结。与其只让LLM反思代码但事实证明外部反馈来自LLM之外的新信息的效果远远超过仅依赖语言模型自身反馈的反思因为这相当于给了AI具体的错误AI可以这个具体的错误为依据解决问题而不是盲目自己寻找。提示词工程的投资回报率Return on investment on prompt engineering红线No reflection无反思单纯地花费时间去反复修改和测试基础提示词盲目试错模型性能在初期会快速提升但很快就会遇到明显的瓶颈曲线变得平缓。蓝线With reflection加入自我反思在提示词设计中引入了“反思机制”例如让大模型先输出一个草稿然后提示它自己检查其中的逻辑漏洞或错误并进行修正模型就能突破刚才的瓶颈。这种策略能让模型达到一个明显更高的性能水平。黄线Reflection with external feedback结合外部反馈的反思表现最好的一种策略。不仅让模型进行自我反思还引入了外部反馈例如人类的直接打分评价、代码解释器的报错信息、或者是外部知识库的检索结果验证。将反思与客观的外部约束相结合能把模型的性能推到更高。这幅图展示了无反思、自我反思、外部反馈的反思三种反思的效果我们可以发现结合外部反馈的反思效果是最好的下面看一些案例。一些引入“外部反馈External feedback”的具体案例1. 提及竞争对手 (Mentioning competitors)示例模型在撰写营销文案时输出了“我们公司的鞋子比 RivalCo竞争对手更好”。很多企业在公关和营销中严禁直接拉踩竞品。外部反馈来源Pattern matching for competitor names针对竞争对手名称的模式匹配。解释不需要大模型自己去猜系统可以直接使用传统的编程手段如正则表达式或关键词匹配建立一个“黑名单”。一旦扫描到模型输出中包含竞品名字就会触发报错机制要求模型重写并规避这些词汇。2. 事实核查 (Fact checking an essay)示例模型在文章中写道“泰姬陵建于1648年”。大模型有时会产生“幻觉”凭空捏造或记错客观事实。外部反馈来源Web search results网络搜索结果。解释针对事实类陈述系统可以自动提取关键实体**调用搜索引擎 API如 Google 搜索查找权威资料。**然后将搜索到的真实信息作为反馈提供给模型让其对照事实依据进行自我修正。3. 无法遵守输出长度指南 (LLM won’t follow output length guidelines)示例表现要求写一篇短文结果模型生成的文章“字数超限 (Essay is over word limit)”。大语言模型天生在精确的字数计算上表现很差。外部反馈来源Word count tool字数统计工具。解释不要指望模型自己能数清楚写了多少个字。系统可以调用一个极简的外部代码脚本例如计算字符串长度得出精确字数后反馈给模型“你当前写了 800 字要求是 500 字以内请缩减”。总结通过这些例子我们能更直观的看出外部反馈的作用这也警示我们在使用ai的时候要多使用外部反馈而不是盲目的使用AI去反思纠错。如果这篇文章对你有帮助欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力

PS4存档管理终极指南：Apollo Save Tool让你的游戏进度永不丢失

PS4存档管理终极指南：Apollo Save Tool让你的游戏进度永不丢失【免费下载链接】apollo-ps4 Apollo Save Tool (PS4) 项目地址: https://gitcode.com/gh_mirrors/ap/apollo-ps4 你是否曾因PS4游戏存档损坏而痛失上百小时的游戏进度？或是想体验其他…...

2026/5/30 16:59:00 阅读更多 →

区块链、物联网与AI融合：构建自主化供应链的技术架构与实践

1. 项目概述：供应链自主化的技术基石最近和几个做供应链管理的朋友聊天，大家普遍有个共识：现在的供应链越来越像一个“黑箱”。从原材料采购到成品交付，中间环节多、数据孤岛严重、响应迟缓，一旦某个节点出问题&#…...

2026/5/30 16:57:05 阅读更多 →

多云安全管理：管理多云环境下的安全

多云安全管理：管理多云环境下的安全一、多云安全管理概述 1.1 多云安全管理的定义多云安全管理是指在多云环境中统一管理和保护各个云平台安全的过程。它通过统一的安全策略和工具，确保在多个云平台上运行的应用和数据的安全性。 1.2 多云安全管理的价值…...

2026/5/30 16:55:32 阅读更多 →

ML模型监控工具：监控和维护机器学习模型的性能

ML模型监控工具：监控和维护机器学习模型的性能一、ML模型监控工具概述 1.1 ML模型监控工具的定义 ML模型监控工具是指用于监控和维护机器学习模型性能的软件工具。它通过收集模型的预测数据、性能指标和数据质量，帮助用户了解模型的状态，及时…...

2026/5/30 6:22:30 阅读更多 →

AI 开发工具选择指南：Qoder、Qwen 与开发者使用策略

AI 开发工具选择指南：Qoder、Qwen 与开发者使用策略引言在 AI 技术快速发展的今天，越来越多的 AI 工具涌现出来，帮助开发者提高工作效率。但对于许多开发者来说，面对众多的 AI 产品和服务，往往感到困惑：这…...

2026/5/30 17:03:09 阅读更多 →

全平台资源下载神器：5分钟掌握res-downloader的完整使用指南

全平台资源下载神器：5分钟掌握res-downloader的完整使用指南【免费下载链接】res-downloader 视频号、小程序、抖音、快手、小红书、直播流、m3u8、酷狗、QQ音乐等常见网络资源下载! 项目地址: https://gitcode.com/GitHub_Trending/re/res-downloader 还在…...

2026/5/29 4:41:15 阅读更多 →

2024三星固件下载完整指南：Bifrost跨平台工具终极解决方案

2024三星固件下载完整指南：Bifrost跨平台工具终极解决方案【免费下载链接】Bifrost Cross-platform tool for downloading Samsung mobile device firmware. 项目地址: https://gitcode.com/gh_mirrors/sa/Bifrost 还在为三星设备固件下载而烦恼吗&#xff…...

2026/5/29 11:37:03 阅读更多 →