【Agent智能体12 | 反思设计模式-使用外部反馈】
声明本篇博客是以吴恩达的【Agent智能体】教程为基础并对其中的内容做了笔记整理以及个人收获的总结。与其只让LLM反思代码但事实证明外部反馈来自LLM之外的新信息的效果远远超过仅依赖语言模型自身反馈的反思因为这相当于给了AI具体的错误AI可以这个具体的错误为依据解决问题而不是盲目自己寻找。提示词工程的投资回报率Return on investment on prompt engineering红线No reflection无反思单纯地花费时间去反复修改和测试基础提示词盲目试错模型性能在初期会快速提升但很快就会遇到明显的瓶颈曲线变得平缓。蓝线With reflection加入自我反思在提示词设计中引入了“反思机制”例如让大模型先输出一个草稿然后提示它自己检查其中的逻辑漏洞或错误并进行修正模型就能突破刚才的瓶颈。这种策略能让模型达到一个明显更高的性能水平。黄线Reflection with external feedback结合外部反馈的反思表现最好的一种策略。不仅让模型进行自我反思还引入了外部反馈例如人类的直接打分评价、代码解释器的报错信息、或者是外部知识库的检索结果验证。将反思与客观的外部约束相结合能把模型的性能推到更高。这幅图展示了无反思、自我反思、外部反馈的反思三种反思的效果我们可以发现结合外部反馈的反思效果是最好的下面看一些案例。一些引入“外部反馈External feedback”的具体案例1. 提及竞争对手 (Mentioning competitors)示例模型在撰写营销文案时输出了“我们公司的鞋子比 RivalCo竞争对手更好”。很多企业在公关和营销中严禁直接拉踩竞品。外部反馈来源Pattern matching for competitor names针对竞争对手名称的模式匹配。解释不需要大模型自己去猜系统可以直接使用传统的编程手段如正则表达式或关键词匹配建立一个“黑名单”。一旦扫描到模型输出中包含竞品名字就会触发报错机制要求模型重写并规避这些词汇。2. 事实核查 (Fact checking an essay)示例模型在文章中写道“泰姬陵建于1648年”。大模型有时会产生“幻觉”凭空捏造或记错客观事实。外部反馈来源Web search results网络搜索结果。解释针对事实类陈述系统可以自动提取关键实体**调用搜索引擎 API如 Google 搜索查找权威资料。**然后将搜索到的真实信息作为反馈提供给模型让其对照事实依据进行自我修正。3. 无法遵守输出长度指南 (LLM won’t follow output length guidelines)示例表现要求写一篇短文结果模型生成的文章“字数超限 (Essay is over word limit)”。大语言模型天生在精确的字数计算上表现很差。外部反馈来源Word count tool字数统计工具。解释不要指望模型自己能数清楚写了多少个字。系统可以调用一个极简的外部代码脚本例如计算字符串长度得出精确字数后反馈给模型“你当前写了 800 字要求是 500 字以内请缩减”。总结通过这些例子我们能更直观的看出外部反馈的作用这也警示我们在使用ai的时候要多使用外部反馈而不是盲目的使用AI去反思纠错。如果这篇文章对你有帮助欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力