note思路是用于图像生成的多模态深度搜索智能体进行多跳推理与搜索以获取图像生成所需的文本知识和参考图像结论是在KnowGen上使Qwen-Image性能提高约16分在WISE上提高约15分。这也是一种应用型的工作本质还是在做图片生成方向的上下文扩充优化prompt和参考图片。文章目录note一、GraphWalkerDeepresearch用于图像生成Reference一、GraphWalkerDeepresearch用于图像生成【Deepresearch用于图像生成思路】思路是用于图像生成的多模态深度搜索智能体进行多跳推理与搜索以获取图像生成所需的文本知识和参考图像结论是在KnowGen上使Qwen-Image性能提高约16分在WISE上提高约15分。GraphWalker: Agentic Knowledge Graph Question Answer-ing via Synthetic Trajectory Curriculumhttps://arxiv.org/pdf/2603.28533https://gen-searcher.verce1实现思路三类工具search【网络文本搜索获取事实信息】image_search【图像检索获取视觉特征参考】browse【网页精读提取深层证据】两阶段训练SFT监督微调【在Gen‑Searcher‑SFT‑10k训练掌握基础工具使用】AgenticRL强化学习【用GRPO优化搜索轨迹仅用图像奖励受生成器能力与随机性影响方差大、不稳定仅用文本奖励忽略信息对图像生成的实际价值所以用双奖励机制最终奖励R(1−α)R_imageαR_textα0.5。文本奖励评估信息完整性图像奖励用K‑Score加权评分忠实度0.1视觉正确性0.4文本准确性0.4美学0.1】2数据合成思路Agent轨迹合成【search用于从网络中检索文本信息image_search用于通过文本查询搜索相关图像以及browse用于阅读和分析已检索网页的详细内容。在此过程中智能体持续分析来自环境的文本和视觉反馈识别出有用的证据和参考图像并据此规划下一步动作。通过这一多轮推理与搜索流程智能体逐步从多个来源聚合信息最终生成一个基于证据的提示以及一组适用于图像合成的相关参考图像】-图像生成【在获得最终的有根据提示和视觉参考后使用专有的图像生成模型NanoBananaPro合成相应的图像】-数据过滤【使用Seed1.8从多个角度对生成的样本进行评分包括提示是否真正需要搜索、生成内容的正确性、与提示的一致性、视觉美感、文本渲染清晰度以及安全考虑。与基于规则的过滤相结合例如移除token长度过长或搜索结果不一致的提示】。Reference[1] GraphWalker: Agentic Knowledge Graph Question Answer-ing via Synthetic Trajectory Curriculumhttps://arxiv.org/pdf/2603.28533https://gen-searcher.verce