开篇:你写自动化测试还在写代码,别人已经在写 YAML 了“这个按钮的选择器是什么来着?”“页面改版了,之前写的测试全崩了。”“跑个测试还要切 Node 环境,能不能简单点?”如果你在做 UI 自动化测试,上面这些话一定不陌生。传统自动化测试的工具链(Selenium、Playwright、Cypress)虽然功能强大,但都有一个绕不开的问题:写脚本的人必须会写代码。于是产品经理提的需求,得扔给测试工程师写脚本;测试工程师写的脚本,页面一改版就得大修。整个链条里,沟通成本比执行成本还高。直到我看到 Midscene.js 的 YAML 脚本方案,第一反应就是——这个思路对了。Midscene.js 是字节跳动 Web Infra 团队开源的一款 AI 驱动的 UI 自动化框架,基于 MIT 协议发布,截至 2026 年 5 月,最新稳定版本已迭代至v1.8.0(2026 年 5 月 13 日发布),GitHub 上积累了超过 12.5k Stars。它最核心的卖点就是:用自然语言描述操作步骤,AI 视觉模型帮你执行。而 YAML 脚本,是把这种能力封装到了极致——你不需要写一行代码,打开记事本就能写自动化测试。这篇文章就从零开始,手把手教你把 YAML 脚本跑通,顺便把竞品对比、本地部署、安全风险这些硬核话题也掰开聊透。一、先搞清楚:YAML 脚本到底是什么?1