最近MiniMax M3发布的时候我本来没当回事——国产模型每个月都在重磅发布听得耳朵都起茧了快。但看到 OpenCode 第一时间就内置了 MiniMax M3模型而且免费……我的薅羊毛 DNA 瞬间从休眠状态原地起跳。昨晚刚好有网友在留言里问我MiniMax M3有没有免费版——这一下提醒我了忙起来差点忘了这茬用了这么多天赶紧抽空把感受写下来。这个AI Coding模型竟然完全免费的OpenCode福利党必看配置是真的简单体验嘛……咱们慢慢聊。先说结论免费的快乐是真的免费的代价也是真的。两分钟上车白嫖党的春天OpenCode 对 M3 的支持是内置的不用改配置文件、不用填 API Key、不用折腾环境变量——这对懒人来说简直是恩赐。第一步装 OpenCodecurl -fsSL https://opencode.ai/install | bash # 或者用 npm npm i -g opencode-ai # mac 用户直接 brew谁用谁知道 brew install opencode装完opencode -v看一眼确认没装了个寂寞。第二步启动选模型开薅opencode进去敲/models找到MiniMax-M3回车。前后不超过 2 分钟比泡一碗面还快。至于免费额度OpenCode 的 Free 层就能白嫖。如果顺手订个 Go$5/月首月还便宜MiniMax M3 每 5 小时大概 1400 次请求日常摸摸鱼完全够用。跑长任务的话……建议你先看看下面的翻车实录再决定。网友跑分猛如虎实操原地杵先声明我对MiniMax M3没什么偏见。但刷了一圈社区反馈之后我发现我不是一个人尬。MiniMax 官方数据确实好看——SWE-Bench Pro 59%号称超越 GPT-5.5直逼 Opus 4.7。数字摆在那看着挺唬人的。但实际用起来嘛……怎么说呢就像方便面包装上的图片仅供参考。翻车现场一俄罗斯方块都能写出死循环B 站网友「硬币不够昵称修改失败」让 M3 写了个俄罗斯方块。结果 bug 明显到肉眼可见更绝的是——让它自己修十几分钟陷入死循环越改越离谱。让 AI 改自己的 bug结果 AI 制造了更多 bug然后继续改继续制造……这哪是修 bug这是bug 永动机。还有人发现它废话多且严重降智翻车现场二别人都会就它掉链子用户「QuantumQuasar」做了个对话压缩的 Skills 测试。GPT-5.4、DeepSeek Pro、MiMo Pro、GLM-5.1、Kimi 2.6 全部完美执行到了 M3 这儿直接拉胯。他的原话是比 DeepSeek Flash 的 Agent 能力强很多但比其他国产 SOTA 差太多了。这句话的杀伤力在于——他不是在骂 M3他只是在陈述事实。翻车现场三跑分的水比太平洋还深推特开发者 melvynx 的吐槽就比较硬核了。他指出 M3 在 SWE-Bench Pro 上拿了高分但那是因为模型就是在这个基准上训练的。换个它没训练过的基准测试得分直接跌到 13%而 GPT-5.5 是 62%。简单翻译一下你去参加考试结果考试的题目就是你做过的练习册。你说你考了高分但换张你没见过的卷子就全不会了。这哥们有几十万粉丝过往评测也挺客观的所以我倾向于相信他不是乱黑。翻车现场四涨价了但东西没涨用户「雨假无人半丝鲲化」的评价一针见血基本没有太多升级跟不上第一梯队了价格还贵Plan 也加价了。就像某些视频会员——续费的时候发现涨价了但片库还是原来那些。Token ≠ Credits 这背后的计算逻辑懂的都懂不懂的说了也不懂。我也测了两个场景结果……让我们直接看看网友吐槽看得我心里发毛但咱不能光看热闹还是得上手啊。下面两个场景我分别用MiniMax M3和DeepSeek V4 Pro跑了一遍。不是为了写评测真真的不是纯粹是想知道——免费的到底差在哪。为什么是这两个场景目前的 AI 编程评测圈已经卷到什么程度了呢——HumanEval 这类刷题向的所有前沿模型都能 95% 通过。刷榜已经没有意义了。真正能拉开差距的是两种能力多文件改代码——真实项目不可能只有一个文件改一个函数要联动三四个模块陌生代码 Debug——给你一坨你没见过的代码能不能快速定位问题这两点恰好是目前公认最抗刷榜的评测方向。所以我就拿它们下手了。场景一跨文件修改用的是我自己封装的开发 Skill同一个需求、同一个知识库、同一条命令/feature-dev 233702MiniMax M3 的表现不理解的地方会确认这点不错。但确认完之后……基本上还是不知道该改哪从业务框架和知识库里推理不出正确的位置。实现计划里有个return 39那个值还是我告诉它的。它不会自己从方法里枚举推理必须我手把手喂。DeepSeek V4 Pro 的表现同样不理解的地方会确认但每个确认点都很精准问的都是关键问题。实现计划几乎不需要改动直接执行就完事了。“差距”肉眼可见。MiniMax M3 有点点像个刚入职还在看文档的实习生DeepSeek V4 Pro 像个已经摸清业务的老员工。当然测试不一定非常精准可能刚好是我遇到这个场景问题。场景二写个星际矿工小游戏这个测试纯粹是为了看看两个模型的输出质量差异。Prompt 用 HTML5 Canvas 做一个星际矿工小游戏。要求 - 玩家控制飞船采集矿石带回基地换取资源 - 消耗资源可以建造战斗单位 - 敌方会定时来袭保护基地不被摧毁 - 单 HTML 文件打开就能玩先看速度和消耗MiniMax M3DeepSeek V4 Pro耗时15分50秒11分20秒Token 消耗~5.5w~6.9wM3 耗时多了 40%但 Token 消耗反而少了——大概是因为中间反复卡壳、来回拉扯浪费的时间不算在 Token 里。MiniMax M3 效果DeepSeek V4 Pro 效果个人感觉MiniMax M3整体架构布局和操作感觉还是比较不错的加上多模态能力可以给他提供更加好看的图片动效。大家看完视频是感觉哪一个做出的效果比较好鸭所以这羊毛到底薅不薅我的理解是薅啊又不是不能用要什么自行车。最实用的姿势日常小活丢给 MiniMax M3 白嫖关键任务切 DeepSeek V4 Pro。OpenCode 里/models一条命令就能切比有些人换微信头像还快。最后聊两句说个好笑的——本来 M3 刚出来的时候我还真动过买 Plus 版好好测一测的心思。结果问了几个朋友直接被劝退口径出奇一致别买不是太好用。就放弃付费购买了。薅一薅羊毛啦不过MiniMax M3 免费这件事放在薅羊毛的角度看——香确实香。OpenCode 的内置支持也做得干净利落零门槛上车讲究个舒服。用过的朋友来评论区说说你的 M3 体验属于真香还是真伤好了我是「赛博李同学」。觉得有用就点个赞 转发给需要的TA我们下期见