4B 参数打平千亿级大模型,明日新程端侧认知模型改写 AI 算力成本账本
【导语在刚过去的 WWDC 上苹果 Siri 借 AI 重生端侧模型成为趋势。一家中国公司明日新程将 Andrei Karpathy 提出的方向落地其 4B 参数的新程 Alpha 模型在群体智能任务中打出千亿级大模型的效果引发行业关注。】Token 成本高企大模型商业遇阻当前Token 成本成为 AI 大规模落地最硬的一道门槛。亚马逊员工大量使用 AI 工具导致算力开销飙升管理层不得不关停内部 AI 排行榜。行业正在经历第一次「Token 大撤退」部分公司单日算力消耗已触及亿元量级。大模型能力越强、推理链越深单次调用成本越高GPU 成本营收比成为 AI 公司的命门指标。4B 参数新程 Alpha等效千亿级大模型明日新程将 Karpathy 提出的「认知核心」概念落地推出新程 Alpha 模型。该模型参数规模为 4B通过对开源推理模型进行强化学习训练将知识与认知解耦提升泛化和抽象思考能力。在群体智能任务中新程 Alpha 达到了与 GPT - 5.4 等千亿级大模型等效的输出质量且算力消耗和推理速度优势显著。明日新程团队整理了 1800 年至 2020 年跨越 220 年的人类学术论文梳理群体智能的演化脉络在此基础上对开源推理模型做强化学习。例如经过训练的模型能将围棋选手的决策模式迁移到日常生活场景。解锁三层场景空间改写成本账本新程 Alpha 解锁了三层递进的场景空间。第一层提升多智能体决策质量在 Harness 决策框架中认知模型输出效果优于推理模型带来多智能体协作系统决策链条整体质量的跃升。第二层大幅缩减算力成本4B 模型云端部署算力开销降低还支持端侧部署将算力成本转化为电力成本对具身智能领域意义重大。第三层解锁主动式场景新程 Alpha 支持 24 小时不间断运行成本可控让主动式智能体成为可能。团队实力与赛道卡位优势明显明日新程由微软小冰创始团队创立此前训练的开源模型 rinna 以 3.6B 参数登顶日本 Hugging Face 排行榜第一名击败 65B 参数的 Llama。新程 Alpha 延续了其「用小参数赢大参数」的技术基因。明日新程重仓布局 Harness 群体多智能体赛道该赛道获得头部资本确认OpenAI 投资 Isara 推动其估值达 6.5 亿美元。在该领域智能深度评测中明日新程综合表现显著高于单一大模型。编辑观点明日新程的端侧认知模型新程 Alpha 为 AI 行业带来了新的希望通过降低算力成本、提升决策质量和解锁新场景有望推动 AI 产品形态的变革群体多智能体赛道前景值得期待。