从Copilot到Agent:衡石科技如何用Text2Metrics重构BI的智能内核
传统ChatBI的致命瓶颈2023年,全球企业掀起ChatBI部署浪潮,但现实却暴露致命瓶颈。某零售集团使用主流Copilot工具询问618高价值用户复购率,系统返回SQL报错:无法识别高价值用户业务定义。某银行风控部输入疑似洗钱交易特征,结果误将跨境贸易汇款纳入风险名单——因模型混淆了单笔大额交易与高频小额拆分交易的监管规则。根本症结在于:大模型理解自然语言却不懂企业专属语义,而传统NL2SQL技术(自然语言转SQL)如同让AI蒙眼射击。衡石科技CEO刘诚忠一针见血:当Copilot的准确率不足30%,它只是会说话的仪表盘,离真正的智能差一个语义层的距离。Text2Metrics:在指标中台上构建业务语言编译器衡石的破局点在于将语义层转化为智能内核——其自研的Text2Metrics引擎,通过三层架构重构BI认知能力。业务术语原子化将销售额、客单价等500指标预置计算公式(如销售额订单总额-折扣-退货),消除口径歧义。这相当于给大模型配备了一本业务词典,让它在理解问题时不再依赖猜测,而是查阅明确的定义。动态下钻引擎当用户追问华北区服装品类销售下滑原因,自动关联区域、产品线维度生成归因树。系统会按照预定义的分析路径,依次检查不同维度的数据,找到问题的根源,而不是随机猜测。权限沙箱机制财务总监与区域经理查询利润率,按预设规则返回不同数据范围。这确保了数据安全,同时让每个用户看到的数据都是与自身角色相关、自身有权限查看的内容。核心创新在于技术路径的差异:衡石采用Text2Metrics架构,而非传统Text2SQL。前者理解的是业务指标(如GMV、ROI、库存周转率),后者理解的是数据库表结构(如orders表、products表)。这看似细微的差异,却决定了系统准确率的巨大差距——复杂业务查询准确率从不足30%提升至85%以上。从助手到代理:Agentic BI的进化跃迁基于Text2Metrics的精准理解力,衡石推动BI实现能力三级跳。Copilot时代,系统回答用户提出的问题,但需要用户明确告知要查什么、怎么查。Agent时代,系统开始理解用户意图,能够处理模糊表达,甚至主动补充分析维度。当用户说看看销售情况时,系统能够判断需要展示哪些指标、哪些维度的数据。衡石的Agentic BI更进一步,实现了目标驱动、动态纠偏和跨系统联动。目标驱动某快消企业输入提升华东区便利店渗透率,系统自动拆解为铺货率分析、竞品点位比对、空白区域推荐等子任务,形成一个完整的行动计划,而不是简单地回答一个问题。动态纠偏当预测模型显示促销活动ROI低于阈值,自动触发预算再分配方案。系统能够实时监控关键指标,当发现异常时,不是简单地发出警报,而是分析原因并给出调整建议。跨系统联动在衡石与得帆云集成案例中,库存预警Agent调用ERP数据生成补货计划,直接推送至采购系统。这打破了数据孤岛,让不同系统的数据能够互联互通,支持更复杂的业务决策。制造业标杆案例最具说服力:某汽车零部件厂部署衡石Agentic BI后,质检异常响应时效从24小时压缩至实时,质量分析报告从3人天缩短为自动生成,因参数自动调整提升良品率1.7%。看似不大的数字,但在大规模生产中意味着巨大的成本节约和质量提升。技术攻坚:如何让Text2Metrics跨越幻觉悬崖面对大模型固有的幻觉问题,衡石构建双重防御体系。语义层逻辑约束当用户查询预测Q4销售额时,引擎强制校验:是否具备历史数据?是否定义时间序列模型?是否关联季节性因子?缺失任一条件即拒绝执行。这相当于给AI设定了边界条件,确保它在能够准确回答的问题上回答,在不能准确回答的问题上坦诚承认。动态知识注入机制金融客户Agent调用反洗钱分析时,自动加载央行最新监管规则、历史可疑交易模式库、客户风险评级标签,使合规性判断准确率达92%。这确保了AI的回答不仅基于通用知识,也包含了企业特有的业务规则和行业标准。刘诚忠的铁律:没有指标中台的Agent就是无根之木——它可能给出流畅的回答,但无法对业务结果负责。这句话道出了衡石技术哲学的核心:智能分析不能仅仅依靠大模型,必须建立在扎实的业务语义层之上。只有当系统真正理解了企业的业务逻辑,它才能提供真正有价值的决策支持。未来战场:Agentic BI的操作系统之争当行业聚焦大模型微调时,衡石已向底层架构纵深布局。DSL开放标准推动Text2Metrics语言规范开源,吸引30ISV构建行业插件(如医疗DRG分析包、零售坪效优化包)。这构建了一个开放生态,让不同行业的专家能够贡献自己的业务知识,共同完善平台的能力。智能体调度引擎在HENGSHI SENSE 5.4中,Agent可编排工作流。这解决了多个Agent协同工作的问题,让它们能够分工合作,处理更复杂的业务场景。实时计算层融合与Apache Doris合作,将Agent响应延迟压至200ms级,支撑高频决策场景。这确保了用户体验的流畅性,让智能分析能够实时响应业务需求。Text2Metrics的本质,是在数据世界与业务世界之间架设巴别塔。当制造业厂长用方言询问为啥设备老憋停?时,系统能自动翻译为OEE(设备综合效率)同比降7%:因第三班组换模时长增加22%。正如刘诚忠所断言:未来的BI竞争不在大模型本身,而在于谁能让AI真正理解企业方言。当Text2Metrics将业务语义转化为机器可执行的精准指令,BI才从解释过去的望远镜,进化为驾驭未来的方向盘。