(文/陈济深 编辑/张广凯)
"模型的定价权是由我们的技术实力以及长期趋势所带来的领先地位决定的。"3月31日晚,智谱CEO张鹏对观察者网回应了智谱近期模型连续涨价的考量。
几个小时前,这家上市不到三个月的大模型第一股交出了上市后的首份成绩单。
智谱2025年全年收入7.243亿元,同比增长131.9%;经调整净亏损31.82亿元;研发开支31.80亿元,同比增长44.9%。
但市场更关注的是另一组数字——智谱MaaS平台ARR约17亿元人民币(约2.5亿美元),过去12个月提升60倍。2026年一季度,智谱API调用定价提升了83%,市场依然供不应求,调用量增长400%。
4月1日,智谱股价暴涨32%,盘中触及938港元创历史新高,市值突破4000亿港元。1月8日上市至今股价已涨超六倍。不仅远超华尔街投行摩根大通给出的400港元目标价,更是一天之内击穿了所有卖方预期的上限。
市场既狂热又现实。当前对智谱的定价,已经不只是"大模型第一股"的稀缺性溢价——而是开始为MaaS商业模式的确定性定价。
作为中国收入规模最大的大模型公司,张鹏在业绩会上毫不讳言地将智谱定位为"中国的Anthropic",并直接将2026年的战略总结为一个词:Token量。
收入增速持续翻倍
智谱2025年7.243亿元的全年收入,较2024年的3.124亿元增长131.9%,延续了连续三年翻倍的态势。其中2025年下半年收入约5.33亿元,远超上半年的1.91亿元,体现出明显的下半年加速特征。
作为上市以来的首份财报,智谱补齐了上市招股书中缺失的MaaS商业化进展。在招股书截止的2025年上半年数据中,本地化部署仍占收入的绝对大头,云端部署业务的毛利率甚至是-0.4%。市场对智谱的认知,也一度停留在"政企定制化项目为主的AI公司"。
而本次年报完整展示了智谱MaaS化发力的最新进展:开放平台及API业务收入同比增长293%至1.90亿元,企业级智能体业务增长249%至1.66亿元,云端收入占比从15.5%提升至26.3%。传统本地化部署仍占总收入50.4%,但增速(70.5%)和毛利率(从69.6%降至47.0%)均在回落。
更值得关注的是客户结构的变化。财报披露,2025年全年无单一客户贡献超过总收入10%,而2024年有一家客户贡献了约5947万元,占比约19%。客户集中度的显著下降,意味着收入基础正在变得更分散、更健康。截至2026年3月,平台注册用户已突破400万,覆盖全球218个国家和地区。
张鹏对观察者网表示,这一趋势是结构性的、长期的——API的本质是将AI基础设施能力转化为经济运行的资源,而非一次性红利。
涨价的逻辑变了
2024年下半年至2025年初,中国大模型市场深陷价格战——字节豆包报价低至0.0008元/千tokens,智谱自己也曾将GLM-4-Plus降价90%。
2026年初,智谱率先打破了这个叙事——成为国产头部模型厂商中首个在推出新模型的同时执行实质性提价的公司。
2月12日发布GLM-5时上调Coding Plan套餐价格30%起,3月16日发布GLM-5-Turbo时再涨20%,相对GLM-4.7累计涨幅达83%。每次涨价都伴随新模型发布,意味着智谱不是被动应对成本压力,而是基于模型能力的代际跃迁和潜在旺盛需求主动重新定价。
这和同期云厂商的涨价逻辑并不一致。腾讯云等云厂商在3月对Token和Coding Plan集体涨价,幅度约在4倍以上,主要受OpenClaw(龙虾)引发的算力缺口驱动,是供应链的成本压力传导。
张鹏并不回避算力供给瓶颈在其中扮演的角色。他表示,市场上提供API服务的厂商众多,客户愿意接受涨价本身就说明模型能力领先。"长期价格的本质是由价值决定的。"在他看来,能有效替代人力、提升转化效率的智能资源天然稀缺。
在MaaS平台之上,Coding Plan是智谱增长最快的单品。财报披露付费开发者规模已突破24.2万,管理层用"量价齐升"来描述这一业务。
OpenClaw带来的Agent爆发,正在为云端收入注入新的加速度。2026年3月推出的Claw Plan上线仅两天订阅用户即破10万,上线20天突破40万。Agent场景的单次任务token消耗量远超普通对话,且使用频次更稳定。
这些数据虽然主要反映在2026年Q1而非2025年财报中,但它们直接影响市场对2026年收入增速的预期。如果Claw Plan的40万订阅用户能够产生持续的token消耗,叠加API累计涨价83%的价格效应,云端收入在2026年有可能实现爆发式增长。
涨价权的底层支撑,是GLM系列模型在全球评测中的位置。GLM-5在Artificial Analysis Intelligence Index榜单达到50分,是开放权重模型首次达到这一高分,在全球所有模型中仅次于GPT、Claude和Gemini。张鹏在业绩会上表示,智谱已稳定进入全球AI第一梯队,与OpenAI、Anthropic、Google同台竞技。
但在2026年的智能体时代,单纯的模型评测分数已不足以说明一切。从LangChain创始人Harrison Chase提出的Agent Harness概念,到腾讯汤道生所说的"AI落地不只是一道算法题,更是一道工程题",行业共识正在形成——智能体不是难点,驾驭系统才是新的课题。
张鹏在业绩会上描述了同样的路径——从Vibe Coding到Agentic Engineering再到Long-horizon Task。智谱的Slime异步强化学习框架、GLM-5-Turbo作为全球首个OpenClaw基座模型,本质上都是在构建让模型稳定执行长程任务的Harness工程能力。
Token经济学与智谱的TAC
在智谱发财报的两周前,黄仁勋在GTC 2026上系统阐述了Token经济学——Token就是新的基础货币。他甚至预计,未来每位工程师都需要一个年度Token预算,基础年薪之上再拿出约一半金额作为Token额度。
张鹏提到一个类似的细节:已有企业将Token额度作为员工薪酬的一部分发放,Token正在从计量单位变成具有经济价值的生产资料。
如果说黄仁勋从硬件供给侧出发,定义了"什么是有价值的推理",构建Token工厂。张鹏则从模型需求侧出发,提出TAC(Token Architecture Capability,Token架构力)= 智能调用量 × 智能质量 × 经济转化效率,定义了"什么是有价值的Token消费"。
张鹏对观察者网强调,TAC不是纯粹的概念,而是正在发生的事情——未来衡量个体或组织价值的标准,将从"掌握多少信息"转向"在给定Token预算下构建并驱动复杂Agent系统的能力"。
这是一个野心极大的判断。OpenRouter平台数据显示:OpenClaw的Token消耗量从2026年2月3日的806亿,在一个月内飙升至3月4日的3580亿,翻了约4.4倍。根据Anthropic的数据,AI Agent的Token消耗量高可达普通聊天交互的15倍。Token正在从对话窗口里的计量单位,变成真实的经济生产要素。
智谱走到了Anthropic的哪一步?
对于智谱的商业模式,张鹏在业绩会上直接拿Anthropic做对标:"当模型足够强,API本身就是最好的商业模式。"
两家公司商业模式确实高度一致——都以基座模型为核心壁垒,以API为主要产品形态,以开发者和企业的深度使用为增长引擎。智谱过去12个月ARR增长60倍,倍数上甚至高于Anthropic同期。但绝对体量差距依然巨大:智谱MaaS平台ARR约2.5亿美元,Anthropic约190亿美元,相差约76倍。
不过生态层面的飞轮已经在转动。中国前十大互联网公司中9家深度调用GLM模型,GLM-5发布后24小时内即获字节跳动TRAE、阿里巴巴Qoder、腾讯CodeBuddy、美团CatPaw、快手万擎、百度智能云及WPS Office等头部产品官方接入。GLM模型已全面部署于Google Vertex AI、AWS Bedrock等全球顶尖云服务商,是OpenRouter付费模型排名第一。Anthropic的飞轮靠Claude被全球开发者高频使用转起来,智谱正在走同一条路。
一个绕不开的问题是:智谱坚持开源,开源之后企业可以自己部署,这不是在拆自己的台?
张鹏的回答很直接:"模型迭代周期只有3-4个月,自建往往跟不上;而在推理优化和资源调度方面,原生模型厂商具备先天优势。很多原来尝试私有化部署的客户都已转向云端API。"
逻辑和定价权的逻辑一脉相承:当模型迭代足够快、推理优化足够深,开源反而成了获客入口而非收入替代。先用开源建品牌和生态,再用闭源API的极致优化赚钱。
亏损、烧钱与弹药
2025年,智谱经调整净亏损31.82亿元,报告净亏损47.18亿元,同比扩大59.5%。两者之间的差额主要来自非经营性项目:股份支付费用5.58亿元、向投资者发行金融工具的账面价值变动9.37亿元、上市开支4057万元。其中,金融工具已在2026年1月上市后全部转换为股权,这一项亏损将在未来财报中消失。
研发投入31.80亿元,同比增长45%——是全年收入的4.4倍。截至2025年末,智谱拥有1094名正式员工,产生总薪酬成本(含股份支付)13.63亿元。研发费用增长的另一大驱动力是算力采购方式的转变——2025年资本支出仅7470万元,较2024年的4.623亿元骤降83.8%。智谱正在把算力投入从"买卡"转向"租卡",以第三方服务采购替代自建集群,这部分成本从资产负债表搬进了利润表,直接推高了销售成本,也是整体毛利率从56.3%降至41.0%的原因之一。
但MaaS平台自身的毛利率讲的是另一个故事——云端部署毛利从2024年的160万元增至3600万元,增幅2150%,毛利率从3.3%升至18.9%。企业级智能体是三条业务线中唯一毛利率上升的板块(49.3%→52.3%),为Claw Plan的商业前景提供了利润端的佐证。方向比绝对值更重要。
弹药方面,截至2025年末公司持有现金及现金等价物22.59亿元,加上2026年1月IPO募集约45.16亿元以及尚未动用的银行融资52.36亿元,短期流动性压力不大。但借贷总额从1.37亿元增至6.895亿元,净增5.52亿元。
AI时代已经到来
智谱财报不只是一家公司的故事。中银证券数据显示,2026年3月中国日均Token调用量已突破140万亿,两年增长超千倍。国盛证券表示,Agent渗透率和复杂度提升驱动Token消耗激增,催生刚性算力需求。黄仁勋在摩根士丹利TMT大会上的论断是:"算力等于收入,算力等于GDP。"
张鹏在业绩会上说,"2026年我们的关键词叫做'Token量'",面对供不应求的市场,公司将继续加大投入国产芯片软硬一体化调优。
2025年上半年,智谱还是本地化部署占收入85%、云端API业务赔钱的公司。从ARR做到17亿元、毛利率转正、API涨价83%后依然供不应求,到中国前十大互联网公司中9家深度调用GLM模型、拥有数百万客户群体——AI to B已经被切实证明是一个可行的赛道。
但随着智能体时代大厂纷纷入局,智谱是否会面临挤压?
张鹏对观察者网表示,大厂自研是必然,但受限于资源分配,不可能在所有场景都具备足够竞争力;大厂本身也是复杂生态,也会接入外部技术供应商。在他看来,技术快速迭代的阶段,独立大模型厂商反而具备先天优势。
这条路的远方对标物很清楚。ARR从招股书时期的几千万到如今的17亿,增速斜率陡峭。但Anthropic的ARR是智谱的76倍,而且Anthropic自身也预计到2028年才能实现正向现金流。
张鹏在业绩会最后说:"通往AGI的征途漫长,我们将继续脚踏实地,用极致的基座能力探寻未知的边界。"
至于4000亿港元市值是否合理、TAC究竟是愿景还是现实、"中国Anthropic"的路能走多远——这份财报给出了第一个数据锚点。答案还在路上。