智谱，凌晨上新-新黄河APP

　　“全球大模型第一股”智谱“未发先火”的新模型，终于露出庐山真面目。

　　6月17日凌晨，智谱在海外上线并开源GLM-5.2。在全球百万用户参与盲测的前端开发评估系统Code Arena上，GLM-5.2取得全球可用模型第一的表现。

　　需要补充的是，GLM-5.2踩中的时机颇为精准，让其早已积累了极高的关注度。

　　6月12日，美国AI公司Anthropic受紧急出口管制指令影响，暂停其Claude Fable 5、Mythos 5两款最新模型的开放。在这一背景下，6月13日，智谱宣布GLM-5.2全量开放，称“前沿智能不应只属于少数人，也不应被少数规则随时收回。它应该开放、可用、可构建，并服务于每一位开发者”。

　　简而言之，当闭源海外大模型的服务可得性与合规性遭到冲击时，智谱释出了一个供给可控、可本地化部署且能力相当的选项，即GLM-5.2。

　　本次正式对外发布的GLM-5.2，其Coding（编程）能力得到进一步强化，最大亮点在于1M上下文和长程任务能力（Long Horizon Task），让模型在跨越数周、数月乃至数年的规划与执行中“不健忘”，更贴合程序员群体的使用需求。

　　智谱技术团队介绍，过去一年，行业衡量模型智能的标准正在迁移：从“答得多好”转向“能独立工作多久”，AI正在从对话者（talker）变成执行者（doer）。

　　但把时间线继续往前推，让AI独立“干活”需要克服一个难点：上下文。一个持续工作数小时的智能体，要经历数千次工具调用、读写数万行代码、积累大量中间状态。上下文窗口不够长，模型就被迫不断压缩、丢弃、再回忆，每一次压缩都是信息损耗，每一次遗忘都可能让任务在第N步偏离第2步定下的约束。

　　智谱技术团队分析称，长程任务的失败，很多时候不是模型不够聪明，而是它“忘了”。这就是1M上下文对长程任务的意义：它是延长模型有效工作时长的基础设施。

　　因此，GLM-5.2主攻长程任务能力，让AI不再只做即时问答，而能像人一样连续工作数小时、自主跑完一个完整的大型工程。智谱称，在 FrontierSWE、Terminal-Bench等多个权威评测中，GLM-5.2与当前海外最强的 Claude Opus 4.8仅相差约1%–4%，是排名最高的开源模型。

　　Demo显示，用一句话描述需求，它就能自主完成开发、联调、测试到打包上线，几小时内交付一个网页、手机、小程序都能用的完整应用，而这过去往往需要一支团队干上数周。

　　算力基础设施上，智谱介绍，GLM-5.2的线上推理依托多个国产算力平台，已在Day 0完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光、壁仞等国产算力平台的推理适配，在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。

　　透过智谱本次发布可以窥见，模型厂商产品性能的提升，正在更直接地传导为资本市场的估值表现，两者关联性明显增强。

　　摩根大通在研报中指出，随着行业变现路径逐渐向API、编码、智能体和企业工作流收敛，模型能力领先性变得更为关键，定价权将更多取决于能力，而非产品覆盖广度或使用规模。

　　东方证券认为，由于国内模型性能领先、多数模型开源、API调用成本较低，使得中国模型在OpenRouter等Token分发平台上占据领先位置，国产模型的API调用量有望进一步提升，基于国产模型的算力与Token服务需求将维持较好的增速和景气度。

　　作者：孙小程

作者：上海证券报