新闻动态

首页 > 新闻动态 > 超算互联网上线智谱GLM-4.5,推理、代码、智能体达开源SOTA
2025-08-01

超算互联网上线智谱GLM-4.5,推理、代码、智能体达开源SOTA


7 月 28 日,智谱发布并开源新一代旗舰模型 GLM-4.5,专为智能体应用打造的基础模型,模型权重遵循 MIT License。


GLM-4.5 模型系列现已上线超算互联网 AI 社区,包括 GLM-4.5 和 GLM-4.5-Air 的基础模型、混合推理模型以及混合推理模型的 FP8 版本。企业和开发者均可在 AI 社区快速下载模型文件进行部署、微调开发。


640 (1).png


GLM-4.5 模型系列上线超算互联网 AI 社区


  • 模型链接:

    https://www.scnet.cn/ui/aihub/models?order=popularity&keyword=GLM-4.5&desc=true


GLM-4.5 采用混合专家(MoE)架构,GLM-4.5 总参数量 3550 亿、激活参数 320 亿;GLM-4.5-Air 总参数 1060 亿、激活参数 120 亿。


GLM-4.5 和 GLM-4.5-Air 提供两种模式:用于复杂推理和工具使用的思考模式,以及用于即时响应的非思考模式。


综合性能 SOTA


GLM-4.5 首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。


为综合衡量模型的通用能力,智谱团队选择了最具有代表性的 12 个评测基准,包括 MMLU Pro、AIME 24、MATH 500、SciCode、GPQA 、HLE、LiveCodeBench、SWE-Bench Verified、Terminal-Bench、TAU-Bench、BFCL v3 和 BrowseComp。综合平均分,GLM-4.5 取得了全球模型第三、国产模型第一,开源模型第一。


640 (3).png


更高参数效率


GLM-4.5 参数量为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,但在多项标准基准测试中表现得更为出色,这得益于 GLM 模型的更高参数效率。在衡量模型代码能力的 SWE-bench Verified 榜单上,GLM-4.5 系列位于性能/参数比帕累托前沿,表明在相同规模下 GLM-4.5 系列实现了最佳性能。


640 (4).png


在性能优化之外,GLM-4.5 系列也在成本和效率上实现突破。


模型原生 Agent 场景


GLM-4.5 系列能胜任全栈开发任务,编写复杂应用、游戏、交互网页。这得益于模型原生具备的在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意的智能体应用等能力。


截至目前,超算互联网 AI 社区已汇聚 270 余款国内外优质开源模型,其中包括 10 余款智谱开源模型:GLM 模型系列、视频生成模型 CogVideoX 系列、端到端语音模型 GLM-4-Voice,以及多语言代码生成模型 CodeGeeX4 等,为企业和开发者提供模型文件下载与在线推理服务。


智谱开源模型链接合集:

https://www.scnet.cn/ui/aihub/models?order=popularity&keyword=GLM&desc=true