新闻动态

首页 > 新闻动态 > 阿里Qwen3-Coder、Qwen3升级版上线,超越Kimi-K2、DeepSeek-V3
2025-07-24

阿里Qwen3-Coder、Qwen3升级版上线,超越Kimi-K2、DeepSeek-V3

日前,阿里通义千问团队接连发布并开源 Qwen3-Coder、Qwen3 升级版 Qwen3-235B-A22B-Instruct-2507-FP8。


依托国产深算智能加速卡以及全国一体化算力网,超算互联网 AI 社区即刻上线 Qwen3-Coder-480B-A35B-Instruct和 Qwen3-235B-A22B-Instruct-2507。开发者、企业、研究机构均可在超算互联网快速下载模型文件进行部署、微调开发。


Qwen31.png

Qwen3-Coder、Qwen3-235B-A22B-Instruct-2507 模型上线超算互联网 AI 社区


  • 模型链接:

Qwen/Qwen3-Coder-480B-A35B-Instruct:https://www.scnet.cn/ui/aihub/models/sugon_scnet/Qwen3-Coder-480B-A35B-Instruct

Qwen/Qwen3-235B-A22B-Instruct-2507:https://www.scnet.cn/ui/aihub/models/sugon_scnet/Qwen3-235B-A22B-Instruct-2507


Qwen3-Coder 刷新 AI 编程 SOTA,支持 1M 上下文

Qwen3-Coder 是 Qwen3 系列中最具代理能力的代码模型。Qwen3-Coder 拥有多个尺寸,其中最强版本 Qwen3-Coder-480B-A35B-Instruct 是 450B 的 MoE 模型,激活参数为 35B,原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。


Qwen3-Coder-480B-A35B-Instruct 在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 上取得了开源模型的 SOTA 效果,可以与 Claude Sonnet4 相媲美。


与此同时,阿里还推出并开源了一款用于代理式编程的命令行工具:Qwen Code。Qwen Code 基于 Gemini Code 进行二次开发,团队进行了 prompt 和工具调用协议适配,使得 Qwen Code 可以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。另外,Qwen3-Coder 可以和优秀的编程工具结合,如 Claude Code、Cline 等。

 

Qwen3 升级版上线,超越 Kimi-K2、DeepSeek-V3

7 月 22 日,阿里更新了旗舰版 Qwen3 模型,推出 Qwen3-235B-A22B 非思考模式(Non-thinking)的更新版本:Qwen3-235B-A22B-Instruct-2507。


Qwen3-235B-A22B-Instruct-2507 通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在 GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超越 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型。


Qwen3-235B-A22B-Instruct-2507 在以下关键性能方面实现了增强:

  • 在多语言的长尾知识覆盖方面,模型取得显著进步。

  • 在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。

  • 长文本提升到 256K,上下文理解能力进一步增强。


目前,超算互联网 AI 社区已汇聚 270 余款国内外优质开源模型,全部适配国产异构算力。AI 社区《国产大模型应用生态图谱》覆盖 AI 模型、数据集、模型应用空间、异构加速卡镜像、API 接口服务等开源资源,为企业和开发者提供从模型预训练、调优到部署的全流程开发工具链,以及 AI 算力及生态支持的一站式服务。


点击文末“阅读原文”或复制下方链接,查看模型详情:

https://www.scnet.cn/ui/aihub/models?keyword=Qwen3&order=updateTime&desc=true

图谱.png