今日凌晨,阿里云正式开源Qwen3系列模型。超算互联网火速上线Qwen3全家桶,包含六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B;以及两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参数),Qwen3-30B-A3B(300亿总参数、30亿激活参数)。Qwen3系列模型采用宽松的Apache2.0 协议开源,开发者、企业可在超算互联网下载模型文件进行快速开发。超算互联网AI社区支持Qwen3模型快速开发-免费试用除提供Qwen3多版本模型下载外,依托超算互联网平台的超智融合算力、安全可信的环境,以及国产深算智能加速卡的良好生态,为了提供更好的体验,平台即将上线Qwen3系列模型镜像、应用空间快速体验服务,无需安装依赖,让用户0代码体验Qwen3系统模型对话服务,实现云端开箱即用。
- 无缝切换“思考模式、“非思考模式”:选择“思考模式”,模型会逐步推理,适合需要深入思考的复杂问题;选择“非思考模式”,模型提供快速、近乎即时的响应,适用于那些对速度要求高于深度的简单问题。
- 支持119种语言和方言:具备多语言理解、推理、指令跟随和生成能力。
- 支持MCP(模型上下文协议),Agent能力提升:可以在思考和非思考模式下实现大语言模型与外部数据源和工具的集成,并完成复杂任务;
- 推理性能大幅提升:旗舰模型Qwen3-235B-A22B在编码、数学、通用能力等基准评测中表现出竞争力,能够与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等模型媲美。此外,小型MoE模型Qwen3-30B-A3B以激活参数数量的10倍优势超越了QwQ-32B,Qwen3-4B小型模型也能匹敌Qwen2.5-72B-Instruct的性能。
作为国家级算力服务平台,截至今年4月超算互联网用户数已超35万,API调用规模日均超百万次,并上架算力商品超7000款,其中AI模型近240款。基于国产深算智能加速卡的良好生态,平台第一时间上线DeepSeek-R1、QwQ-32B、GLM等国产开源模型并构建集在线推理、模型开发、私有化部署等功能于一体的MaaS服务。https://www.scnet.cn/ui/aihub/models?order=popularity&keyword=Qwen3&desc=true