近日,月之暗面发布并开源大模型Kimi K2。《自然》杂志16日发文称,中国AI模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。
月之暗面新一代MoE架构基础模型Kimi K2现已上线超算互联网,包括未经过指令微调的基础预训练模型Kimi-K2-Base和通用指令微调版本Kimi-K2-Instruct(非思考模型)。前者适合科研与自定义场景,后者则可用于大多数问答与Agent任务。在“算力+模型”一体化交付模式下,开发者、企业可在超算互联网下载模型文件进行快速开发。
超算互联网AI社区上线Kimi K2系列模型
模型链接:
Kimi-K2-Base:未经过指令微调的基础预训练模型,适合科研与自定义场景
https://www.scnet.cn/ui/aihub/models/sugon_scnet/Kimi-K2-Base
Kimi-K2-Instruct:通用指令微调版本(非思考模型),在大多数问答与 Agent 任务中表现卓越
https://www.scnet.cn/ui/aihub/models/sugon_scnet/Kimi-K2-Instruct
Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数1T,激活参数32B。Kimi K2使用MuonClip优化器稳健支撑万亿参数模型训练,显著提升token利用效率。结合大规模Agentic Tool Use数据合成与通用强化学习,模型在通用智能能力上不断取得进展。
在SWE Bench Verified、Tau2、AceBench等基准性能测试中,Kimi K2均取得开源模型中的SOTA成绩,展现出在代码、Agent、数学推理任务上的领先能力。
模型性能提升:Kimi K2在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三大能力维度的基准性能测试中取得优秀表现。
代码能力提升:在前端开发任务中,Kimi K2擅长生成兼具设计感与视觉表现力的代码,支持粒子系统、可视化和3D场景等表现形式,具备较强的图形能力与交互性。
Agent工具调用能力提升:Kimi K2现已具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。kai'fa可以将其无接入 owl、Cline、RooCode等Agent/Coding框架,完成复杂任务或自动化编码。
风格化写作能力提升:在改写任务中,Kimi K2能准确控制输出风格,无论是用初中生语气改写科研文本,还是模仿苹果广告文案,都能同时保留原意与表达风格,体现较强的语境保持和表达迁移能力。
此外,Kimi K2在通用知识推理、数学、规划等任务中的表现亦有提升。
继国家超算互联网AI社区正式发布《国产大模型应用生态图谱》后,最新上线的Kimi K2系列模型,进一步丰富了图谱的内容生态。社区将持续完善国产大模型生态建设,确保用户能够第一时间体验、部署最前沿的AI应用。
相关新闻
-
2025-09-22
成员风采 | 全程直播,明日10点,中科天机“高分辨率气象数据共享计划”正式发布!
-
2025-09-19
超算&AI应用周报Vol.74 | 通义DeepResearch上线,模型、框架、方案全开源
-
2025-09-18
无网格不设限 国产CFD“上天入地” | 在超算互联网体验PSL流体仿真软件
-
2025-09-18
超算互联网x模数世界“超算启航 AI赋能”创新生态交流会在北京顺利举办
-
2025-09-17
论文解读Vol.12 | 清华团队发布催化剂领域基础模型SurFF,DFT级精度,十万倍计算加速