近日,月之暗面发布并开源大模型Kimi K2。《自然》杂志16日发文称,中国AI模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。
月之暗面新一代MoE架构基础模型Kimi K2现已上线超算互联网,包括未经过指令微调的基础预训练模型Kimi-K2-Base和通用指令微调版本Kimi-K2-Instruct(非思考模型)。前者适合科研与自定义场景,后者则可用于大多数问答与Agent任务。在“算力+模型”一体化交付模式下,开发者、企业可在超算互联网下载模型文件进行快速开发。
超算互联网AI社区上线Kimi K2系列模型
模型链接:
Kimi-K2-Base:未经过指令微调的基础预训练模型,适合科研与自定义场景
https://www.scnet.cn/ui/aihub/models/sugon_scnet/Kimi-K2-Base
Kimi-K2-Instruct:通用指令微调版本(非思考模型),在大多数问答与 Agent 任务中表现卓越
https://www.scnet.cn/ui/aihub/models/sugon_scnet/Kimi-K2-Instruct
Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数1T,激活参数32B。Kimi K2使用MuonClip优化器稳健支撑万亿参数模型训练,显著提升token利用效率。结合大规模Agentic Tool Use数据合成与通用强化学习,模型在通用智能能力上不断取得进展。
在SWE Bench Verified、Tau2、AceBench等基准性能测试中,Kimi K2均取得开源模型中的SOTA成绩,展现出在代码、Agent、数学推理任务上的领先能力。
模型性能提升:Kimi K2在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三大能力维度的基准性能测试中取得优秀表现。
代码能力提升:在前端开发任务中,Kimi K2擅长生成兼具设计感与视觉表现力的代码,支持粒子系统、可视化和3D场景等表现形式,具备较强的图形能力与交互性。
Agent工具调用能力提升:Kimi K2现已具备稳定的复杂指令解析能力,可将需求自动拆解为一系列格式规范、可直接执行的ToolCall结构。kai'fa可以将其无接入 owl、Cline、RooCode等Agent/Coding框架,完成复杂任务或自动化编码。
风格化写作能力提升:在改写任务中,Kimi K2能准确控制输出风格,无论是用初中生语气改写科研文本,还是模仿苹果广告文案,都能同时保留原意与表达风格,体现较强的语境保持和表达迁移能力。
此外,Kimi K2在通用知识推理、数学、规划等任务中的表现亦有提升。
继国家超算互联网AI社区正式发布《国产大模型应用生态图谱》后,最新上线的Kimi K2系列模型,进一步丰富了图谱的内容生态。社区将持续完善国产大模型生态建设,确保用户能够第一时间体验、部署最前沿的AI应用。
相关新闻
-
2025-07-24
阿里Qwen3-Coder、Qwen3升级版上线,超越Kimi-K2、DeepSeek-V3
-
2025-07-23
最佳实践Vol.49 | 以 LiCoO₂ 正极材料为例:快速分析脱锂结构凸包图并绘制理论电压曲线
-
2025-07-22
直播预告|AI智能体重构蛋白设计研发链路
-
2025-07-21
超算&AI应用周报Vol.65 |免费试玩"网页版Cursor",网页生成工具DeepSite上线
-
2025-07-18
软硬协同 性能突围 | 在超算互联网体验全新ABACUS LTS v3.10