新闻动态

首页 > 新闻动态 > 今日上新 | 微软新版Phi-4、阿里HumanOmniV2、谷歌T5Gemma......
2025-07-18

今日上新 | 微软新版Phi-4、阿里HumanOmniV2、谷歌T5Gemma......

SCNet今日上新 

  • Phi-4-mini-flash-reasoning

  • HumanOmniV2

  • T5Gemma系列

  • SmolLM3-3B

  • Kontext Bench数据集

🤖微软新版Phi-4上线,推理效率提升10倍
微软1.png
今日,微软Phi-4家族的最新版本Phi-4-mini-flash-reasoning上线超算互联网,支持模型文件下载快捷开发。

Phi-4-mini-flash-reasoning是一个基于合成数据构建的轻量级开放模型,专注于高质量、密集推理数据,并进一步微调以增强其高级数学推理能力,支持64K token上下文长度。

Phi-4-mini-flash-reasoning延续了Phi-4家族参数小性能强的特点,专为在内存/计算受限环境和延迟受限场景下的多步骤、逻辑密集型数学问题解决任务设计,单个GPU可运行,适合笔记本、平板电脑等边缘设备。

与前一个版本相比,Phi-4-mini-flash-reasoning使用了微软自研的创新架构SambaY,推理效率提升10倍,延迟降低2-3倍,整体推理性能实现了大幅度提升。尤其是高级数学推理能力,非常适合教育、科研领域。

🔍一键直达:
https://www.scnet.cn/ui/aihub/models/icszy_zs_ai/Phi-4-mini-flash-reasoning

🤖阿里多模态推理模型HumanOmniV2上线,精准捕捉视频隐藏信息
微软2.png
今日,超算互联网上线阿里通义实验室开源的多模态推理模型HumanOmniV2。一个专为突破多模态推理瓶颈而设计的全新模型。

超算互联网上线HumanOmniV2模型文件,助力开发者高效开发AI应用。

其创新性和优势包括:

  • 创新性的推理范式: 提出模型在推理之前应先对多模态输入进行上下文总结,旨在解决跳过关键多模态信息和上下文理解不足的问题。同时,通过上下文奖励和逻辑奖励激励模型准确总结上下文并促进复杂推理。
  • 高质量数据集与评测基准:提供了一个包含多模态输入总结和推理路径的全模态推理训练数据集,适用于冷启动训练和强化学习阶段。此外,还精心策划了一个以人为中心的全模态评估基准IntentBench,它要求模型同时理解视频和音频、全局上下文、复杂的社会关系以及细致的观察。
  • 领先的模型性能: HumanOmniV2在包括全新IntentBench、Daily-Omni和WorldSense在内的多个全模态基准测试中,相比现有开源全模态方法取得了最佳性能。

🔍一键直达:
https://www.scnet.cn/ui/aihub/models/icszy_zs_ai/HumanOmniV2

🤖谷歌T5Gemma上线,编码器-解码器架构,性能与Gemma相当

微软3.png

今日,超算互联网上线谷歌发布的编码器-解码器架构的Gemma系列模型:T5Gemma。支持用户下载模型文件进行快速开发。

T5Gemma使用了一种名为「适应(adaptation)」的技术来将已经完成预训练的仅解码器模型转换为编码器 - 解码器架构。

在谷歌的实验中,T5Gemma模型的性能与仅解码器的Gemma模型相当,甚至更胜一筹,在多个基准测试(例如用于衡量所学习到的表征质量的SuperGLUE)中,T5Gemma几乎主导了质量-推理效率的帕累托边界。

这种性能优势并非仅限于理论层面,它也能转化为实际的质量和速度。在测量在GSM8K(数学推理任务)上的实际延迟时,T5Gemma取得了显著优势。

🔍一键直达:
https://www.scnet.cn/ui/aihub/models?order=popularity&keyword=google+t5gemma&desc=true

🤖Hugging Face小模型SmolLM3上线,128K超长上下文

微软4.png
今日,超算互联网上线Hugging Face的小参数模型SmolLM3。支持模型文件下载快捷开发。

SmolLM3是一个专为突破多模态推理瓶颈而设计的全新模型。SmolLM3只有30亿参数,性能却大幅度超过了Llama-3.2-3B 、Qwen2.5-3B等同类开源模型。

其关键特性包括:

  • 双推理模式:支持深度思考和非思考双推理模式,用户可以灵活切换。
  • 完全开源模型:开源权重 + 完整的训练细节,包括公共数据混合和训练配置。
  • 长上下文:最长可达128K。
  • 多语言支持:支持英语、法语、西班牙语、德语、意大利语、葡萄牙语。

🔍一键直达:
https://www.scnet.cn/ui/aihub/models/openaimodels/SmolLM3-3B

💡图像编辑模型基准测试数据集Kontext Bench上线超算互联网

微软5.png
Kontext Bench是一个用于图像编辑模型的基准测试,由源图像、图像编辑指令和类别标签组成。超算互联网已上线Kontext Bench数据集,支持快速下载。

该基准测试包含从108个不同来源的1026个独特的图像-提示对。它涵盖了五个核心任务:局部指令编辑、全局指令编辑、文本编辑、风格参考和角色参考。该基准测试的规模在可靠的人类评估和全面覆盖实际应用之间提供了良好的平衡。

🔍一键直达:
https://www.scnet.cn/ui/aihub/datasets/chenhao/kontext-bench

更多热门模型,尽在SCNet:
https://www.scnet.cn/ui/aihub/models