2G内存跑Gemma 3n完整版！全球首个10B内模型杀疯LMArena：1300分碾压记录-沐石林科技

谷歌正式发布Gemina 3n完整版，标志着其开源大模型系列在端侧部署能力上的重大突破。该模型可直接在本地设备上运行，最低仅需2GB内存，支持图像、音频、视频与文本的多模态输入及文本输出，具备强大的实用性与灵活性。其核心亮点在于采用全新的MatFormer架构，实现“套娃式”嵌套设计，使一个大模型内含可独立运行的小模型，支持在不同资源环境下动态切换性能与效率。同时，通过引入逐层嵌入（PLE）机制，将大部分参数迁移至CPU处理，大幅降低对加速器内存的依赖；结合键值缓存共享技术，显著提升长序列推理速度，尤其适用于流式响应场景。全新推出的MobileNet-V5-300M视觉编码器和基于通用语音模型（USM）的音频处理能力，进一步强化了其在边缘设备上的多模态表现，为实时语音识别与翻译提供坚实支撑。开发者反馈普遍积极，多位技术专家在MacBook、VPS等多样化硬件上验证了模型的实际表现。无论是通过Ollama、MLX还是Hugging Face等平台运行，均展现出良好的兼容性与高效推理能力。尤其在微调与部署过程中，E4B模型以较低显存占用完成训练，且性能超越多个同级别模型，成为当前开源视觉语言模型中的佼佼者。尽管部分用户仍对小型模型的实用边界持保留态度，但其作为离线参考工具、飞行途中编程辅助等场景的价值已得到广泛认可。谷歌还配套推出MatFormer Lab等开发工具，助力开发者快速构建定制化模型。整体来看，Gemma 3n不仅在技术架构上实现创新突破，更以开放生态与跨平台适配能力，推动大模型向更广泛的应用场景下沉，真正实现了“开箱即用、按需定制”的理想愿景。

博客 - 正文

2G内存跑Gemma 3n完整版！全球首个10B内模型杀疯LMArena：1300分碾压记录

文章分类

产品分类

数据驱动未来

开发者

关于我们

法律法规

快速入口

博 客 - 正文