Back to Feed
总结
Google近日发布基于Gemma 3架构的开源翻译模型系列TranslateGemma,提供4B、12B、27B三种参数规模,覆盖55种语言。模型通过两阶段微调,将Gemini的翻译能力蒸馏到更轻量的Gemma系架构。技术评估显示,12B版本在WMT24++基准上超过Gemma 3 27B基线,4B版本性能接近原12B,同时提升推理效率与部署灵活性。该系列保留多模态能力,可进行图像内文本翻译,并已在多个平台开放下载,支持通过Vertex AI部署,为低资源语言研究与跨语言应用提供基础。
正文
Google 推出基于 Gemma 3 架构的开源翻译模型系列 TranslateGemma,有 4B、12B 和 27B 三种参数规模,支持 55 种语言。该模型通过两阶段微调将 Gemini 模型翻译能力蒸馏至轻量级架构。技术评估显示,12B 版本在 WMT24++ 基准上超越 Gemma 3 27B 基线,4B 版本媲美原 12B 性能,提升了推理效率与部署灵活性。模型适用于多环境,保留多模态能力,可处理图像内文本翻译。它已在多个平台开放下载,支持通过 Vertex AI 部署,为低资源语言研究与跨语言应用提供基础。
发布时间: