跳到正文
Back to Feed

总结

Google在官方博客宣布推出TranslateGemma,一组基于Gemma 3的开放权重翻译模型,提供4B、12B、27B三种参数规模,主打可在不同设备部署的多语言翻译能力,覆盖55种语言。Google称其由Gemini体系蒸馏而来,并采用两阶段训练:先用人工翻译与Gemini生成的高质量合成平行语料进行监督微调,再通过包含MetricX-QE、AutoMQM等在内的奖励模型集成开展强化学习,以提升译文质量与自然度。该系列还强调保留Gemma 3多模态特性,文本翻译提升可带动Vistra图像翻译基准上的图片内文字翻译表现,相关资源已在Hugging Face与arXiv公开。

正文

Google 发布基于 Gemma 3 的开源翻译模型TranslateGemma Google 在官方博客宣布推出 TranslateGemma:一组基于 Gemma 3 的开放权重翻译模型,提供 4B、12B、27B 三种参数规模,主打"在不同设备上可部署"的多语言翻译能力,覆盖 55 种语言。Google 描述其为从 Gemini 体系"蒸馏"而来,并采用两阶段微调:先做监督微调(混合人工翻译与由 Gemini 生成的高质量合成平行语料),再进入强化学习阶段,使用包含 MetricX-QE、AutoMQM 等在内的奖励模型集成来优化译文质量与自然度。 TranslateGemma 同时强调保留了 Gemma 3 的多模态能力:在 Vistra 图像翻译基准上,文本翻译能力的提升也会带动"图片内文字翻译"的表现(即使没有专门做多模态微调)。 Google huggingface arXiv
发布时间: