2026-01-16 08:55:17

谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑

摘要
谷歌于1月15日发布了一篇博文,宣布推出基于Gemma 3架构的TranslateGemma开放翻译模型系列。该系列包括4B、12B和27B三种不同参数规模的模

谷歌于1月15日发布了一篇博文,宣布推出基于Gemma 3架构的TranslateGemma开放翻译模型系列。该系列包括4B、12B和27B三种不同参数规模的模型,支持55种核心语言及多模态图像翻译。这些模型已在Kaggle和Hugging Face平台开放下载。

谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑

在性能测试方面,谷歌团队使用了WMT24++基准(涵盖高、中、低资源的55种语言)和MetricX指标进行评估。结果显示,TranslateGemma 12B版本的翻译质量优于参数量大其两倍的Gemma 3 27B基线模型。这意味着开发者只需一半的算力资源就能获得更高保真的翻译结果,从而提高吞吐量并降低延迟。即使是体量最小的4B模型也表现不俗,其性能与12B基线模型相当,非常适合移动端和边缘计算设备使用。

谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑

技术上,TranslateGemma采用了独特的“两阶段微调”方法。首先通过监督微调(SFT),利用Gemini生成的高质量合成数据与人工翻译数据混合训练Gemma 3底座;接着进入强化学习(RL)阶段,借助MetricX-QE和AutoMQM等先进奖励模型指导模型生成更加自然流畅的译文。

谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑

在语言覆盖上,TranslateGemma优化并验证了55种核心语言,如西班牙语、中文、印地语等,并计划进一步扩展到近500种语言的研究。这为学术界研究濒危语言提供了强有力的支持。得益于Gemma 3架构的优势,新模型保留了多模态能力,无需额外针对视觉任务进行调整,即可提升图像内文字的翻译效果。

谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑

为了满足不同开发需求,TranslateGemma提供了三种尺寸的模型:4B模型专为手机和边缘设备设计,实现高效推理;12B模型适合消费级笔记本电脑,提供接近研究级别的性能;而27B模型则面向追求极致翻译质量的应用场景,可在单张H100 GPU或云端TPU上运行。所有模型目前均可在Kaggle、Hugging Face及Vertex AI平台上获取。

谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑

谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑

谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑

谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑

科技趋势
时事资讯
回顶部