谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑
最新 1 月 16 日消息,谷歌昨日(1 月 15 日)发布博文,基于 Gemma 3 架构,推出 TranslateGemma 开放翻译模型系列,共有 4B、12B 和 27B 三种参数规模,支持 55 种核心语言及多模态图像翻译,目前已在 Kaggle 和 Hugging Face 开放下载。
性能方面,谷歌团队利用 WMT24++ 基准(包含高、中、低资源语言的 55 种语言)和 MetricX 指标进行了严格测试。


结果显示,TranslateGemma 12B 版本的翻译质量超越了参数量大其两倍的 Gemma 3 27B 基线模型。这意味着开发者仅需消耗一半的算力资源,即可获得更高保真的翻译结果,从而大幅提升吞吐量并降低延迟。

同时,体量最小的 4B 模型也展现出惊人实力,其性能与 12B 基线模型相当,为移动端和边缘计算设备提供了强大的翻译能力。
技术方面,TranslateGemma 的高密度智能源于独特的“两阶段微调”工艺。
首先是监督微调(SFT),Google 利用 Gemini 模型生成的高质量合成数据与人工翻译数据混合,对 Gemma 3 底座进行训练;随后引入强化学习(RL)阶段,通过 MetricX-QE 和 AutoMQM 等先进奖励模型,引导模型生成更符合语境、更自然的译文。
在语言覆盖方面,TranslateGemma 重点优化并验证了 55 种核心语言(涵盖西班牙语、中文、印地语等),并进一步探索训练近 500 种语言,为学术界研究濒危语言提供了坚实基础。



此外,得益于 Gemma 3 的架构优势,新模型完整保留了多模态能力。测试表明,无需额外针对视觉任务进行微调,其在文本翻译上的提升直接增强了图像内文字的翻译效果。

为了适应不同的开发需求,TranslateGemma 的三种尺寸对应了精准的部署场景:
4B 模型专为手机和边缘设备优化,实现端侧高效推理;
12B 模型适配消费级笔记本电脑,让本地开发具备研究级性能;
27B 模型则面向追求极致质量的场景,可运行于单张 H100 GPU 或云端 TPU 上。
所有模型目前均已在 Kaggle、Hugging Face 及 Vertex AI 上线。

最新附上参考地址
谷歌 TranslateGemma 技术报告
在 Kaggle 上下载
在 Hugging Face 下载
通过 Gemma Cookbook 探索
在 Vertex AI 中部署
《谷歌最强 AI 开放翻译模型:TranslateGemma 登场,手机也能跑》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
中国科学家证实87年前量子力学预言 首次直接观测到米格达尔效应
快科技1月15日消息,据央视新闻报道,日前,中国科学院大学科研团队与多所高校联合,首次直接观测到量子力学预言的米格达尔(Migdal)效应。这一发现为轻暗物质探测突破阈值瓶颈提供了关键支撑... -
50多年后人类首次重返月球!美国下月拟实施载人绕月飞行任务
快科技1月15日消息,50多年后人类有望重返月球(自1972年12月阿波罗17号任务以来),而美国已经表态了。据美国媒体报道称,NASA日前表示,计划不早于2月6日实施“阿耳忒弥斯2号”载... -
总做美甲的人后来怎么样了
美甲已经成为了女性日常生活中不可或缺的一部分。一副美观、精致的美甲不仅能够取悦自己、增强自信心,更是一种展示个人风格和个性的方式。然而,美甲行业繁荣的背后也有着一些问题,给人们的健... -
复刻《三体》飞刃 地表超强材料量产:1米长能拉400斤重物不断
1月15日消息,据国内媒体报道称,中国科学院山西煤化所磨剑数十年,与有关单位联合打造出国产T1000级高性能碳纤维。据悉,这是现实中,应用性能最接近《三体》里能将钢铁巨轮轻松切割的&ldquo... -
已开始试飞!国产C919欧洲适航认证最新进展:将与波音、空客全球竞争
快科技1月15日消息,据最新报道,欧洲航空安全局(EASA)试飞员已开始在上海对中国自主研发的C919客机进行试飞。知情人士透露,两名来自EASA的试飞员已进行了验证飞行。与此同时,一些在华工作...

















