腾讯混元2.0正式发布:推理能力/效率业界领先
快科技12月6日消息,腾讯自研大模型混元2.0(Tencent HY 2.0)正式发布,同时DeepSeek V3.2也在腾讯生态内逐步接入。
目前,这两大模型已率先在元宝、ima等腾讯AI原生应用中上线,腾讯云也已开放相关模型的API及平台服务。
全新发布的Tencent HY 2.0,采用了混合专家(MoE)架构,具备高达406B总参数量(激活参数32B),模型支持256K超长上下文窗口,推理能力和效率处于业界领先地位。

相比上一版本(Hunyuan-T1-20250822)模型,HY 2.0 Think显著改进了预训练数据和强化学习策略,在数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队,泛化性大幅提升。
数学科学知识推理:使用高质量数据进行Large Rollout强化学习,使得HY 2.0 Think推理能力大幅增强,在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛MIT数学竞赛(HMMT2025)等权威测试中取得一流成绩。结合预训练数据的进步,模型在极度考验知识水平的Humanity’s Last Exam(HLE)和泛化性的ARC AGI等任务上也大幅进步。

指令遵循与长文多轮能力:通过重要性采样修正缓解了训练和推理不一致问题,实现了长窗口RL的高效稳定训练。同时通过多样化可验证的任务沙盒,以及基于打分准则的强化学习,显著提升了HY 2.0 Think在Multi Challenge等指令遵循和多轮任务的效果。
代码与智能体能力:构建了规模化的可验证环境及高质量合成数据,极大增强了模型在Agentic Coding及复杂工具调用场景下的落地能力,在SWE-bench Verified及Tau2-Bench等面向真实应用场景的智能体任务上实现了跃升。

基于RLVR+RLHF双阶段的强化学习策略,HY 2.0的输出“质感”显著进步,在文本创作、前端开发、指令遵循等实用场景上展现了差异化优势。
在文学创作上,HY 2.0有效减少了“AI味”,可以敏锐捕捉指令中的潜在的情感需求,输出观点深刻、逻辑严密的文章。
Tencent HY 2.0模型具备扎实的代码能力和一定的“视觉审美”,在生成Web小游戏时,不仅能跑通复杂的JS逻辑,还能输出审美在线的CSS布局与动画效果。

《腾讯混元2.0正式发布:推理能力/效率业界领先》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
鸿蒙公开课·总裁校园行对话南大学子:一场技术与思想的“破界”之旅!
2025年12月3日,鸿蒙公开课·总裁校园行活动在南京大学顺利举办。华为终端BG音频与智能配件产品线总裁刘东方,在仙林校区图书馆报告厅开展了以“创新引领未来·共建鸿蒙世界&r... -
碰一碰分享、笔记画中画、排队实况窗 鸿蒙版大众点评独家功能超好用
近日,鸿蒙版大众点评上线全新版本,新增支持碰一碰分享、笔记画中画、排队实况窗等一系列鸿蒙独有功能,并进一步完善了外卖、笔记、分享等模块。作为鸿蒙生态在本地生活服务领域的标杆应用,大... -
权威认证 正本清源——广东好太太商标维权胜诉 彰显品牌力量
广东好太太科技集团近日在系列商标侵权案件中取得重大胜利,法院判决明确保护“好太太”品牌商标专用权,为家居行业知识产权保护树立了标杆。作为晾衣架行业领导品牌,广东好太太凭借... -
新手Vlog神器首选!佳能PowerShot V1深度解析
随着视频vlog创作日益普及,如何选择第一台入门相机成为许多新手创作者的共同难题。一台理想的入门Vlog相机应具备操作简易、画质出色、防抖可靠、价格适中等特点。以6000元内的价格、高性价比在... -
女子与男友争吵后烧毁对方汽车:被判放火罪 获刑三年
快科技12月5日消息,近日,人民法院报发布了一则典型案例。据悉,2025年6月,何某某与男友发生激烈争吵后情绪失控。随后,她用打火机点燃毛巾后将其丢在男友轿车的主驾驶位置,轿车随即起火...

















